Abstract:
Asuransi sangat dibutuhkan belakangan ini karena masih maraknya kemungkinan risiko yang di luar dugaan kita sebagai manusia. Namun, masih ada beberapa orang yang melakukan klaim asuransi atas kejadian yang telah diatur sedemikian rupa sesuai dengan kontrak polis asuransi, yang padahal tidak terjadi demikian. Maka dari itu, perusahaan asuransi harus berhatihati untuk menjaga dari penipuan atau fraud klaim asuransi. Machine learning adalah alat yang menggunakan data dan melatih dirinya untuk mendapatkan hasil yang diinginkan dengan membagi data menjadi dua bagian yaitu, data latih dan data uji. Decision tree adalah algoritma yang berbentuk sebuah pohon yang pembangunan modelnya ditentukan oleh nilai information gain. Gradient boosting adalah algoritma dengan tujuan utama untuk mencari fungsi aproksimasi yang memetakan hasil sehingga nilai dari kesalahan perhitungan menjadi minimum. Gradient tree boosting merupakan salah satu bentuk dari gradient boosting yang menggunakan pohon dan dihitung bobot setiap terminal node. XGBoost adalah salah satu algoritma gradient tree boosting yang paling banyak digunakan dalam berbagai penelitian dan menggunakan perhitungan gain of variance pada pembentukan pohonnya. Skripsi akan menggunakan algoritma LightGBM yang serupa dengan XGBoost tetapi berbeda pada perhitungan gain of variancenya. Evaluasi model menggunakan 5-fold cross validation dengan memerhatikan ukuran seperti Confusion matrix, Area Under Curve (AUC), Accuracy, Precision, Recall, dan F1-score untuk membandingkan performa antara LightGBM dan XGBoost. Ditemukan bahwa model LightGBM secara umum dapat mengklasifikasi fraud klaim asuransi dengan lebih baik dibandingkan model XGBoost.