Abstract:
Keberhasilan studi dari seorang mahasiswa menjadi alat ukur untuk mengetahui kemampuan
mahasiswa dalam menguasai materi kuliah. Faktor awal yang bisa menjadi pengukur kemampuan
akademik dan minat adalah jalur masuk, seperti USM 1, USM 2, USM 3, PMDK, dan Seleksi
Khusus. Seringkali mahasiswa dengan jalur masuk tertentu memiliki nilai IPK dan lama studi
yang berbeda, contohnya yaitu jalur masuk PMDK memiliki nilai IPK yang lebih tinggi daripada
USM 1. Berdasarkan masalah tersebut dapat diasumsikan bahwa IPK atau lama studi memiliki
hubungan dengan jalur masuk.
Untuk membuktikan asumsi tersebut, penelitian ini melakukan analisis deskriptif untuk
menganalisis hubungan antara IPK, lama studi, dan jalur masuk UNPAR, menganalisis faktor
yang berpengaruh terhadap nilai IPK, lama studi, dan jalur masuk, serta melakukan analisis
prediktif untuk melakukan prediksi IPK dan prediksi lama studi.
Sebelum melakukan analisis, langkah yang dilakukan pertama adalah melakukan analisis
penyelesaian masalah. Terdapat dua teknik yang digunakan untuk melakukan analisis, yaitu
teknik statistika dan teknik data mining. Teknik statistika menggunakan metode korelasi seperti
Pearson dan Chi-Square bertujuan untuk menganalisis hubungan antara IPK atau lama studi
dengan jalur masuk. Korelasi Pearson merupakan teknik untuk mengukur korelasi antara dua
atribut numerik, korelasi Chi-Square merupakan teknik untuk mengukur korelasi antara dua
atribut kategorikal. Teknik data mining menggunakan algoritma Clustering dan Klasifikasi.
Kemudian eksplorasi library pada Python dilakukan untuk mempelajari library yang dapat
digunakan pada saat melakukan analisis.
Hasil analisis yang diperoleh adalah IPK dan lama studi memiliki hubungan terhadap jalur
masuk. Setiap jalur masuk memiliki pola IPK dan lama studi yang negatif, yaitu semakin tinggi
nilai IPK maka lama studi akan semakin rendah, dan sebaliknya, semakin rendah nilai IPK maka
lama studi akan semakin tinggi. Analisis variabel yang berpengaruh terhadap IPK dan lama
studi dilakukan menggunakan korelasi Chi-Square. Variabel yang berpengaruh terhadap nilai
IPK adalah lama studi, program studi, dan jalur masuk. Variabel yang berpengaruh terhadap
lama studi adalah IPK, program studi, provinsi asal SMA, dan jalur masuk.
Model prediksi dibuat menggunakan algoritma Naive Bayes dan Decision Tree. Algoritma
Naive Bayes menghasilkan model prediksi lama studi paling baik, dengan nilai RMSE 1.43.
Algoritma Decisioin Tree menghasilkan model prediksi IPK paling baik, dengan nilai RMSE
0.637. Kedua model diluncurkan menggunakan GUI.
Kesimpulan dari tugas akhir ini adalah IPK dan lama studi memiliki hubungan korelasi
yang negatif. Variabel yang memengaruhi nilai IPK adalah lama studi, program studi, dan jalur
masuk. Variabel yang memengaruhi lama studi adalah IPK, provinsi asal SMA, program studi,
dan jalur masuk. Model yang dihasilkan untuk memprediksi IPK dan lama studi cukup baik,
dan dapat diluncurkan menggunakan GUI.