Abstract:
Sistem rekomendasi adalah suatu sistem yang menyediakan rekomendasi kepada pengguna untuk
mendapatkan produk yang diinginkannya. Sistem rekomendasi berguna untuk meningkatkan
pengalaman pengguna dalam mencari produk atau sesuatu yang menarik atau yang sesuai
dengan minat dan kesukaan masing-masing pengguna. Sistem rekomendasi ini bertujuan agar
dapat meningkatkan penjualan produk dan meningkatnya pengalaman pengguna dalam mencari
produk yang sesuai dengan minatnya.
Pada penelitian ini akan digunakan metode collaborative filtering yang memberi rekomendasi
film yang berasal dari interaksi pengguna lainnya dengan film-film yang mirip berdasarkan
interaksinya dengan film. Data yang bisa didapatkan dari interaksi pengguna dengan produk
atau aplikasi dapat diklasifikasikan menjadi 2, yaitu eksplisit dan implisit. Data implisit
merupakan data yang tidak diinput secara langsung atau sadar oleh pengguna seperti melihat
produk, klik item produk, histori pembelian, dan lain-lain. Pada penelitian ini data implisit
yang digunakan berasal dari MovieLens. Data implisit ini merupakan data interaksi pengguna
dengan film. Interaksi ini berasal dari rating yang diberikan pengguna pada film-film. Apabila
pengguna memberikan rating dengan suatu film, maka nilai interaksinya 1. Jika tidak, maka
akan diberi nilai interaksi 0. Maka nantinya data yang dipakai akan berbentuk sebuah matriks
interaksi yang dimana kolomnya merupakan movieId dan barisnya merupakan userId.
Interaksi antara pengguna-pengguna dengan item memiliki nilai interaksi yang berdistribusi
normal multivariat. Nantinya dengan menerapkan probabilitas sebaran distribusi normal multivariat
pada interaksi pengguna dan item, pada penelitian ini akan memprediksi interaksi yang
bernilai 0 atau pengguna yang tidak memberikan rating film, sehingga film tersebut yang tidak
diberi rating akan diprediksi nilainya dengan distribusi normal multivariat.
Hasil dari prediksi yang dilakukan akan dievaluasi dengan menggunakan metrik evaluasi
precision@k dan nDCG@k. Precision@k merupakan metrik evaluasi yang digunakan untuk
mengukur seberapa tepat sebuah sistem rekomendasi dalam memprediksi item yang akan
diinteraksi oleh pengguna. Sedangkan nDCG@k mirip seperti precision@k, tetapi nDCG@k
melihat urutan hasil prediksi pada list rekomendasi yang dihasikan dari prediksi . Pada pemodelan
yang dibuat pada penelitian ini, pemodelan dibuat dengan pembagian data train dan data test
menggunakan train test split dan KFold. Pada percobaan, digunakan nilai rasio penghilangan
interaksi untuk data test sebesar 0,3, 0,5, dan 0,7. Rasio penghilangan interaksi mengubah
beberapa interaksi yang nilainya 1 menjadi 0 pada setiap pengguna yang dijadikan data test
sebanyak rasio tersebut. Nilai precision@k dan nCDG@k dengan menggunakan ketiga rasio
tersebut didapat berkisar nilai 0,3 hingga 0,5.
Dari hasil evaluasi yang didapat, hasil prediksi kurang baik karena nilai precision@k dan
nDCG@k berkisar dibawah 0,5, namun dengan hasil yang kurang baik tersebut masih bisa digunakan
untuk rekomendasi kepada pengguna karena pengguna akan terbuka untuk mengeksplorasi
berbagai pilihan film, meskipun rekomendasinya tidak selalu sangat presisi.