Abstract:
Dalam pasar e-commerce Indonesia yang terus berkembang, Website X
merupakan website penjual produk kosmetik dan kecantikan terbesar di Indonesia.
Sebagai perusahaan yang bergerak di bidang kecantikan, diperlukan customer feedback
yang memaparkan repurchase intention konsumen melalui media digital. Website X
menyediakan informasi yang berkelimpahan mengenai repurchase intention dan faktor
lain yang mempengaruhinya. Data ulasan konsumen yang berkelimpahan mempersulit
pemrosesan. Oleh karena itu, dipakai feature selection untuk memilih fitur. Model prediksi
repurchase intention dibuat dengan algoritma decision tree classifier untuk membuat
model yang dapat memprediksi repurchase intention konsumen.
Data dibagi menjadi dua bagian, data training dan data test dengan rasio 80:20.
Dari berbagai metode feature selection, diuji metode term frequency, TF-IDF, Fisher
Score, dan Distinguishing Feature Selector. Setelah membagi data training secara acak
menjadi 10 balanced sampel, 50 fitur yang paling relevan diambil untuk dibuat menjadi
model prediksi. Kemudian, dibuatlah model prediksi dengan algoritma decision tree.
Confusion matrix menyediakan informasi bagi perhitungan akurasi sampel.
Proses pembuatan model prediksi dilakukan untuk setiap sampel dari tiga
kategori produk, yakni cleanser, moisturizer, dan treatment. Dari hasil perbandingan
antar model, didapatkan bahwa model prediksi Fisher Score memiliki tingkat akurasi
tertinggi sekitar 55%. Setelah dilakukan uji signifikansi paired t test, terbukti bahwa model
dari Fisher Score memiliki rata-rata akurasi yang berbeda secara signifikan dengan
kebanyakan metode lainnya. Didapati pula bahwa model Fisher Score juga dapat
menggambarkan repurchase intention dengan lebih baik dibandingkan model yang hanya
menggunakan rating. Maka dari itu, model prediksi repurchase intention terbaik adalah
model yang menggunakan metode Fisher Score.