dc.description.abstract |
Hotel butuh untuk melakukan evaluasi untuk meningkatkan kualitas hotel tersebut. Ulasan online melalui Tripadvisor merupakan salah satu cara hotel melakukan evaluasi. Untuk melakukan evaluasi dibutuhkan trip type pelanggan, namun banyak pelanggan yang menuliskan ulasan dan tidak mengisi trip type pada ulasannya. Oleh karena itu dibuatlah model prediksi trip type untuk memprediksi trip type suatu ulasan. Pembuatan model prediksi menggunakan feature word vector dengan model doc2vec untuk mengubah ulasan menjadi vektor. Doc2vec dapat menggambarkan arti atau karakteristik dari sebuah dokumen menjadi vektor. Data yang diproses akan dibagi menjadi data train dan test dengan rasio 80:20. Namun dikarenakan adanya imbalanced dataset maka dilakukan over sampling dengan metode SMOTE terhadap data train. Dalam pengubahan ulasan menjadi vektor terdapat beberapa parameter yang digunakan yaitu vector size, window, dan min_count. Didapatkan nilai parameter terbaik untuk setiap parameter adalah vector size 700, window 200, dan min_count 1. Setelah itu dilakukan penentuan model klasifikasi yang terbaik antara Decision Tree, kNN, Logistic Regression, dan SVM. Didapatkan model klasifikasi terbaik adalah SVM dengan rata-rata akurasi 57%. Semua penentuan dibuktikan dengan uji Z dua populasi untuk menguji rata- rata akurasi terbaik. |
en_US |