Abstract:
Ulasan online banyak memiliki informasi kebutuhan spesif ik setiap kelompok
wisatawan mancanegara. Pihak hotel dapat mengetahui kebutuhan tersebut dengan adanya
atribut seperti trip type dalam pengisian ulasan. Namun saat ini diketahui terdapat banyak
wisatawan yang tidak mengisi atribut trip type tersebut sehingga penafsiran isi ulasan dan
kebutuhan yang diinginkan oleh setiap kelompok wisatawan menjadi lebih sulit untuk
diinterpretasikan. Maka dibutuhkan sebuah pendekatan agar dapat membantu melakukan
prediksi trip type dari ulasan online hotel. Salah satu metode untuk memprediksi tersebut
dapat menggunakan sebuah model feature based.
Penelitian ini bertujuan untuk melakukan sebuah pemodelan untuk dapat
memprediksi trip type dari sebuah ulasan online hotel di TripAdvisor dengan menerapkan
metode feature based seperti tf-idf. Algoritma tf-idf merupakan sebuah algoritma yang
dapat menunjukkan asosiasi antar sebuah kata dalam suatu dokumen dengan sebuah nilai
yang merepresentasikan seberapa relevan sebuah kata atau feature terhadap sebuah
dokumen. Algoritma k-Nearest Neighbors (k-NN), Decision Tree dan Naïve Bayes
digunakan untuk mengukur performansi model prediksi trip type. Pada penelitian ini juga
dilakukan pengujian menggunakan metode Distinguishing Feature Selection (DFS) dan
raw term frequency.
Berdasarkan hasil dari pengujian menggunakan model prediksi yang
dikembangkan, terdapat dua metode yang dapat menghasilkan nilai rata-rata akurasi
prediksi tertinggi. Metode tersebut merupakan menggunakan metode tf-idf dengan nilai ratarata
akurasi sebesar 48.1908% dan metode DFS sebesar 48.3178%. Kedua nilai terbaik
tersebut didapatkan menggunakan parameter 300 features dan classifier decision tree.
Dengan menggunakan uji z dua populasi untuk menguji rata-rata (α = 5%), dapat ditarik
kesimpulan bahwa tidak terdapat perbedaan rata-rata secara signif ikan antar kedua rata-rata
tersebut yang menjadikan kedua metode dengan parameter tersebut merupakan metode yang
terbaik untuk digunakan pada model ini. Terdapat juga hasil feature importance dimana
terdapat 59 feature berpengaruh dengan metode DFS dan 87 feature berpengaruh dengan
metode TF-IDF. Hasil yang diperoleh dari feature importance dapat menunjukkan kebutuhan
dari konsumen berdasarkan karakteristik feature yang diperoleh sehingga dapat digunakan
untuk evaluasi layanan hotel.