Abstract:
Dari beragam informasi yang tersedia pada situs pemesanan hotel, terdapat ulasan-ulasan hotel yang diberikan oleh konsumen terdahulu dan ditampilkan pada laman hotel. TripAdvisor merupakan situs pemesanan hotel yang mampu menampilkan ulasan lebih baik jika dibandingkan dengan situs pemesanan hotel lainnya serta terus mengalami peningkatan jumlah ulasan setiap tahun. TripAdvisor juga menyediakan filter trip type yang dapat membatu konsumen dalam memilah ulasan berdasarkan tipe perjalanan penulis ulasan yaitu couple, family, friends, business, dan solo. Meskipun terdapat fitur filter trip type dapat membantu konsumen dalam memilah ulasan, tetapi masih terdapat ulasan yang tidak dibubuhkan keterangan trip type sehingga ulasan tidak akan tergolong ke dalam ulasan tipe manapun.
Perancangan model klasifikasi trip type pada ulasan hotel dilakukan dengan melakukan penggabungan metode engineered features (TF-IDF dan DFS) serta document vector (Doc2vec) dalam mengolah data teks. Engineered features dapat menghasilkan skor yang merepresentasikan relevansi hubungan sebuah kata atau features dengan dokumen, sedangkan document vector akan membuat representasi numerik dari dokumen. Setelah melakukan penggabungan, maka dilakukan percobaan dalam menentukan parameter yang digunakan pada algoritma pengolahan data teks. Hasil dari pengolahan data teks dijadikan input ke dalam algoritma klasifikasi yaitu Logistic Regression dan Artificial Neural Network. Konfigurasi penggabungan model terbaik dihasilkan dari pengujian statistik yaitu uji Z dengan pengukuran performansi berupa akurasi model klasifikasi.
Akurasi tertinggi yang didapatkan dari konfigurasi model klasifikasi yang dikembangkan adalah sebesar 63,39%. Model klasifikasi tersebut didapatkan dari algoritma klasifikasi Artificial Neural Network dengan input berupa vektor dari Doc2vec berukuran 700 vektor serta TF-IDF. TF-IDF mendapatkan input berupa 300 kata yang dihasilkan dari algoritma DFS.