Abstract:
Industri pariwisata adalah kumpulan usaha pariwisata yang menghasilkan barang dan/atau
jasa bagi pemenuhan kebutuhan wisatawan dalam berpariwisata. Industri pariwisata meliputi
akomodasi, kegiatan layanan makanan dan minuman, angkutan penumpang, agen perjalanan
wisata, kegiatan budaya, dan kegiatan olahraga dan hiburan. Pada tahun 2020 Indonesia
dilanda wabah penyakit pernapasan yaitu COVID-19 yang membuat Pemerintah Indonesia
membuat kebijakan untuk mengatasi penyebaran virus COVID-19 dimana salah satu kebijakan
itu adalah Pembatasan Sosial Berskala Besar (PSBB). Akibatnya masyarakat tidak dapat
melakukan perjalanan wisata sehingga industri pariwisata terkena dampak yang sangat besar.
Penelitian ini memanfaatkan teknik-teknik data science untuk mempelajari data-data lampau
untuk memperoleh insight untuk menentukan strategi yang tepat demi membangkitkan industri
pariwisata. Penelitian ini menggunakan bahasa pemrograman R untuk memperoleh insight dari
data lampau dan dibuat sebuah website dashboard dengan menggunakan RShiny.
Data science merupakan cabang ilmu yang mengkombinasikan koding, statistika dan bisnis
untuk memperoleh insight. Proses data science yang dilakukan dalam penelitian ini adalah
pengumpulan data yang berkaitan dengan industri pariwisata. Penyiapan data untuk mengatasi
missing value dalam data. Visualisasi data untuk melihat pola-pola menarik dari data. Korelasi
adalah nilai koefisien untuk mengukur korelasi/hubungan antara dua variabel numerik.
Pada penelitian ini terdapat dua dataset yang dianalisis. Pertama merupakan data terkait
persentase tingkat hunian kamar hotel. Kedua merupakan gabungan dari beberapa dataset yang
meliputi jumlah kamar hotel bintang 1 sampai dengan bintang 5 dan non bintang, jumlah kamar
hotel bintang 1 sampai dengan bintang 5, jumlah restoran, jumlah angkutan wisata, jumlah
objek wisata alam, budaya, dan minat khusus, jumlah wisata nusantara dan jumlah wisatawan
mancanegara.
Visualisasi yang digunakan dalam penelitian ini adalah histogram yang berguna untuk melihat
distribusi dari data untuk menentukan missing value diisi dengan mean, median, atau dengan nilai
observasi sebelumnya yang tidak hilang. Trend dari dataset persentase hunian divisualisasikan
dengan line plot untuk melihat bulan apa saja persentase hunian meningkat. Analisis korelasi
dilakukan terhadap dataset gabungan untuk melihat variabel yang mempengaruhi peningkatan
jumlah wisatawan nusantara dan mancanegara. Scatter plot dibuat untuk masing-masing variabel
yang berpengaruh terhadap wisatawan nusantara dan mancanegara untuk memvalidkan hasil
dari nilai korelasi.
Berdasarkan hasil analisis dan visualisasi yang dilakukan, dapat disimpulkan bahwa persentase
hunian kamar hotel tertinggi paling sering terdapat pada bulan November dan Desember.
Variabel-variabel yang memiliki hubungan positif dengan wisatawan nusantara adalah hotel
non-bintang, jumlah hotel keseluruhan, jumlah restoran, dan jumlah objek wisata. Untuk
wisatawan mancanegara tidak terdapat variabel-variabel yang berhubungan positif.