Abstract:
Lagu menjadi salah satu hiburan yang banyak digemari oleh masyarakat dan setiap orang
memiliki selera musiknya masing-masing. Begitu juga dengan para musisi yang memiliki genre
musik dan karakternya masing-masing. Oleh karena itu ada beragam lagu yang dapat dinikmati
oleh masyarakat di seluruh dunia, salah satu media yang banyak digunakan sebagai layanan
untuk mendengarkan lagu maupun sebagai media untuk para musisi mempublikasikan lagunya
adalah Spotify. Spotify sendiri merupakan layanan musik digital yang memberikan akses ke
berbagai lagu dari musisi di seluruh dunia. Spotify memiliki beberapa fitur, salah satunya adalah
tangga lagu seperti Top 50 Global, Top 50 Indonesia, Top 200 Global dan lainnya. Bagi para
musisi, artis dan pelaku bidang industri musik lainnya jika lagu yang mereka buat ataupun lagu
yang mereka bawakan bisa masuk ke dalam tangga lagu Spotify tentunya akan memberikan
pengaruh baik, seperti meningkatnya jumlah pendengar dan lagu yang lebih dikenal masyarakat.
Namun tidak semua lagu dapat masuk ke dalam tangga lagu Spotify, oleh karena itu penelitian
ini dibuat untuk mencari faktor-faktor apa saja yang dapat membuat sebuah lagu masuk dan
bertahan dalam tangga lagu Top 200 Spotify dengan menganalisis data data lagu Top 200 Spotify
tahun 2020-2021 dengan menggunakan teknik data mining.
Data mining merupakan proses untuk menemukan pola-pola menarik dan informasi yang
menarik dari data dengan jumlah yang banyak. Kumpulan data yang didapatkan akan diproses
sehingga dapat menghasilkan pengetahuan baru yang dapat digunakan. Sebelum melakukan
pengolahan data untuk menemukan pola-pola perlu dilakukan tahapan data science yaitu
pengumpulan data dengan mencari data-data yang diperlukan dalam penelitian ini. Penyiapan
dan eksplorasi data dengan melakukan pembersihan dan mempelajari data yang akan digunakan.
Analisis data dengan mengolah data dengan teknik data mining untuk menemukan pola-pola
dan pembuatan model klasifikasi serta model clustering.
Pada penelitian ini dilakukan pengumpulan data utama yaitu data lagu Top 200 Spotify tahun
2020-2021 Global dan data tambahan yaitu data lagu Top 200 Spotify tahun 2020-2021 Indonesia.
Kemudian dilakukan pembersihan dan penyiapan data untuk tahapan eksplorasi. Dilakukanlah
eksplorasi univariat data untuk mempelajari sifat data dan eksplorasi bivariat untuk analisis
lanjutan dan pemilihan atribut yang akan digunakan dalam pembuatan model klasifikasi dan
model clustering. Penelitian ini menghasilkan informasi dari hasil analisis data yang disampaikan
dalam visualisasi data dan juga model klasifikasi untuk memprediksi jumlah kemunculan sebuah
lagu dalam tangga lagu Top 200 Spotify dengan algoritma K-Nearest Neighbor (KNN). Dibuat
juga model clustering menggunakan algoritma K-Means untuk melihat pola-pola dalam dataset
yang digunakan. Sebagai kesimpulan hasil penelitian ini mengungkapkan bahwa artis dan genre
dari sebuah lagu berkorelasi dengan peringkat tertinggi dari sebuah lagu dalam tangga lagu,
namun tidak berkorelasi dengan jumlah kemunculan sebuah lagu dalam tangga lagu. Kemudian
dapat dilakukan prediksi jumlah kemunculan sebuah lagu dalam tangga lagu berdasarkan nilai
popularitas lagu dan peringkat tertinggi yang dicapai lagu tersebut.