dc.description.abstract |
Pemilihan Umum 2024 saat ini menjadi peristiwa yang sangat dinantikan masyarakat Indonesia.
Banyak media berita mulai mengeluarkan artikel mengenai kandidat presiden, kandidat wakil
presiden, dan partai pemilu Indonesia selanjutnya. Artikel berita tersedia melalui berbagai
laman portal yang ada di Indonesia, salah satunya Detik.com yang menjadi salah satu media
berita yang orang pakai untuk mengetahui berita terkini. Dengan banyaknya jumlah berita yang
ada, serta cepatnya jumlah berita tersebut dikeluarkan, publik dapat kebingungan untuk menilai
popularitas dari calon presiden, wakil presiden, dan partai yang didukungnya jika melihat secara
satu per satu.
Penelitian ini bertujuan untuk mengatasi masalah yang dibahas pada paragraf pertama
dengan menganalisis teks berita terkait Pemilu 2024 menggunakan teknologi Big Data, khususnya
dengan memanfaatkan sistem terdistribusi Hadoop dan Spark Cluster. Penelitian ini
dilakukan dengan langkah-langkah sebagai berikut yaitu menerapkan Tahapan Data Science:
Implementasi tahapan data science, mulai dari pengumpulan, pembersihan, eksplorasi, analisis,
hingga visualisasi data teks yang berkaitan dengan Pemilihan Umum 2024 dari portal berita
detik.com. Fokus analisis adalah untuk mengukur popularitas Calon Presiden/Wakil Presiden
(Capres/Cawapres) dan partai politik baik secara sentimen maupun statistik.
Melakukan eksplorasi dan penyiapan data berita dari detik.com dengan menggunakan query
yang mencakup sejumlah Capres, Cawapres dan partai politik yang relevan dengan Pemilu 2024.
Analisis dilakukan terhadap data berita dengan tujuan mengukur popularitas Capres/Cawapres
dan partai politik. Dalam proses ini, terjadi tiga iterasi: pertama dengan teknik preprocessing
data per dokumen berita dan penggunaan model machine learning, kedua dengan pendekatan
per kalimat untuk analisis sentimen menggunakan model machine learning, dan ketiga dengan
penambahan fitur berupa judul berita untuk meningkatkan akurasi analisis sentimen.
Hasil analisis disajikan dengan metrik statistik dan sentimen yang disusun sedemikian
rupa agar menarik dan mudah dipahami. Iterasi ketiga menggunakan polaritas kelas yang
didapat dari judul dan teks berita sebagai bobot untuk menciptakan sentimen gabungan yang
merepresentasikan berita secara lebih komprehensif. Hasil penelitian ini memberikan wawasan
dalam pemahaman popularitas dan sentimen terkait Pemilu 2024 dalam bentuk perangkat lunak
berbasis website berupa Dashboard, serta menunjukkan upaya iteratif dalam meningkatkan
kualitas analisis sentimen menggunakan teknologi Big Data. |
en_US |