dc.description.abstract |
Terdapat bermacam-macam akun dalam media sosial, salah satunya adalah akun buzzer. Akun
buzzer adalah akun pengguna media sosial yang secara sengaja menyebarkan informasi, opini,
atau pesan tertentu dengan tujuan memengaruhi opini publik. Pada penelitian ini digunakan
media sosial Twitter dengan domain Pemilihan umum Presiden Indonesia tahun 2024, karena
Twitter merupakan salah satu media sosial dimana masyarakat bebas berpendapat dan kegiatan
ini banyak dinanti oleh masyarakat Indonesia. Oleh karena itu ingin dideteksi akun buzzer
untuk membedakan mana akun buzzer yang cenderung menggunakan kata-kata bernada positif
(bersifat mendukung) dan yang bernada negatif (bersifat menyerang atau tidak sopan).
Data media sosial Twitter dikumpulkan dengan menggunakan teknologi big data bernama
Apache Kafka. Apache Kafka adalah sebuah sistem pengumpul data dalam skala besar yang
juga menjadi sarana dalam penyederhanaan data stream, nantinya hasil dari pengumpulan data
akan disimpan pada Hadoop Distributed File System (HDFS). Lalu digunakan Apache Spark
sebagai alat untuk mendeteksi dan menganalisis akun buzzer menggunakan data yang sudah
tersimpan pada HDFS. Apache Spark sendiri merupakan sebuah tools yang dapat digunakan
untuk memproses data secara paralel.
Sebelum dilakukan deteksi, datanya akan disiapkan terlebih dahulu sesuai kebutuhan. Deteksi
pada penelitian ini terdiri dari 5 tahap dengan menggunakan fitur-fitur berdasarkan dari hasil
studi literatur dan eksplorasi secara nyata, contoh salah satu fiturnya adalah FollowersCount
atau jumlah pengikut. Diambil akun dengan jumlah pengikut di atas 500 pengikut, fitur ini
didapatkan dari hasil studi literatur yang dilakukan. Selanjutnya hasil deteksi dianalisis untuk
memberi contoh akun-akun yang tergolong sebagai buzzer, dari 59 akun yang didapatkan dari
hasil deteksi, terdapat 51 akun yang merupakan akun buzzer. Oleh karena itu, ketika dihitung
tingkat keberhasilan deteksinya, didapatkan angka sebesar 86.4%, dapat dikatakan bahwa deteksi
yang dilakukan sudah berhasil.
Hasil dari deteksi ini kemudian akan dilanjutkan dengan klasifikasi untuk memprediksi
sentimen buzzer untuk memahami sentimen yang dihasilkan oleh akun buzzer tersebut. Pada
prediksi sentimen ini dilakukan 2 eksperimen dengan perbedaan pada jumlah datanya. Terdapat
2 metode yang digunakan untuk prediksi sentimen, yaitu metode lexicon based dan metode
machine learning (decision tree dan random forest). Model prediksi akan dievaluasi menggunakan
confusion matrix untuk mengetahui seberapa bagus hasil yang dihasilkan oleh model. Hasil
prediksi dianalisis untuk memberi contoh akun hasil prediksi yang didapatkan beserta dengan
contoh tweet yang dilakukannya.
Kesimpulannya, berdasarkan eksperimen yang sudah dilakukan, metode tersebut dapat
mendeteksi akun buzzer menggunakan fitur-fitur yang didapatkan dari hasil studi literatur
dan eksplorasi secara nyata. Hasil deteksinya dapat dimanfaatkan untuk melakukan analisis
sentimen agar mendapatkan model yang dapat memprediksi dengan baik. Sentimen yang sudah
didapatkan dapat digunakan untuk membedakan mana akun buzzer yang bernada positif dan
negatif. Untuk menampilkan hasil dari penelitian ini, dibangun sebuah perangkat lunak berbasis
website yang dapat menerima masukkan sebuah file csv untuk dideteksi dan diprediksi lalu
menampilkan hasilnya. |
en_US |