Abstract:
Twitter merupakan salah satu jejaring sosial yang populer digunakan didunia pada saat ini.
Dikarenakan hal tersebut, Twitter terus mengakumulasi jumlah data yang begitu banyak setiap
harinya. Hal tersebut memunculkan suatu permasalahan yaitu bagaimana mendapatkan suatu
insights dari data yang telah terkumpul tersebut.
Suatu solusi yang berpotensi untuk menemukan insights dari data Twitter adalah dengan
melakukan pencarian dan analisis komunitas pada data Twitter. Komunitas dapat terbentuk dari
interaksi yang dilakukan antara pengguna-pengguna Twitter. Dari komunitas yang terbentuk
tersebut dapat dimanfaatkan berdasarkan sifat dan karakteristik dari komunitas tersebut.
Dalam melakukan hal tersebut, dikarenakan jumlah data Twitter yang dapat diproses
berjumlah besar, pemilihan teknologi yang tepat sangatlah penting dalam melakukan analisis
terhadap data. Teknologi yang dapat digunakan dalam melakukan analisis terhadap data yang
berjumlah sangat besar tersebut adalah seperti Spark dan Hadoop MapReduce. Hal tersebut
dikarenakan kedua teknologi tersebut dapat memproses data dengan secara terdistribusi, yang
membuat pemrosesan data menjadi lebih efisien.
Dengan menggunakan teknologi-teknologi tersebut berhasil didapatkan berbagai jenis komunitas
yang terbentuk dari data Twitter tersebut. 4 data Twitter yang digunakan terbentuk
berdasarkan 3 buah topik perbincangan, yaitu topik pemanasan global, olahraga, video game,
dan gabungan antara olahraga, video game, dan musik. Dari data-data yang digunakan, ditemukannya
persamaan hasil yang didapatkan. Komunitas-komunitas tersebut terbentuk berdasarkan
dari 3 tipe interaksi antara pengguna Twitter menggunakan tweet, yaitu interaksi reply, retweet,
dan quote. Dimana setiap jenis komunitas tersebut memiliki keunggulan dan kekurangannya
masing-masing.