Abstract:
Analisis cluster berasal dari antropologi oleh Driver dan Kroeber pada tahun 1932 dan pertama
kali diperkenalkan ke bidang psikologi oleh Joseph Zubin pada tahun 1938 dan Robert Tryon
pada tahun 1939. Analisis cluster sendiri sampai masa kini telah dimanfaatkan dalam banyak
bidang seperti pada bidang machine learning, face recognition, grafik komputer, kompresi data,
analisis gambar, bioinformatika, marketing, dsb.
Analisis cluster memiliki pengertian sebagai proses untuk mengelompokkan kumpulan objek,
di mana kumpulan objek pada cluster yang sama memiliki kemiripan satu sama lain yang lebih
tinggi dibanding objek pada cluster lainnya. Salah satu penerapan dari analisis cluster adalah
dalam memproses kumpulan dokumen berbasis teks.
Sebelum dapat melakukan analisis cluster pada skripsi ini, dilakukan terlebih dahulu text
preprocessing. Text preprocessing merupakan proses mengubah bentuk data yang belum terstruktur
menjadi data terstruktur. Kumpulan dokumen yang digunakan pada skripsi ini memiliki
banyak variasi kata pada tiap dokumennya. Untuk dapat memproses kumpulan dokumen yang
memiliki banyak variasi kata pada tiap dokumennya, tentu diperlukan suatu struktur agar dapat
dilakukan proses perhitungan dengan tepat dan efisien.
Setelah dilakukkannya text preprocessing pada skripsi ini dibangun perangkat lunak yang
dapat mengimplementasikan analisis cluster pada dokumen berbasis teks menggunakan metode
Particle Swarm Optimization. PSO adalah teknik optimisasi stokastik berbasis populasi yang
dikembangkan oleh Dr. Eberhart dan Dr. Kennedy pada tahun 1995, terinspirasi oleh perilaku
sosial burung, dan atau ikan. Perangkat lunak yang dibangun memiliki tujuan untuk menganalisis
tingkat efektivitas yang diciptakan pada proses analisis cluster menggunakan algoritma Particle
Swarm Optimization. Kemudian untuk membandingkan tingkat efektifitas dari algoritma PSO
dirancang juga perangkat lunak lainnya. Pada skripsi ini digunakan algioritma K-means sebagai
pembanding.