Pengelompokan dokumen berbasis algoritma genetika

Show simple item record

dc.contributor.advisor Harjono, Kristopher David
dc.contributor.author Herianto, Cornelius David
dc.date.accessioned 2019-11-04T05:40:47Z
dc.date.available 2019-11-04T05:40:47Z
dc.date.issued 2019
dc.identifier.other skp38304
dc.identifier.uri http://hdl.handle.net/123456789/9532
dc.description 1609 - FTIS en_US
dc.description.abstract Pengelompokan (clustering) merupakan sebuah metode untuk menggabungkan himpunan objek ke dalam kelompok-kelompok sedemikan rupa sehingga objek dalam kelompok (cluster) lebih mirip (karena suatu hal) satu sama lain daripada objek di kelompok lain [1]. Document clustering (pengelompokan dokumen) merupakan proses pengelompokan yang dilakukan terhadap suatu koleksi dokumen. Pengelompokan dokumen diterapkan dalam beberapa bidang seperti penambangan web, mesin pencari (search engine), dan temu kembali informasi (information retrieval) [3]. Hal yang dilakukan dalam pengelompokan dokumen adalah mengukur kemiripan (similarity) antar dokumen dan mengelompokan dokumen yang serupa. Salah satu algoritma pengelompokan yang paling sering digunakan adalah K-means. Namun, algoritma K-means memiliki kekurangan yaitu dapat terjebak dalam local optimum. Local optimum adalah suatu solusi yang optimal (baik maksimal maupun minimal) diantara kandidat solusi yang berdekatan dalam masalah optimasi. Dikatakan lokal karena solusi ini hanya optimal apabila dibandingkan dengan kandidat solusi yang berdekatan, tidak optimal secara keseluruhan (global optimum). Algoritma genetika atau biasa disebut Genetic Algorithm (GA) adalah suatu algoritma pencarian yang terinspirasi dari proses seleksi alam yang terjadi secara alami dalam proses evolusi. GA merupakan metode penyelesaian masalah yang menggunakan genetika sebagai pemodelannya. Dalam penelitian ini, GA akan digunakan sebagai solusi dari masalah local optimum. Local optimum dapat diatasi oleh GA yang sudah terbukti efektif dalam masalah pencarian dan optimasi. GA dapat digunakan untuk mengelompokkan dokumen dengan beberapa adaptasi terhadap representasi kromosom, fungsi fitness, seleksi, persilangan, dan mutasi. Algoritma genetika dan algoritma K-means diuji menggunakan suatu dataset berlabel untuk membandingkan waktu dan hasil pengelompokan dari kedua algoritma tersebut. Berdasarkan hasil eksperimen menggunakan dataset dalam penelitian ini, rata-rata nilai purity dari hasil pengelompokan menggunakan algoritma genetika adalah sebesar 0.799, lebih baik 56% dibandingkan dengan menggunakan algoritma K-means. Hal ini membuktikan bahwa algoritma genetika sudah dapat mengelompokan dokumen dengan hasil yang memuaskan. Namun dari segi waktu, algoritma genetika membutuhkan waktu 4365% lebih lama dibandingkan dengan algoritma K-means. Hal ini disebabkan oleh proses komputasi yang dilakukan pada algoritma genetika jauh lebih banyak dan kompleks dibandingkan dengan algoritma K-means. en_US
dc.language.iso Indonesia en_US
dc.publisher Program Studi Teknik Informatika Fakultas Teknologi Informasi dan Sains - UNPAR en_US
dc.subject Algoritma genetika en_US
dc.subject Pengelompokan dokumen en_US
dc.subject Algoritma K-means en_US
dc.subject TF-IDF en_US
dc.subject Local optimum en_US
dc.title Pengelompokan dokumen berbasis algoritma genetika en_US
dc.type Undergraduate Theses en_US
dc.identifier.nim/npm NPM2015730034
dc.identifier.kodeprodi KODEPRODI618#Teknik Informatika


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search UNPAR-IR


Advanced Search

Browse

My Account