Perbandingan fuzzy c-means dan k-means untuk text clustering menggunakan LSI

Show simple item record

dc.contributor.advisor Nugraheni, Cecilia Esti
dc.contributor.author Ariyanti, Dini Puspita Sukma
dc.date.accessioned 2021-08-05T02:58:31Z
dc.date.available 2021-08-05T02:58:31Z
dc.date.issued 2021
dc.identifier.other skp40823
dc.identifier.uri http://hdl.handle.net/123456789/12047
dc.description 1784 - FTIS en_US
dc.description.abstract Salah satu cara untuk meningkatkan efektivitas dan efisiensi dalam pemrosesan data adalah dengan melakukan clustering. Data yang akan digunakan dalam penelitian ini berupa teks. Text clustering dilakukan untuk mengelompokkan dokumen berdasarkan kemiripan topik yang dibahas dalam teks-teks tersebut. Teks yang memiliki kemiripan topik akan berada dalam satu cluster. Kumpulan dokumen akan dibersihkan dengan melakukan text pre-processing. Setelah itu kumpulan dokumen yang sudah melalui text pre-processing akan dimodelkan dengan menggunakan Vector Space Model sehingga terbentuk matriks document-term. Matriks document-term memiliki dimensi yang besar. Latent Semantic Indexing (LSI) akan digunakan untuk mengurangi dimensi vektor matriks dan merepresentasikan dokumen ke dalam konsep (bukan kata-kata). Hasil dari LSI nantinya akan digunakan untuk melakukan clustering. Clustering dokumen akan dilakukan dengan metode Fuzzy C-Means. Hasil clustering dokumen dengan Fuzzy C-Means akan dibandingkan dengan hasil clustering dokumen dengan K-Means dengan parameter jarak intercluster, jarak intracluster, dan waktu yang dibutuhkan dalam pemrosesan. Dalam penelitian ini, akan dibuat sebuah desktop application dengan menggunakan bahasa Java. Perangkat lunak tersebut mengimplementasikan Algoritma LSI, Fuzzy C-Means, dan K-Means. Pengujian dibagi menjadi dua bagian, yaitu pengujian fungsionalitas untuk melihat apakah masukan dari pengguna direspon dengan baik oleh program, dan pengujian performa untuk mengukur bagaimana hasil dari algoritma yang diimplementasikan. Hasil pengujian menunjukan secara performa LSI-FCM bekerja lebih baik dibanding LSI-KMeans. Hasil text clustering dengan menggunakan algoritma LSI-FCM setiap anggotanya memiliki jarak yang lebih dekat dengan titik pusat clusternya dibanding dengan menggunakan algoritma LSI dan K-Means. Tetapi secara kecepatan LSI-FCM bekerja lebih lambat dibanding LSI-KMeans. en_US
dc.language.iso Indonesia en_US
dc.publisher Program Studi Teknik Informatika Fakultas Teknologi Informasi dan Sains - UNPAR en_US
dc.subject Text Clustering en_US
dc.subject Latent Semantic Indexing en_US
dc.subject LSI en_US
dc.subject Fuzzy C-Means en_US
dc.subject FCM en_US
dc.subject K-Means en_US
dc.title Perbandingan fuzzy c-means dan k-means untuk text clustering menggunakan LSI en_US
dc.type Undergraduate Theses en_US
dc.identifier.nim/npm NPM2016730084
dc.identifier.nidn/nidk NIDN0427116901
dc.identifier.kodeprodi KODEPRODI618#Teknik Informatika


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search UNPAR-IR


Advanced Search

Browse

My Account