Abstract:
Di era digital ini, resep makanan Indonesia semakin mudah ditemukan. Resep bisa didapatkan
dari banyak tempat, salah satunya adalah dari situs resep makanan di internet. Resep merupakan
tata cara pembuatan makanan yang berisi nama dari resep, bahan dan lauk yang digunakan,
dan tata cara pembuatannya. Jika pengguna melihat sebuah resep di sebuah laman di internet,
ada kemungkinan pengguna tersebut ingin melihat resep yang sejenis atau mirip dengan resep
sebelumnya. Untuk mencari resep yang sejenis atau mirip dibutuhkan pengelompokkan resep.
Untuk mengelompokkan resep dibutuhkan teknik pengelompokkan yang dinamakan klasterisasi.
Klasterisasi adalah teknik yang mengelompokkan objek-objek dengan karakteristik yang serupa
ke dalam satu klaster. Ada beberapa cara untuk melakukan klasterisasi di antaranya adalah
k-means dan agglomerative hierarchical. Setiap resep akan direpresentasikan dengan sebuah
vektor yang dimensinya adalah komposisi bahan di resep tersebut. Untuk dapat menghitung
kemiripan antar resep maka dibutuhkan perhitungan jarak. Digunakan dua buah perhitungan
yaitu perhitungan cosine similarity dan Euclidean distance.
Pada penelitian ini, dibangun sebuah perangkat lunak yang dapat mengelompokkan kumpulan
resep makanan Indonesia yang berisi nama, bahan, dan kuantitas dari setiap bahan yang
digunakan pada resep. Perangkat lunak mengimplementasikan metode k-means dan agglomerative
hierarchical. Tujuan dari penelitian ini adalah untuk melakukan klasterisasi dan menganalisis
hasil klasterisasi untuk resep makanan Indonesia. Hasil dari klasterisasi akan dianalisis untuk
menentukan apakah resep-resep yang berada di klaster yang sama memiliki kemiripan dalam
hal cita rasa, atau jenis makanan. Analisa juga dilakukan untuk daerah asal resep pada setiap
resep di klaster, apakah daerah terbagi dengan baik. Analisis akan dilakukan pada klaster yang
memiliki intracluster terkecil atau terbaik. Pengujian juga dilakukan untuk melihat perbandingan
hasil yang lebih baik berdasarkan algoritma penggunaan k-means atau agglomerative hierarchical,
penggunaan perhitungan vektor cosine atau Euclidean, dan penggunaan vektor fitur bahan tanpa
lauk atau bahan dengan lauk.
Hasil pengujian menunjukkan bahwa makanan Indonesia bisa dikelompokkan. Berdasarkan hasil
dari klasterisasi tidak begitu terlihat ciri khas dari sebuah klaster dan tidak terlalu jelas perbedaan
antara suatu klaster dengan klaster yang lain. Hasil ini dapat terjadi karena pada dataset yang
digunakan banyak makanan Indonesia yang menggunakan bahan dan bumbu yang sama, sehingga
tidak terlalu terlihat perbedaan antar satu kelompok dan kelompok lainnya. Makanan di setiap
daerah Indonesia pun memiliki jenis makanan yang berbeda. Hal ini menyebabkan satu daerah
bisa berada dalam kelompok yang berbeda.