Studi dan implementasi Apache Spark MLlib untuk analisis big data

Show simple item record

dc.contributor.advisor Moertini, Veronica Sri
dc.contributor.advisor Karya, Gede
dc.contributor.author Cahyo, Kresna Dwi
dc.date.accessioned 2019-02-13T04:42:33Z
dc.date.available 2019-02-13T04:42:33Z
dc.date.issued 2018
dc.identifier.other skp36653
dc.identifier.uri http://hdl.handle.net/123456789/7520
dc.description 1526 - FTIS en_US
dc.description.abstract Data dalam waktu cepat dapat terkumpul dapat menjadi Big Data. Big data dapat dianalisis untuk mendapatkan informasi atau pengetahuan yang berharga. Namun, dibutuhkan komputer dengan kekuatan komputasi yang sangat tinggi untuk menganalisis data dengan ukuran yang sangat besar. Sistem terdistribusi adalah solusi dari masalah tersebut. Salah satu jenis sistem terdistribusi adalah Distributed Computing System. Distributed Computing System merupakan sistem terdistribusi yang digunakan untuk komputasi dengan kebutuhan kinerja yang tinggi. Hadoop adalah salah satu framework yang banyak dipakai saat ini. Hadoop merupakan platform yang dapat menyediakan penyimpanan dan kemampuan komputasi terdistribusi. Seiring berjalannya waktu, Framework lainnya juga mulai bermunculan. Salah satunya adalah Apache Spark. Apache Spark adalah sebuah framework cluster computing yang dapat dimanfaatkan untuk mengolah Big Data dengan cepat. Apache Spark dapat berjalan diatas infrastruktur Hadoop untuk meningkatkan fungsionalitas. MLlib merupakan library yang mengimplementasikan teknik analisis machine learning. Teknik machine learning yang dimiliki MLlib meliputi statistic, classification, regression, collaborative filtering, clustering, dimensionality reduction, dan feature extraction. Fungsi-fungsi pada MLlib dapat dipanggil melalui API yang disediakan Spark. Perangkat lunak demo berhasil dikembangkan pada skripsi ini. Perangkat Lunak ini memiliki tujuan untuk dapat mengolah data dengan menggunakan beberapa fungsi dari library MLlib. Perangkat lunak demo berjalan pada lingkungan cluster hadoop. Skripsi ini menjelaskan konsep dan cara kerja Spark serta menunjukan cara pemanggilan fungsi-fungsi MLlib. Selain itu, modifikasi dilakukan pada fungsi K-means MLlib agar dapat menghasilkan suatu pola bagi pengguna. Pengujian fungsional dan uji performa dilakukan untuk menguji fungsi-fungsi library MLlib. Uji performa dilakukan dengan variasi ukuran data masukkan yaitu 1gb, 3gb, dan 5gb. Berdasarkan hasil pengujian yang sudah dilakukan, dapat disimpulkan bahwa kinerja dari fungsi-fungsi MLlib sangat baik untuk komputasi pada ukuran data yang besar. en_US
dc.language.iso Indonesia en_US
dc.publisher Program Studi Teknik Informatika Fakultas Teknologi Informasi dan Sains - UNPAR en_US
dc.subject Sistem Terdistribusi en_US
dc.subject Apache Spark en_US
dc.subject MLlib en_US
dc.subject Machine Learning en_US
dc.subject Hadoop en_US
dc.subject HDFS en_US
dc.subject Clustering en_US
dc.subject K-means en_US
dc.subject Scala en_US
dc.title Studi dan implementasi Apache Spark MLlib untuk analisis big data en_US
dc.type Undergraduate Theses en_US
dc.identifier.nim/npm NPM2014730048
dc.identifier.nidn/nidk NIDN0414076203
dc.identifier.nidn/nidk NIDN0415037501
dc.identifier.kodeprodi KODEPRODI618#Teknik Informatika


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search UNPAR-IR


Advanced Search

Browse

My Account