Analisis data berdimensi besar menggunakan Model Random Forest dengan penerapan metode analisis komponen utama

Kosasih, Annisa Aliana

dc.contributor.advisor	Kusnadi, Felivia
dc.contributor.advisor	Irawan, Robyn
dc.contributor.author	Kosasih, Annisa Aliana
dc.date.accessioned	2024-09-04T08:11:26Z
dc.date.available	2024-09-04T08:11:26Z
dc.date.issued	2024
dc.identifier.other	skp45690
dc.identifier.uri	http://hdl.handle.net/123456789/18480
dc.description	2038 - FTIS	en_US
dc.description.abstract	Data banyak berperan dalam kehidupan manusia serta memiliki beragam jenis, karakteristik, dan teknik pengumpulannya. Salah satu karakteristik data yang kerap kali dijumpai yakni data yang memiliki dimensi besar. Karakteristik tersebut terkadang dapat menjadi tantangan dalam proses analisis data. Salah satu pilihan untuk menangani hal tersebut yakni memanfaatkan metode dalam machine learning. Penelitian ini bertujuan untuk menerapkan dan melihat pengaruh suatu metode machine learning yang terpilih untuk penelitian, dalam pembentukan model prediksi, dengan melibatkan proses penanganan karakteristik data berdimensi besar. Model prediksi yang dipilih ialah Random Forest. Metode yang digunakan dalam mendukung pembentukan model prediksi tersebut antara lain adalah analisis komponen utama (Principal Component Analysis). Fokus utama dalam penelitian yakni melihat pengaruh dari penerapan reduksi dimensi data dengan metode analisis komponen utama, untuk suatu model prediksi jenis klasifikasi dengan Random Forest. Data yang digunakan dalam penelitian memiliki dimensi yang besar. Pada penelitian ini, digunakan himpunan data dengan topik kanker payudara dan kebangkrutan perusahaan. Harapannya adalah dapat menambah literasi terkait pengaruh penerapan metode yang dilakukan terhadap suatu model prediksi Random Forest. Hasil pembahasan skripsi ini menunjukkan bahwa penerapan reduksi dimensi dengan metode analisis komponen utama tidak menunjukkan hasil yang lebih signifikan dibandingkan model tanpa adanya reduksi dimensi. Artinya, dalam hal ini ternyata model Random Forest sudah cukup untuk mengolah data. Meskipun demikian, hal yang dapat dipastikan yakni waktu pelatihan data (training time) lebih cepat dan ukuran dimensi data yang menjadi lebih kecil. Selain itu, di dalam analisis hasil Random Forest juga dikaji variable importance model yang memberikan hasil bahwa adanya penerapan analisis komponen utama tidak mengganggu esensi informasi yang dimiliki data asli meskipun dimensi data lebih kecil. Penelitian ini berkontribusi pada literatur mengenai dampak metode yang diajukan terhadap model Random Forest, serta memberikan wawasan tentang efektivitasnya dalam menangani data berdimensi besar.	en_US
dc.language.iso	Indonesia	en_US
dc.publisher	Program Studi Matematika Fakultas Teknologi Informasi dan Sains - UNPAR	en_US
dc.subject	Data Dimensi Besar;	en_US
dc.subject	Analisis Komponen Utama	en_US
dc.subject	Model Prediksi	en_US
dc.subject	Random Forest	en_US
dc.title	Analisis data berdimensi besar menggunakan Model Random Forest dengan penerapan metode analisis komponen utama	en_US
dc.type	Undergraduate Theses	en_US
dc.identifier.nim/npm	NPM6161901060
dc.identifier.nidn/nidk	NIDN0419089302
dc.identifier.nidn/nidk	NIDN0402099401
dc.identifier.kodeprodi	KODEPRODI616#Matematika