Abstract:
Privasi pada dasarnya adalah kemampuan seseorang dalam mengatur informasi pribadinya.
Informasi-informasi pribadi bisa disebut juga dengan istilah personally identifiable information
atau PII. Pada zaman ini, data mining merupakan suatu aktivitas yang menguntungkan, tetapi
dengan melakukan data mining juga dapat membuka informasi pribadi. Tujuan dari penelitian
ini adalah dapat merilis sebuah data agar dapat digunakan untuk data mining, tetapi tidak
melanggar privasi, dengan menggunakan teknik anonimisasi seperti algoritma k-anonymity.
Algoritma k-anonymity yang akan digunakan pada penelitian ini adalah algoritma Datafly dan
algoritma Greedy k-member Clustering.
Perangkat lunak dibangun untuk mengimplementasikan algoritma k-anonymity, yaitu algoritma
Datafly dan algoritma Greedy k-member Clustering. Pengujian juga dilakukan dalam
rangka mendapatkan relasi antara kualitas, nilai k, tipe dan banyaknya atribut yang digunakan,
dan waktu eksekusi algoritma k-anonymity yang diimplementasikan.
Berdasarkan hasil pengujian, algoritma Datafly dan algoritma Greedy k-member Clustering
menunjukkan hasil yang berbeda. Algoritma Datafly memiliki kualitas dan waktu eksekusi yang
rendah bila nilai k semakin tinggi, tetapi jumlah entri pada hasil anonimisasi menjadi lebih
sedikit dibanding dengan jumlah entri pada tabel privat. Di sisi lain, algoritma Greedy k-member
Clustering memiliki kualitas dan waktu eksekusi yang tinggi bila nilai k semakin tinggi, tetapi
entri pada hasil anonimisasi sama dengan jumlah entri pada tabel privat. Pada akhirnya, kualitas
dapat diatur dengan menyesuaikan nilai k dengan algoritma yang digunakan atau menyesuaikan
jumlah atribut yang digunakan. Nilai k dan banyaknya atribut yang digunakan juga dapat
berpengaruh pada waktu eksekusi algoritma k-anonymity yang diimplementasikan.