Abstract:
Kemajuan teknologi membuat internet merupakan salah satu sarana untuk membantu pekerjaan
setiap orang. Website adalah salah satu kategori layanan yang populer digunakan di internet.
Website ini dijalankan oleh webserver yang beroperasi selama 24 jam tanpa henti. Salah satu
webserver yang populer digunakan adalah apache. Apache akan mencatat setiap permintaan
dari client, sehingga seluruh kejadian akan dapat ditelusuri. Banyaknya data membuat proses
pengecekan menjadi lama dan kurang akurat jika dilakukan secara manual. Solusi permasalahan
ini adalah menggunakan pembelajaran mesin untuk memeriksa log akses, sehingga dapat ditemukan,
apabila terdapat kejadian yang bersifat anomali. Teknik yang digunakan melibatkan
pembelajaran terarah (supervised learning) dan juga pembelajaran tak terarah (unsupervised
learning). Sebelum diproses, file log ini akan diperiksa dan akan diperoleh atribut - atribut yang
menjelaskan karakteristik dari log tersebut. Kemudian akan ditentukan 2 kategori data, yaitu
data latihan dan data pengujian. Data latihan merupakan data yang telah diberi label dan
dijadikan masukan untuk system agar dapat mempelajari karakteristik dari file log. Sedangkan
data pengujian adalah data yang akan dikenali oleh system berdasarkan data latihan yang telah
dimasukan sebelumnya. Pengujian yang dilakukan akan bertujuan untuk mengevaluasi baik
buruknya performa algoritma dari model pembelajaran. Akurasi akan menjadi pertimbangan
dalam menentukan hal tersebut. Hasil dari penelitian ini adalah sebuah aplikasi yang dapat
menentukan ada atau tidaknya anomali yang terjadi berdasarkan dari file log apache yang
menjadi masukkan.