Perbandingan game-playing agent dengan algoritma Monte Carlo Tree Search dan temporal difference Tree Search pada permainan 2048

Show simple item record

dc.contributor.advisor Lionov
dc.contributor.author Han, Jiang
dc.date.accessioned 2024-07-10T09:25:50Z
dc.date.available 2024-07-10T09:25:50Z
dc.date.issued 2022
dc.identifier.other skp44352
dc.identifier.uri http://hdl.handle.net/123456789/17565
dc.description 1960 - FTIS en_US
dc.description.abstract 2048 adalah permainan video open-source yang viral pada tahun 2014. Daya tarik permainan tersebut terdapat pada mekanismenya yang sederhana, namun cukup menantang untuk dimainkan oleh pemain manusia. Sudah banyak model game-playing agent (GPA) yang dibuat untuk memainkan permainan tersebut secara otomatis. Berbagai GPA tersebut mengimplementasikan algoritma yang berbeda-beda sehingga memiliki tingkat keberhasilan yang bervariasi pula. Salah satu algoritma yang pernah diimplementasikan menjadi GPA untuk 2048 adalah algoritma Monte Carlo Tree Search (MCTS). Meskipun begitu, potensi MCTS dalam memainkan permainan tersebut belum sepenuhnya terealisasikan sebab MCTS memiliki banyak varian dan modifikasi yang dapat meningkatkan performa agen. Salah satu modifikasinya adalah dengan menggabungkan MCTS dengan temporal-difference learning (TD-Learning) sehingga menghasilkan algoritma Temporal Difference Tree Search (TDTS). Pada penelitian ini, akan dibangun perangkat lunak permainan 2048 dan GPA dengan algoritma MCTS dan TDTS menggunakan bahasa pemrograman Java. Secara spesifik, varian algoritma yang digunakan adalah UCT dan Sarsa-UCT(λ), di mana UCT adalah varian MCTS yang memakai selection policy UCB1 dan Sarsa-UCT(λ) adalah varian TDTS yang dihasilkan dengan menggabungkan TD-Learning dengan algoritma UCT. Dilakukan berbagai analisis terhadap kedua algoritma tersebut untuk menerapkannya pada permainan 2048. Kemudian, sejumlah eksperimen dilakukan untuk mencari konfigurasi parameter optimum untuk kedua algoritma tersebut. Lalu, performa keduanya dibandingkan dan dianalisis. Hasil eksperimen menunjukkan bahwa, pada konfigurasi optimumnya masing-masing, algoritma Sarsa-UCT(λ) memiliki performa yang setidaknya sama baiknya dengan algoritma UCT pada permainan 2048. Bahkan, jika anggaran komputasi yang tersedia sangat sedikit, algoritma Sarsa-UCT(λ) cenderung menghasilkan rata-rata skor yang lebih tinggi daripada algoritma UCT. Di sisi lain, skor yang dicapai oleh algoritma Sarsa-UCT(λ) tampak lebih fluktuatif daripada UCT sehingga Sarsa-UCT(λ) lebih sering menghasilkan skor yang lebih tinggi, namun lebih sering juga menghasilkan yang lebih rendah dari UCT. Selain itu, ditemukan bahwa beberapa nilai parameter optimal dari algoritma UCT dan Sarsa-UCT(λ) seperti konstanta eksplorasi, reward discount rate, dan eligibility trace decay rate memiliki korelasi positif dengan jumlah anggaran komputasi yang tersedia. en_US
dc.language.iso Indonesia en_US
dc.publisher Program Studi Teknik Informatika Fakultas Teknologi Informasi dan Sains - UNPAR en_US
dc.subject KECERDASAN BUATAN en_US
dc.subject GAME-PLAYING AGENT en_US
dc.subject 2048 en_US
dc.subject MONTE CARLO TREE SEARCH en_US
dc.subject TEMPORAL DIFFERENCE TREE SEARCH en_US
dc.title Perbandingan game-playing agent dengan algoritma Monte Carlo Tree Search dan temporal difference Tree Search pada permainan 2048 en_US
dc.type Undergraduate Theses en_US
dc.identifier.nim/npm NPM6181801034
dc.identifier.nidn/nidk NIDN0430117701
dc.identifier.kodeprodi KODEPRODI618#Teknik Informatika


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search UNPAR-IR


Advanced Search

Browse

My Account