Aeberli, Jan and Schleutermann, Jürg (2018) Praktische Anwendung spieltheoretischer Ansätze für den Schieber Jass. Bachelor thesis, HSR Hochschule für Technik Rapperswil.
HS 2018 2019-BA-EP-Schleutermann-Aeberli-JassBot Heuristisch+.pdf - Supplemental Material
Download (18MB) | Preview
Abstract
Im Jahr 2017 initiierte die Firma Zühlke einen Wettbewerb, bei dem die Teilnehmer eigene Schieber Jass Bots entwickeln und gegeneinander antreten lassen konnten. Der Gewinner Bot dieses Wettbewerbs musste am Ende gegen ein Team von menschlichen Spielern bestehen. Da diese aber triumphierten, hat die Hochschule für Technik in Rapperswil beschlossen weiter an der Entwicklung von Jass Bots zu arbeiten. Dieser Forschungsarbeit entsprangen bisher zwei weitere Jass Bots, welche auf reinen Deep Learning Ansätzen basierten. Keinem der beiden Bots ist es aber gelungen den Gewinner Bot des Jass Wettbewerbs zu besiegen. Im Rahmen dieser Arbeit soll untersucht werden, inwiefern sich spieltheoretische Ansätze für den Schieber Jass eigenen und ob sich damit ein Bot entwickelt lässt, welcher den Gewinner Bot des Wettbewerbs schlagen kann.
In einer ersten Phase wurden vielversprechende Lösungsansätze aus der Spieltheorie identifiziert und der Schieber Jass im Detail analysiert. In einer zweiten Phase ist für jeden der Ansätze ein Jass Bot entwickelt worden. Insgesamt sind im Laufe der Arbeit drei Bots entstanden. Der erste Bot arbeitet mit Counter Factual Regret Minimization, kann aber aufgrund der Komplexität des Spiels nur in den beiden letzten Spielzügen eine Entscheidung treffen. Der zweite Bot stellt eine Erweiterung des ersten Ansatzes um eine Monte Carlo Komponente dar und ermöglicht dem Bot dadurch ein ganzes Spiel zu bestreiten. Der dritte Bot arbeitet mit einer Monte Carlo Tree Search, um den bestmöglichen Zug zu finden und kann ebenfalls in jeder Spielsituation Entscheidungen treffen. Damit die Bots verglichen werden können, wurde zudem eine Art virtueller Prüfstand entwickelt. Mit Hilfe dieses Prüfstands konnten in einer dritten Phase Experimente durchgeführt und die Resultate statistisch ausgewertet werden.
Die Resultate der Experimente zeigen, dass durch den Counter Factual Regret Minimization Algorithmus bereits eine kleine Verbesserung erreicht wurde. Die Monte Carlo Variante des Ansatzes konnte aber nicht die gewünschten Ergebnisse liefern und schnitt schlechter ab als der Gewinner Bot des Wettbewerbs. Die besten Resultate lieferte mit Abstand der Monte Carlo Tree Search Algorithmus. Mit Hilfe dieses Ansatzes konnte ein Bot entwickelt werden, welcher signifikant besser spielt. Ob der Bot allerdings auch gegen menschliche Spieler gewinnt, konnte im Rahmen dieser Arbeit nicht abschliessend geklärt werden. Stichproben haben jedoch gezeigt, dass Spiele gegen den Bot zumindest unterhaltsam sind.
Item Type: | Thesis (Bachelor) |
---|---|
Subjects: | Topics > Software > Optimization Topics > Software > Testing and Simulation Area of Application > Statistics Area of Application > Multimedia > Gaming Technologies > Programming Languages > Python |
Divisions: | Bachelor of Science FHO in Informatik > Bachelor Thesis |
Depositing User: | OST Deposit User |
Contributors: | Contribution Name Email Thesis advisor Stolze, Markus UNSPECIFIED |
Date Deposited: | 11 Mar 2019 14:16 |
Last Modified: | 11 Mar 2019 15:42 |
URI: | https://eprints.ost.ch/id/eprint/724 |