AlphaZero ist das von Google entwickelte Schachprogramm, welches in einem Match den Computerweltmeister (Stockfish) schlug. Nun, all das wäre eigentlich keine News wert. Computerprogramme entwickeln sich und immer mal wieder krönt sich ein anderes Programm zum Sieger. Doch dieses Mal ist es anders:
Herkömmliche Schachprogramme benutzen ein Eröffnungsbuch, sowie Tablebases und ähnliche Methoden. Im Klartext bedeutet das: Die ersten Züge sind im Computer in einem Eröffnungsbuch eingespeichert. Sprich, eine Art Gedächtnis das den Programmen hilft nicht gleich im ersten Zug Unmengen an Zeit zu verschwenden. Natürlich sind in diesen Eröffnungsbücher eine Vielzahl an Varianten eingespeichert; über jegliche denkbare Eröffnung. Tablebases sind Dateien, die es dem Programm ermöglichen ab einer gewissen Anzahl von x Figuren, die bestmöglichen Züge zu spielen – und das bei jeder denkbaren Konstellation. Sie werden zumeist als „3, 4, 5 oder 6-Steiner“ gehandelt. Exklusive den beiden Königen bedeutet das, dass bis zu 4 weitere Figuren am Brett sein können ohne dass der Computer rechnen müsste. Er hat einfach alle möglichen Variationen an Stellungen und Figuren eingespeichert. Dieses Wissen spielt z.B. das Matt mit Läufer + Springer perfekt, oder das Endspiel Dame gegen Turm (welches im Übrigen nicht so leicht ist wie es sich anhört).
Mit diesem Hintergrundwissen nun zu AlphaZero. AlphaZero kommt ohne jeglichen Zusatzinformationen aus. Das einzige was man „ihm“ mitgab, waren die Schachregeln. Danach spielte das Programm gegen sich selbst. Und das ganze 24 (!) Stunden lang. In diesen Stunden erlernte das Programm z.B. favorisierende Eröffnungen oder taktische Ideen wie Opfer. Nach diesen gerademal 24 Stunden (man kann es einfach nicht oft genug betonen) schlug das Programm den Computerweltmeister Stockfish mit 64:36. Aus 100 Spielen gewann das Programm 28 (25 mit weiß, 3 mit Schwarz), der Rest wurde remisiert (Bedenkzeit 1 Sekunde pro Zug). Der „Alte-Meister“ konnte also nicht mal einen einzigen Sieg verbuchen!
Noch interessanter sind die Kernaussagen dieses Matches:
(1) Da das Programm nicht von Menschen beeinflusst worden ist, haben wir quasi einen objektiven Spezialisten der sich das Spiel ohne äußeren Einflüsse beigebracht hat. Der Wert davon wird ersichtlich, wenn es z.B. nach Eröffnungen geht: konnten Eröffnungen widerlegt werden? Oder viel wichtiger: Stimmen die Eröffnungen die AlphaZero spielt mit unseren Eröffnungskenntnissen überhaupt überein? Glücklicherweise ja, „unsere“ Eröffnungen sind anscheinend nicht so schlecht ;). Es gibt auch einige parallelen bezüglich der Spielstärke: Chess24 berichtet, dass z.B. die Französische Verteidigung mit steigender Spielstärke von AlphaZero nicht favorisiert wird. Dies ist auch im Spitzenschach der Fall, wo diese Eröffnung nur vereinzelt gespielt wird. Ganz anders sieht es natürlich im Amateur Bereich aus. Hier ist diese Eröffnung durchaus sehr beliebt und auch AlphaZero spielte sie auf „niedrigeren“ Stufen, kam jedoch schlussendlich eher davon ab.
(2) Anhand der Mehrzahl an Weiß-Siegen kann man davon ausgehen, dass Weiß tatsächlichen einen Anzugsvorteil hat. Das wird viele zwar nicht überraschen, aber eine „objektive Beurteilung“ fehlte noch. Zwar ist es beim Menschen so, dass Weiß öfter die Spiele gewinnt, jedoch verschwindet dieser Anzugsvorteil mit steigender Elo (Spielstärke). Man befürchtete bereits früh (Anfang 20 Jhdt.), dass es bald zu einer Remisflut im Spitzenschach kommen könnte. AlphaZero hat gezeigt, dass es auch für Schach durchaus noch Luft nach oben gibt.
Ich empfehle jeden sich die Partien im Internet anzusehen. Es ist verblüffend wie AlphaZero spielt – nämlich so gar nicht „maschinell“. Eher wie ein menschliches Genie. Ein Genie, dessen Wert der Züge man erst wesentlich später erkennt. Faszinierend.
Links: Chess24 , Chessbase (eng), YouTubeLink (englisch) zu einem Beispielvideo