Gefangenendilemma, iteriertes Gefangenendilemma und die Berechenbarkeit von Kooperation und Nichtkooperation
Von Rechtsanwalt Matthias Schütz
Der Beitrag des vergangenen Monats beschäftigte sich mit den spieltheoretischen Erkenntnissen von Robert Axelrod zu Kooperation (Die Evolution der Kooperation, München Oldenburg, 1988). Insbesondere wurden die Ergebnisse seiner Arbeit zur strategischen Frage, wann wir uns in Situationen, in denen unser Erfolg sowohl durch unser eigenes Verhalten als auch das anderer bestimmt wird (Nicht-Null-Summen-Spiel), kooperativ verhalten sollten und wann es vorteilhafter ist, egoistisch zu agieren sowie dessen Anwendbarkeit auf die (Be)Förderung der Kooperation zwischen den Mediationsparteien in Grundzügen skizziert.
Die Überlegungen von Axelrod basieren auf dem spieltheoretischen Modell des Gefangenendilemmas sowie dessen Weiterführung des sogenannten „iterierten Gefangendilemmas“.
Im Folgenden sollen das Gefangenendilemma, das iterierte Gefangenendilemma sowie die Berechenbarkeit von Kooperation und Nichtkooperation in Ergänzung des Februarbeitrags noch einmal dargestellt werden.
Die klassische Situation des Gefangenendilemmas unterscheidet sich von der eines Nullsummen-Spiels, dadurch, dass der Gewinn der einen Seite nicht direkt dem Verlust der anderen Seite entspricht. Die Parteien haben vielmehr (teilweise) gleiche Ziele und ihre Interessen überschneiden sich. Sie können ihre Ziele nur gemeinsam erreichen, indem sie zumindest in bestimmten Punkten kooperieren. Im Falle einer Verweigerung der Kooperation riskieren sie ein für beide Seiten schlechteres Ergebnis.
Bezogen auf das namensgebende Ausgangsbeispiel der beiden Gefangenen, die wegen einer gemeinsam begangenen Tat getrennt voneinander vernommen werden, gibt es im Hinblick auf eine Kooperation immer zwei Möglichkeiten: entweder die Mithäftlinge kooperieren oder sie kooperieren nicht. Mit anderen Worten heißt das, sie sagen aus oder sie verweigern die Aussage.
Daraus ergeben sich vier mögliche Konstellationen:
-
Gefangener 1 gesteht und kann als Kronzeuge damit rechnen, nicht bestraft zu werden. Gefangener 2 sagt nicht aus und wird aber aufgrund der Aussage von Gefangenem 1 voll bestraft.
-
Gefangener 2 sagt aus, Gefangener 1 schweigt (wie zuvor, nur in umgekehrter Weise).
-
Beide Gefangenen gestehen und werden verurteilt. Ein Geständnis ist aber nicht so wertvoll wie in den ersten beiden Konstellationen. Die Tatsache eines Geständnisses mildert aber dennoch die Strafe ein wenig ab, so dass sie geringer ausfällt als die des nicht aussagenden Gefangenen in den ersten beiden Alternativen.
-
Beide Gefangene schweigen und können aufgrund fehlender Beweise nur wegen eines leichteren Delikts verurteilt werden; die Strafe für beide ist deshalb deutlich leichter als in den vorangehenden Fällen.
Ausgehend von diesen Möglichkeiten kann sich jeder der beiden überlegen, was der andere tun wird und danach seine eigene Strategie ausrichten. Gesteht der andere, so ist besser selbst auch auszusagen, da sonst eine harte alleinige Verurteilung droht. Geben beide alles zu, so kommt es zu Verurteilung und die Strafe wird härter sein, als wenn beide die Aussage verweigern würden.
Setzt man diese Konstellation in Zahlen um, indem man jeder möglichen Konstellation einen Spielwert zuordnet, so wird das Gefangenendilemma "berechenbar".
Danach ergibt sich bezogen auf den einzelnen Spieler folgende Reihenfolge: die höchste Punktzahl kann er erreichen, wenn es ihm gelingt, die Kooperationsbereitschaft der anderen Seite auszunutzen (5 Punkte). 3 Punkte erhält er, wenn beide kooperieren, 1 Punkt, wenn beide eine Kooperation verweigern und null Punkte, wenn die andere Seite seine Kooperationsbereitschaft ausnutzt.
Ist in einem solchen Nicht-Null-Summen-Spiel zusätzlich davon auszugehen, dass die Mitspieler mehrfach oder immer wieder aufeinandertreffen, so wird diese Situation mit dem Modell des sogenannten "iterierten Gefangenendilemmas" beschrieben.
Spielen die Spieler immer wieder das Spiel einer Entscheidung zwischen Kooperation und Nichtkooperation, so relativiert sich die oben dargestellte Punktereihenfolge. Durch die Wiederholung der Interaktionen können und müssen die Spieler erwarten, dass im Unterschied zu einer einmaligen Situation, ihr Spielverhalten der vorausgehenden Runde, Auswirkungen in der nächsten Runde und die erneute Entscheidung, zu kooperieren oder eine Kooperation zu verweigern, haben wird.
Es ist unwahrscheinlich, dass sich eine Seite immer wieder ausnutzen lassen wird. Die Folge einer einseitigen Verweigerung der Kooperation, ist dann die Verweigerung derselben durch die andere Seite in der nächsten Runde.
Setzt man dieses Verhalten in eine Berechnung mit den Punktwerten um, so zeigt sich, dass bei mehreren Wiederholungen der Interaktionen eine Kooperation besser ist als der Wechsel von ausnutzen und ausgenutzt werden (5 : 2 = 2,5 Punkte anstatt 3 Punkte).
Hiervon ausgehend versuchte Axelrod festzustellen, wie man das Spiel des "iterierten Gefangenendilemmas" gut spielt, und welche Faktoren für einen erfolgreichen Spielverlauf maßgeblich sind. Zu diesem Zweck veranstaltete er ein Computerprogrammturnier.
Die Regeln für das Turnier waren einfach. Jedes am Wettbewerb teilnehmende Programm musste pro Zug zwischen Kooperation und Verweigerung der Kooperation entscheiden, ohne zu wissen, wie sich die andere Seite entscheidet. Die Entscheidung hierzu fällte es einerseits aufgrund seiner Programmierung, andererseits aufgrund der Erfahrungen der schon vollzogenen Züge. Jedes Programm trat gegen jedes andere an. Weiterhin spielte jedes Programm gegen sich selber und gegen ein Programm, das seine Entscheidungen per Zufall fällte. Es wurden pro Spiel 200 Züge ausgeführt und jedes Duell wurde der Genauigkeit halber fünf Mal wiederholt. Gewonnen hatte das Programm das im Durchschnitt aus allen Partien, die höchste Punktzahl erreichte.
Aus den Endresultaten des Turniers und weiteren Berechnungen zog er nicht nur Rückschlüsse auf die beste Strategie, sondern auch auf die Anforderungen an optimale Rahmenbedingungen für einen guten Spielverlauf. Die auf den Erkenntnissen des Turniers abgeleiteten Regeln, wie man z.B. durch aktive Einflussnahme sowohl auf die äußeren Umstände als auch auf die Parteien selbst einwirken kann, um ein kooperatives und für beide Seiten vorteilhaftes Interagieren der Parteien zu erreichen, sind in Grundzügen im Februarbeitrag dargestellt.