i

Verhalten aus der Q-Tabelle

Aufgabe 1: Ausgabe der möglichen Aktionen

Ergänze die Funktion beste_aktion am Anfang um einige Programmzeilen, die mit einer Schleife nacheinander alle Aktionen ausgeben, die bei Situation Nr. s möglich sind.
Tipp: Die Liste kann in Python einfach durchlaufen werden mit
for a in moegliche_aktionen:
    # tue irgendwas mit dem Listenelement a

Aufgabe 2: Zugriff auf Werte der Q-Tabelle

Ergänze die Funktion beste_aktion so, dass zu den
möglichen Aktionen auch die entsprechenden Q-Werte angezeigt werden.

Tipp: Der Q-Wert zu Situation 5
und Aktion 3 kann ausgegeben werden mit

print(Q[5][3])    

Aufgabe 3: Bestimmung des Verhaltens aus der Q-Tabelle

Ändere die Funktion beste_aktion so ab, dass die
hartkodierten if-Anweisungen wieder gelöscht werden.
Stattdessen soll für die Situation s durch eine Schleife
die beste Aktion, also die mit dem größten Q-Wert gefunden werden. Die
Nummer dieser besten Aktion soll dann das Ergebnis der Funktion sein, also mit
return zurück gegeben werden.
Dabei sollen nur die
Aktionen betrachtet werden, die in der Liste
moegliche_aktionen stehen.

Aufgabe 4: Test

Teste das Verhalten des Programms, indem du spiel_ki.py startest und dir den Spielverlauf anschaust.

Suche

v
12.8.4.2
www.inf-schule.de/gesellschaft/reinforcement-learning/weich-kodierte-intelligenz/verhalten-aus-q

Rückmeldung geben