i

Das bisherige Verfahren bei Chancen und Risiken

Aufgabe 1: Unerwartet schlechte Lernerfahrung

Beschreibe, wie unser bisheriges Lernverfahren jeweils reagieren würde, wenn eine aus der bisherigen langen Erfahrung heraus als sehr gut eingeschätzte Aktion einer bestimmten Situation plötzlich einmal ganz unerwartet ein sehr schlechtes Ergebnis bringt. Überlege Dir auch, was das für die künftigen gierig gewählten Aktionen im gleichen Zustand bedeutet.

Aufgabe 2: Unerwartet gute Lernerfahrung

Beschreibe, wie unser bisheriges Lernverfahren jeweils reagieren würde, wenn eine aus der bisherigen langen Erfahrung heraus als eher schlecht eingeschätzte Aktion, die durch Neugier wieder einmal ausgewählt wird, plötzlich einmal ganz unerwartet ein sehr gutes Ergebnis bringt. Überlege Dir auch, was das für die künftigen gierig gewählten Aktionen im gleichen Zustand bedeutet.

Aufgabe 3: Umgang mit unerwarteten Erfahrungen

Beschreibe, inwiefern die Auswirkungen, die Du in den beiden vorangegangen Aufgaben überlegt hast, für das Lernverfahren tatsächlich wünschenswert sind. Gäbe es eine bessere Alternative?

Suche

v
12.8.6.1
www.inf-schule.de/gesellschaft/reinforcement-learning/umgang-mit-chancen-und-risiken/bisheriges-verfahren-und-zufall

Rückmeldung geben