Diskussion:Markow-Entscheidungsproblem
Letzter Kommentar: vor 10 Jahren von 109.90.216.187 in Abschnitt Belohnungsfunktion
Belohnungsfunktion[Quelltext bearbeiten]
Die Belohnungsfunktion ist in der Regel eine Abbildung auf den State Action Space, nicht auf den State Space.