|
Ein bestimmtes Test-Szenario wird im Rahmen des MMLS als „Welt“ bezeichnet. Ein Beispiel für ein solches Szenarion wäre ein Roboter, der versucht, einen Weg durch ein Labyrinth zu finden. Im RL wird eine Welt typischerweise in Agent(en) und Umgebung unterteilt. Im Beispiel wäre der Roboter der Agent und das Labyrinth die Umgebung. Das MMLF baut auf dieser Modellierung auf, da sie es erlaubt, allgemeingültige, lernfähige Agenten zu schreiben, die in einer Vielzahl von Umgebungen eingesetzt werden können. Das gesamte Lernen (die Optimierung des Verhaltens) findet im Agenten statt wohingegen die Simulation der Physik und anderer Arten von Dynamik in der Umgebung durchgeführt werden.
|