maze – Traduction – Dictionnaire Keybot

Spacer TTN Translation Network TTN TTN Login Deutsch English Spacer Help
Langues sources Langues cibles
Keybot 5 Résultats  robotik.dfki-bremen.de
  MMLF - Softwaretools - ...  
MMLF Explorer showing a run of the TD(λ) agent in the pinball maze domain (Source: Jan Hendrik Metzen, Universität Bremen)
Illustration eines Durchlaufs eines TD(λ) Agenten in der Pinball Umgebung (Quelle: Jan Hendrik Metzen, Universität Bremen)
  MMLF - Softwaretools - ...  
Among the RL algorithms are TD(lambda), CMA-ES, Fitted R-Max, Monte-Carlo learning, the DYNA-TD and the actor-critic architecture. MMLF contains different variants of the maze-world and pole-balancing problem class as well as the mountain-car testbed and the pinball maze domain.
Das Maja Machine Learning Framework (MMLF) ist ein allgemeines Framework für Probleme im Bereich des Bestärkenden Lernens (Reinforcement Learning; RL), das in Python geschrieben ist. Es stellt Implementierungen einer Reihe von RL-Algorithmen und Benchmark-Problemen bereit. Des Weiteren ist es erweiterbar und ermöglicht die einfache Automatisierung der empirischen Auswertung verschiedener Agenten. Unter den implementierten RL-Algorithmen sind TD(lambda), CMA-ES, Fitted R-Max, Monte-Carlo, die DYNA-TD und die Actor-Critic Architektur. Das MMLF enthält verschiedene Varianten der klassisichen Labyrinth-Umgebung und des Pole-Balancing Problems sowie das Mountain Car Testproblem und die Pinball-Maze Domäne.
  MMLF - Softwaretools - ...  
A certain scenario which is studied is called a “world”. An example of such a scenario would be a robot that tries to find its way through a maze. In RL, the world is typically decomposed into the “agent(s)” and the “environment”.
Ein bestimmtes Test-Szenario wird im Rahmen des MMLS als „Welt“ bezeichnet. Ein Beispiel für ein solches Szenarion wäre ein Roboter, der versucht, einen Weg durch ein Labyrinth zu finden. Im RL wird eine Welt typischerweise in Agent(en) und Umgebung unterteilt. Im Beispiel wäre der Roboter der Agent und das Labyrinth die Umgebung. Das MMLF baut auf dieser Modellierung auf, da sie es erlaubt, allgemeingültige, lernfähige Agenten zu schreiben, die in einer Vielzahl von Umgebungen eingesetzt werden können. Das gesamte Lernen (die Optimierung des Verhaltens) findet im Agenten statt wohingegen die Simulation der Physik und anderer Arten von Dynamik in der Umgebung durchgeführt werden.
  MMLF - Softwaretools - ...  
Among the RL algorithms are TD(lambda), CMA-ES, Fitted R-Max, Monte-Carlo learning, the DYNA-TD and the actor-critic architecture. MMLF contains different variants of the maze-world and pole-balancing problem class as well as the mountain-car testbed and the pinball maze domain.
Das Maja Machine Learning Framework (MMLF) ist ein allgemeines Framework für Probleme im Bereich des Bestärkenden Lernens (Reinforcement Learning; RL), das in Python geschrieben ist. Es stellt Implementierungen einer Reihe von RL-Algorithmen und Benchmark-Problemen bereit. Des Weiteren ist es erweiterbar und ermöglicht die einfache Automatisierung der empirischen Auswertung verschiedener Agenten. Unter den implementierten RL-Algorithmen sind TD(lambda), CMA-ES, Fitted R-Max, Monte-Carlo, die DYNA-TD und die Actor-Critic Architektur. Das MMLF enthält verschiedene Varianten der klassisichen Labyrinth-Umgebung und des Pole-Balancing Problems sowie das Mountain Car Testproblem und die Pinball-Maze Domäne.
  MMLF - Softwaretools - ...  
A certain scenario which is studied is called a “world”. An example of such a scenario would be a robot that tries to find its way through a maze. In RL, the world is typically decomposed into the “agent(s)” and the “environment”.
Ein bestimmtes Test-Szenario wird im Rahmen des MMLS als „Welt“ bezeichnet. Ein Beispiel für ein solches Szenarion wäre ein Roboter, der versucht, einen Weg durch ein Labyrinth zu finden. Im RL wird eine Welt typischerweise in Agent(en) und Umgebung unterteilt. Im Beispiel wäre der Roboter der Agent und das Labyrinth die Umgebung. Das MMLF baut auf dieser Modellierung auf, da sie es erlaubt, allgemeingültige, lernfähige Agenten zu schreiben, die in einer Vielzahl von Umgebungen eingesetzt werden können. Das gesamte Lernen (die Optimierung des Verhaltens) findet im Agenten statt wohingegen die Simulation der Physik und anderer Arten von Dynamik in der Umgebung durchgeführt werden.