Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format
Informatik-Ansicht
Bestärkendes Lernen
Reinforcement Learning
|
Modulnummer
ME-712.03
|
Master
|
Zugeordnet zu Masterprofil
|
Modulbereich
:
Praktische und Technische Informatik
Modulteilbereich
:
712 Robotik
|
Anzahl der SWS
V |
UE |
K |
S |
Prak. |
Proj. |
∑ |
2 |
2 |
0 |
0 |
0 |
0 |
4 |
|
Kreditpunkte
:
6
|
Turnus
jährlich
|
Formale Voraussetzungen
:
-
|
Inhaltliche Voraussetzungen
:
Robot Design Lab oder Verhaltensbasierte Robotik
|
Vorgesehenes Semester
:
ab 1. Semester
|
Sprache
:
Englisch
|
Ziele
:
- Grundlegende Kenntnisse des Bestärkenden Lernens (engl.: RL)
- Kenntnisse der Anwendung und Anwendbarkeit von Lernverfahren für autonome Roboter
- Kenntnis der Problemklasse „Markovsches Entscheidungsproblem“ (MDP) und des Konzepts der Wertfunktionen
- Verständnis von Modell-bidenden (Dynamic Programming, Dyna-Architekturen) und Modell-freien (Monte-Carlo, Temporal Difference) Lernverfahren
- Kenntnisse der wichtigsten Methoden und Verfahren zur Explorationskontrolle beim RL
- Erlernen der Durchführung, Auswertung und Präsentation von empirischen Untersuchungen von Lernverfahren
- Einarbeitung in die Literatur des aktuellen Stands der Technik
|
Inhalte
:
- Grundlagen des Bestärkenden Lernens (engl.: RL)
- Problemklassen und Anwendungen für das Bestärkende Lernen
- Grundlegende Probleme und Verfahren der Explorationskontrolle beim RL
- Fortgeschrittene und aktuelle Themen des Bestärkenden Lernens (bspw. Direct Policy Search, Hierachisches RL, Deep RL, Multi-Agenten RL …)
Insbesondere werden folgende theoretisch/methodische Grundlagen im Zusammenhang dieser Inhalte behandelt:
- Theorie Markovscher Entscheidungsprozesse
- Theorie des Dynamic Programming (Policy Iteration, Value Iteration)
- Theorie der Monte Carlo Methoden
- Theorie des Temporal Difference Lernens
- Theorie von Modell-bildenden Verfahren
- Einarbeitung und Verständnis von wissenschaftlichen Veröffentlichungen
- Auswertung und Präsentation von Analysen / Algorithmen
- Anfertigung von Diagrammen auf wissenschaftlichem Niveau
- Anwendung von RL auf echten Systemen
|
Unterlagen (Skripte, Literatur, Programme usw.)
:
Sutton, R., Barto, A. ‘Reinforcement Learning: An Introduction’, MIT-Press (1998)
|
Form der Prüfung
:
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
|
Arbeitsaufwand
Präsenz |
56 |
Übungsbetrieb/Prüfungsvorbereitung |
124 |
Summe |
180 h |
|
Lehrende:
Prof. Dr. F. Kirchner u.a.
|
Verantwortlich
Prof. Dr. F. Kirchner
|
Zurück
Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format