Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format
System Engineering-Ansicht
Modultyp
Vertiefung
|
Pflichtmodul
|
Wahlbereich
|
Spezialisierungsbereich
|
Anzahl Semesterwochenstunden |
CP |
Angeboten in jedem |
V |
Ü |
S |
P |
Proj. |
∑ |
Anzahl |
Bestärkendes Lernen
|
2 |
2 |
0 |
0 |
0 |
4 |
6 |
jährlich |
Reinforcement Learning |
|
|
|
|
Berechnung des Workloads |
|
Vorgesehenes Semester ab 1. Semester |
Lernziele
- Grundlegende Kenntnisse des Bestärkenden Lernens (engl.: RL)
- Kenntnisse der Anwendung und Anwendbarkeit von Lernverfahren für autonome Roboter
- Kenntnis der Problemklasse „Markovsches Entscheidungsproblem“ (MDP) und des Konzepts der Wertfunktionen
- Verständnis von Modell-bidenden (Dynamic Programming, Dyna-Architekturen) und Modell-freien (Monte-Carlo, Temporal Difference) Lernverfahren
- Kenntnisse der wichtigsten Methoden und Verfahren zur Explorationskontrolle beim RL
- Erlernen der Durchführung, Auswertung und Präsentation von empirischen Untersuchungen von Lernverfahren
- Einarbeitung in die Literatur des aktuellen Stands der Technik
Lerninhalte
- Grundlagen des Bestärkenden Lernens (engl.: RL)
- Problemklassen und Anwendungen für das Bestärkende Lernen
- Grundlegende Probleme und Verfahren der Explorationskontrolle beim RL
- Fortgeschrittene und aktuelle Themen des Bestärkenden Lernens (bspw. Direct Policy Search, Hierachisches RL, Deep RL, Multi-Agenten RL …)
Insbesondere werden folgende theoretisch/methodische Grundlagen im Zusammenhang dieser Inhalte behandelt:
- Theorie Markovscher Entscheidungsprozesse
- Theorie des Dynamic Programming (Policy Iteration, Value Iteration)
- Theorie der Monte Carlo Methoden
- Theorie des Temporal Difference Lernens
- Theorie von Modell-bildenden Verfahren
- Einarbeitung und Verständnis von wissenschaftlichen Veröffentlichungen
- Auswertung und Präsentation von Analysen / Algorithmen
- Anfertigung von Diagrammen auf wissenschaftlichem Niveau
- Anwendung von RL auf echten Systemen
|
Prüfungsformen
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
|
Dokumente (Skripte, Programme, Literatur, usw.)
Sutton, R., Barto, A. ‘Reinforcement Learning: An Introduction’, MIT-Press (1998)
|
Lehrende: Prof. Dr. F. Kirchner u.a. |
Verantwortlich: Prof. Dr. F. Kirchner |
Zurück
Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format