Automatische Spracherkennung
Automatic Speech Recognition
|
Modulnummer
MB-711.13
|
Master
|
Zugeordnet zu Masterprofil
|
Modulbereich
:
Praktische und Technische Informatik
Modulteilbereich
:
711 Kognitive Systeme
|
Anzahl der SWS
V |
UE |
K |
S |
Prak. |
Proj. |
∑ |
3 |
1 |
0 |
0 |
0 |
0 |
4 |
|
Kreditpunkte
:
6
|
Turnus
i. d. R. angeboten in jedem WiSe
|
Formale Voraussetzungen
:
-
|
Inhaltliche Voraussetzungen
:
-
|
Vorgesehenes Semester
:
ab 1. Semester
|
Sprache
:
Deutsch
|
Ziele
:
- In der Terminologie der automatischen Sprachverarbeitung kommunizieren können
- Die menschliche Sprachproduktion und -perzeption überblicken können
- Die theoretischen Grundlagen der Verarbeitung von Sprachsignalen kennen
- Die theoretischen Grundlagen der Modellierung von Sprache kennen und auf vorgegebene Einzelsituationen transferieren können.
- Den Aufbau eines automatischen Spracherkennungssystems kennen, die einzelnen Komponenten identifizieren und die Rolle der einzelnen Komponenten beschreiben können
- Die grundlegenden Algorithmen und Methoden der statistischen Modellierung kennen und anwenden können
- Aus gegebenen Daten und Werkzeugen ein Spracherkennungssystem praktisch entwickeln können
- Das Potenzial sowie die Grenzen moderner Spracherkennungstechnologien einschätzen können
|
Inhalte
:
- Sprachproduktion und -perzeption
- Signalverarbeitung und Merkmalsextraktion für Spracherkennung
- Komponenten eines Spracherkennungssystems: Akustisches Modell, Sprachmodell, Aussprachewörterbuch, Suche
- Akustisches Modell: statistische Modellierungsverfahren für Spracherkennung, Hidden-Markov-Modelle, Gauß-Mixtur-Modelle, Neuronale Netze
- Sprachmodell: N-Gram, Rekurrente Neuronale Netze
- Aussprachewörterbuch: Vokabularselektion, Generierung von Aussprachen
- Suche: Suchgraph, effiziente Suche
- Anwendung in multilingualen Kontexten
- Training und Adaption der Komponenten auf neue Situationen und neue Sprecher
- Evaluation eines Spracherkennungssystems und Identifikation von Fehlern
|
Unterlagen (Skripte, Literatur, Programme usw.)
:
- Folien (Englisch),
- Spracherkennungssoftware und exemplarische Sprachdaten,
- Xuedong Huang, Alex Acero and Hsiao-Wuen Hon, Spoken Language Processing, Prentice Hall PTR, NJ, 2001
|
Form der Prüfung
:
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
|
Arbeitsaufwand
Präsenz |
56 |
Übungsbetrieb/Prüfungsvorbereitung |
124 |
Summe |
180 h |
|
Lehrende:
Prof. Dr.-Ing. Tanja Schultz, Jochen Weiner
|
Verantwortlich
Prof. Dr.-Ing. Tanja Schultz
|