In der Terminologie der automatischen Sprachverarbeitung kommunizieren können
Die menschliche Sprachproduktion und -perzeption überblicken können
Die theoretischen Grundlagen der Verarbeitung von Sprachsignalen kennen
Die theoretischen Grundlagen der Modellierung von Sprache kennen und auf vorgegebene Einzelsituationen transferieren können.
Den Aufbau eines automatischen Spracherkennungssystems kennen, die einzelnen Komponenten identifizieren und die Rolle der einzelnen Komponenten beschreiben können
Die grundlegenden Algorithmen und Methoden der statistischen Modellierung kennen und anwenden können
Aus gegebenen Daten und Werkzeugen ein Spracherkennungssystem praktisch entwickeln können
Das Potenzial sowie die Grenzen moderner Spracherkennungstechnologien einschätzen können
Lerninhalte
Sprachproduktion und -perzeption
Signalverarbeitung und Merkmalsextraktion für Spracherkennung
Komponenten eines Spracherkennungssystems: Akustisches Modell, Sprachmodell, Aussprachewörterbuch, Suche
Akustisches Modell: statistische Modellierungsverfahren für Spracherkennung, Hidden-Markov-Modelle, Gauß-Mixtur-Modelle, Neuronale Netze
Sprachmodell: N-Gram, Rekurrente Neuronale Netze
Aussprachewörterbuch: Vokabularselektion, Generierung von Aussprachen
Suche: Suchgraph, effiziente Suche
Anwendung in multilingualen Kontexten
Training und Adaption der Komponenten auf neue Situationen und neue Sprecher
Evaluation eines Spracherkennungssystems und Identifikation von Fehlern
Prüfungsformen
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
Dokumente (Skripte, Programme, Literatur, usw.)
Folien (Englisch),
Spracherkennungssoftware und exemplarische Sprachdaten,
Xuedong Huang, Alex Acero and Hsiao-Wuen Hon, Spoken Language Processing, Prentice Hall PTR, NJ, 2001
Lehrende: Prof. Dr.-Ing. Tanja Schultz, Jochen Weiner