Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format
Digitale Medien-Ansicht
Modulnummer
|
M-MI-d |
Modulbezeichnung
|
Automatische Spracherkennung |
Titel (englisch)
|
Automatic Speech Recognition |
Pflicht/Wahl
|
Wahl |
Erklärung
|
|
CP
|
6 |
Berechnung des Workloads
|
|
Turnus
|
i. d. R. angeboten in jedem WiSe |
Dauer
|
ein Semester |
Form
|
3 SWS L, 1 SWS T |
Prüfung
|
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung |
Anforderungen
|
-- |
Lernziele
|
- In der Terminologie der automatischen Sprachverarbeitung kommunizieren können
- Die menschliche Sprachproduktion und -perzeption überblicken können
- Die theoretischen Grundlagen der Verarbeitung von Sprachsignalen kennen
- Die theoretischen Grundlagen der Modellierung von Sprache kennen und auf vorgegebene Einzelsituationen transferieren können.
- Den Aufbau eines automatischen Spracherkennungssystems kennen, die einzelnen Komponenten identifizieren und die Rolle der einzelnen Komponenten beschreiben können
- Die grundlegenden Algorithmen und Methoden der statistischen Modellierung kennen und anwenden können
- Aus gegebenen Daten und Werkzeugen ein Spracherkennungssystem praktisch entwickeln können
- Das Potenzial sowie die Grenzen moderner Spracherkennungstechnologien einschätzen können
|
Lerninhalte
|
- Sprachproduktion und -perzeption
- Signalverarbeitung und Merkmalsextraktion für Spracherkennung
- Komponenten eines Spracherkennungssystems: Akustisches Modell, Sprachmodell, Aussprachewörterbuch, Suche
- Akustisches Modell: statistische Modellierungsverfahren für Spracherkennung, Hidden-Markov-Modelle, Gauß-Mixtur-Modelle, Neuronale Netze
- Sprachmodell: N-Gram, Rekurrente Neuronale Netze
- Aussprachewörterbuch: Vokabularselektion, Generierung von Aussprachen
- Suche: Suchgraph, effiziente Suche
- Anwendung in multilingualen Kontexten
- Training und Adaption der Komponenten auf neue Situationen und neue Sprecher
- Evaluation eines Spracherkennungssystems und Identifikation von Fehlern
|
Quellen
|
- Folien (Englisch),
- Spracherkennungssoftware und exemplarische Sprachdaten,
- Xuedong Huang, Alex Acero and Hsiao-Wuen Hon, Spoken Language Processing, Prentice Hall PTR, NJ, 2001
|
Sprache
|
Deutsch |
Bemerkung
|
|
Zuletzt geändert
|
2018-04-17 09:02:52 UTC |
Zurück
Zeige
Systems Engineering-Format
Wirtschaftsinformatik-Format
Informatik-Format
Digitale Medien-Format