|
Advanced Signal Processing & Communications Engineering (Master of Science) >>
|
Sprach- und Audiosignalverarbeitung (SASP)
- Dozent/in
- Prof. Dr.-Ing. Walter Kellermann
- Angaben
- Vorlesung
3 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
nur Fachstudium, Sprache Englisch
Zeit und Ort: Mo 14:15 - 15:45, H5; Di 08:15 - 09:45, H5
- Studienfächer / Studienrichtungen
- WPF EEI-BA-INT 5-6
WPF EEI-MA-INT 1-4
WPF CE-MA-TA-IT 1-4
WPF IuK-MA-ES-EEI 1-4
WPF IuK-MA-KN-EEI 1-4
WPF IuK-MA-MMS-EEI 1-4
WPF IuK-MA-REA-EEI 1-4
WPF IuK-BA 5-6
WPF ICT-MA-ES 1-4
WPF ICT-MA-MPS 1-4
WPF WING-MA 1-3
WPF WING-MA-ET-IT 1-3
PF CME-MA 2
WPF ASC-MA 1-4
WPF MT-MA-MEL 1-4
- Voraussetzungen / Organisatorisches
- Voraussetzung: Vorlesung Signale und Systeme I +II
Die Vorlesungen werden semesterbegleitend aufgezeichnet und über StudOn zur Verfügung gestellt bis ein regulärer Präsenzbetrieb wieder möglich ist. Bei StudOn finden Sie ebenfalls das Vorlesungsskript als PDF-Datei sowie aktuelle Informationen zur Vorlesung und Übung.
- Inhalt
- Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:
Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;
Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;
Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)
Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models
Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese
Signalverbesserung bei Signalaufnahme und -wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren.
- Empfohlene Literatur
- Gemäß themenbezogenen Angaben in der Lehrveranstaltung
- ECTS-Informationen:
- Title:
- Speech and Audio Signal Processing
- Credits: 5
- Prerequisites
- Prerequisite: Lecture Signals and Systems I + II
Recordings of each lecture will be made availabe via StudOn until regular face-to-face events can take place again. On StudOn, you also find the lecture notes as PDF file as well as the latest information about the lecture and its supplements.
- Contents
- The course concentrates on algorithms for speech and audio signal processing with applications in telecommunications and multimedia, especially
Human Speech Production and Hearing: Source-Filter-Model, Filterbank Model of Cochlea; Masking effects;
Signal Representation for Speech and Audio: Estimation and representation of short-term and long-term statistics in time domain, frequency domain, and cepstral domain; typical examples and visualisations;
Source Coding for Speech and Audio: criteria; scalar and vectorial quantization and coding; linear prediction; pitch prediction; waveform/ parameter/ hybrid coding; standards (ITU, GSM, ISO-MPEG)
Fundamental Concepts of Automatic Speech Recognition: Feature extraction, Dynamic Time Warping, Hidden Markov Models
Fundamental Concepts of Speech Synthesis: Text-to-Speech systems, modell-based and data-driven synthesis, PSOLA synthesis
Signal enhancement for acquisition and reproduction: Noise reduction, echo cancellation, dereverberation using single-channel and multichannel algorithms.
- Literature
- Recommendations for each topic are given during the lectures
- Zusätzliche Informationen
- Erwartete Teilnehmerzahl: 48, Maximale Teilnehmerzahl: 75
www: https://www.studon.fau.de/crs174396.html
- Zugeordnete Lehrveranstaltungen
- UE: Übung zur Sprach- und Audiosignalverarbeitung
-
Dozent/in: Mhd Modar Halimeh, M. Sc.
www: https://www.studon.fau.de/crs174396.html
- Verwendung in folgenden UnivIS-Modulen
- Startsemester SS 2021:
- Sprach- und Audiosignalverarbeitung (SAV)
- Institution: Lehrstuhl für Multimediakommunikation und Signalverarbeitung
|
 |
 |
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|