- Start
- Algorithmen zur Störgeräuschunterdrückung mit differenziellen Mikrofonanordnungen für automatische Spracherkennungssysteme
Algorithmen zur Störgeräuschunterdrückung mit differenziellen Mikrofonanordnungen für automatische Spracherkennungssysteme
Angebote / Angebote:
Die vorliegende Arbeit zeigt mehrere neue Algorithmen zur effektiven Störgeräuschunterdrückung für differenzielle Mikrofonanordnungen (DMA). Die Algorithmen basieren einerseits auf der Nullstellensteuerung mit Hilfe der blinden Quellentrennung und andererseits auf der binären Maskierung. Im Unterschied zu konventionellen Mikrofonarrays, welche prinzipbedingt mit konvolutiv
überlagerten Signalen arbeiten müssen, erlauben die besonderen Eigenschaften von DMAs den Einsatz von Algorithmen zur blinden Quellentrennung von instantan überlagerten Signalen. Die Algorithmen sind in diesem Fall mit wesentlich geringerem Rechenaufwand, höherer Stabilität und schnellerer Konvergenz lösbar.
Die winkelabhängige binäre Maskierung verringert die relativ große Hauptkeule einer DMA effektiv und erlaubt damit das Filtern von Quellen mit einem Abstand von 30° und weniger. Weiterhin wird ein entfernungsabhängiges Filter auf Basis der binären Maskierung vorgestellt, dessen Wirkungsweise einem physisch ausgedehnten Mikrofonarray mit Nahfeld-Beamforming ähnlich ist. Die flexible Ausrichtung der Richtcharakteristik wird durch eine zweidimensionale DMA demonstriert, mit welcher die vorgenannten Algorithmen ebenfalls erfolgreich getestet werden.
Alle vorgestellten Algorithmen werden in einem realen Raum mit einer oder zwei Störquellen evaluiert. Als Störquellen kommen Sprecher zum Einsatz, die gleichzeitig mit dem Nutz-Sprecher aktiv sind. Zur Evaluierung wird der SNR und die Erkennungsrate eines Spracherkenners mit zwei verschieden komplexen Korpora genutzt. Es werden dabei Verbesserungen von bis zu 60 Prozentpunkten erreicht.
Folgt in ca. 5 Arbeitstagen