Název: | Online speaker adaptation of an acoustic model using face recognition |
Další názvy: | Online adaptace akustického modelu na řečníka s využitím systému pro rozpoznávání obličejů |
Autoři: | Campr, Pavel Pražák, Aleš Psutka, Josef V. Psutka, Josef |
Citace zdrojového dokumentu: | CAMPR, Pavel; PRAŽÁK, Aleš; PSUTKA, Josef V.; PSUTKA, Josef. Online speaker adaptation of an acoustic model using face recognition. In: Text, speech and dialogue. Berlin: Springer, 2013, p. 378-385. (Lectures notes in computer science; 8082). ISBN 978-3-642-40584-6. |
Datum vydání: | 2013 |
Nakladatel: | Springer |
Typ dokumentu: | článek article |
URI: | http://www.kky.zcu.cz/cs/publications/CamprPavel_2013_OnlineSpeaker http://hdl.handle.net/11025/17203 |
ISBN: | 978-3-642-40584-6 |
Klíčová slova: | akustický model;adaptace na řečníka;rozpoznávání obličeje;multimodální zpracování;automatické rozpoznávání řeči |
Klíčová slova v dalším jazyce: | acoustic model;speaker adaptation;face recognition;multimodal processing;automatic speech recognition |
Abstrakt v dalším jazyce: | We have proposed and evaluated a novel approach for online speaker adaptation of an acoustic model based on face recognition. Instead of traditionally used audio-based speaker identification we investigated the video modality for the task of speaker detection. A simulated on-line transcription created by a Large-Vocabulary Continuous Speech Recognition (LVCSR) system for online subtitling is evaluated utilizing speaker independent acoustic models, gender dependent models and models of particular speakers. In the experiment, the speaker dependent acoustic models were trained offline, and are switched online based on the decision of a face recognizer, which reducedWord Error Rate (WER) by 12% relatively compared to speaker independent baseline system. |
Práva: | © Pavel Campr - Aleš Pražák - Josef V. Psutka - Josef Psutka |
Vyskytuje se v kolekcích: | Články / Articles (NTIS) Články / Articles (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
CamprPavel_2013_OnlineSpeaker.pdf | Plný text | 264,95 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/17203
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.