Název: Hybrid syllable/triphone speech synthesis
Další názvy: Hybridní syntéza řeči s využitím slabik a trifónů
Autoři: Matoušek, Jindřich
Hanzlíček, Zdeněk
Tihelka, Daniel
Citace zdrojového dokumentu: MATOUŠEK, Jindřich; HANZLÍČEK, Zdeněk; TIHELKA, Daniel. Hybrid syllable/triphone speech synthesis. In: Proceedings of ICSPL 2005: 6th Annual Conference of the International Speech Communication Association 2005, Lisboa, Portugal, 4-8 September 2005. [Baixas]: ISCA, 2005, p. 2529-2532. ISSN 1990-9772.
Datum vydání: 2005
Nakladatel: ISCA
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/MatousekJ_2005_Hybrid
http://hdl.handle.net/11025/17025
ISSN: 1990-9772
Klíčová slova: automatické vytváření inventáře akustických jednotek;slabika;trifón;modelování­ slabik;syntéza řeči
Klíčová slova v dalším jazyce: automatic acoustic unit inventory creation;syllable;triphone;syllable modelling;speech synthesis
Abstrakt: V článku jsou zkoumány možnosti využití slabiky, alternativní fonetické jednotky k hlásce, v úloze syntézy řeči. Je zde navrženo a vyhodnoceno několik přístupů k modelování slabik v rámci statistického přístupu (s využitím skrytých Markovových modelů) k vytvoření inventáře akustických jednotek. Aby bylo možné syntetizovat libovolný text, byly slabičné inventáře doplněny o trifóny, což vedlo ke vzniku hybridních slabičných a trifónových inventářů. K hodnocení kvality výsledné syntetické řeči a ke zvolení nejlepšího přístupu k modelování slabik byly provedeny poslechové testy. Výsledná syntetická řeč je vysoce srozumitelná a plynulá. Ačkoliv syntetická řeč vytvářená na základě původního trifónového inventáře byla hodnocena o něco lépe, výsledky prvních experimentů s použitím slabik jsou velmi nadějné.
Abstrakt v dalším jazyce: In this paper, the syllable, an alternative phonetic unit to the phone, is researched in the context of speech synthesis. Several approaches to syllable modelling within the statistical approach (using hidden Markov models) to the acoustic unit inventory creation are proposed and evaluated. To be able to synthesize an arbitrary text, the syllable inventories were supplemented with triphones resulting in hybrid syllable/triphone inventories. Listening tests were accomplished both to assess the quality of the resulting synthetic speech produced using the hybrid syllable/triphone inventories and to choose the best approach to syllable modelling. The resulting synthetic speech is highly intelligible and fluent. Although the synthetic speech generated using the baseline triphone inventory was assessed slightly better, the results of the very first experiments with syllable modelling are very promising.
Práva: © Jindřich Matoušek - Zdeněk Hanzlíček - Daniel Tihelka
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
MatousekJ_2005_Hybrid.pdfPlný text100,93 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17025

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.