Title: | Hybrid syllable/triphone speech synthesis |
Other Titles: | Hybridní syntéza řeči s využitím slabik a trifónů |
Authors: | Matoušek, Jindřich Hanzlíček, Zdeněk Tihelka, Daniel |
Citation: | MATOUŠEK, Jindřich; HANZLÍČEK, Zdeněk; TIHELKA, Daniel. Hybrid syllable/triphone speech synthesis. In: Proceedings of ICSPL 2005: 6th Annual Conference of the International Speech Communication Association 2005, Lisboa, Portugal, 4-8 September 2005. [Baixas]: ISCA, 2005, p. 2529-2532. ISSN 1990-9772. |
Issue Date: | 2005 |
Publisher: | ISCA |
Document type: | článek article |
URI: | http://www.kky.zcu.cz/cs/publications/MatousekJ_2005_Hybrid http://hdl.handle.net/11025/17025 |
ISSN: | 1990-9772 |
Keywords: | automatické vytváření inventáře akustických jednotek;slabika;trifón;modelování slabik;syntéza řeči |
Keywords in different language: | automatic acoustic unit inventory creation;syllable;triphone;syllable modelling;speech synthesis |
Abstract: | V článku jsou zkoumány možnosti využití slabiky, alternativní fonetické jednotky k hlásce, v úloze syntézy řeči. Je zde navrženo a vyhodnoceno několik přístupů k modelování slabik v rámci statistického přístupu (s využitím skrytých Markovových modelů) k vytvoření inventáře akustických jednotek. Aby bylo možné syntetizovat libovolný text, byly slabičné inventáře doplněny o trifóny, což vedlo ke vzniku hybridních slabičných a trifónových inventářů. K hodnocení kvality výsledné syntetické řeči a ke zvolení nejlepšího přístupu k modelování slabik byly provedeny poslechové testy. Výsledná syntetická řeč je vysoce srozumitelná a plynulá. Ačkoliv syntetická řeč vytvářená na základě původního trifónového inventáře byla hodnocena o něco lépe, výsledky prvních experimentů s použitím slabik jsou velmi nadějné. |
Abstract in different language: | In this paper, the syllable, an alternative phonetic unit to the phone, is researched in the context of speech synthesis. Several approaches to syllable modelling within the statistical approach (using hidden Markov models) to the acoustic unit inventory creation are proposed and evaluated. To be able to synthesize an arbitrary text, the syllable inventories were supplemented with triphones resulting in hybrid syllable/triphone inventories. Listening tests were accomplished both to assess the quality of the resulting synthetic speech produced using the hybrid syllable/triphone inventories and to choose the best approach to syllable modelling. The resulting synthetic speech is highly intelligible and fluent. Although the synthetic speech generated using the baseline triphone inventory was assessed slightly better, the results of the very first experiments with syllable modelling are very promising. |
Rights: | © Jindřich Matoušek - Zdeněk Hanzlíček - Daniel Tihelka |
Appears in Collections: | Články / Articles (NTIS) Články / Articles (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MatousekJ_2005_Hybrid.pdf | Plný text | 100,93 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/17025
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.