Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorIrcing, Pavel
dc.contributor.authorPsutka, Josef
dc.contributor.authorPsutka, Josef V.
dc.date.accessioned2016-01-08T07:39:58Z
dc.date.available2016-01-08T07:39:58Z
dc.date.issued2009
dc.identifier.citationIRCING, Pavel; PSUTKA, Josef; PSUTKA, Josef V. Using morphological information for robust language modeling in czech ASR system. In: Audio, speech, and language processing, 17, 4, p. 840-847. ISSN 1558-7916.en
dc.identifier.issn1558-7916
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/IrcingPavel_2009_UsingMorphological
dc.identifier.urihttp://hdl.handle.net/11025/17177
dc.description.abstractČlánek ukazuje, že použití bohatých morfologických značek v rámci třídového n-gramového jazykového modelu a kombinace tohoto modelu se standardním slovním n-gramovým modelem může zlepšit přesnost rozpoznávání oproti slovnímu modelu v úloze automatického přepisu spontánních českých rozhovorů.cs
dc.format8 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherIEEE Pressen
dc.rights© Pavel Ircing - Josef V. Psutka - Josef Psutkacs
dc.subjectsyntéza řečics
dc.subjectrozpoznávánícs
dc.subjectjazykové modelovánícs
dc.titleUsing morphological information for robust language modeling in czech ASR systemen
dc.title.alternativeVyužití morfologické informace pro robustní jazykové modelování v českém ASR systémucs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessopenAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedAutomatic speech recognition, or more precisely language modeling, of the Czech language has to face challenges that are not present in the language modeling of English. Those include mainly the rapid vocabulary growth and closely connected unreliable estimates of the language model parameters. These phenomena are caused mostly by the highly inflectional nature of the Czech language. On the other hand, the rich morphology together with the well-developed automatic systems for morphological tagging can be exploited to reinforce the language model probability estimates. This paper shows that using rich morphological tags within the concept of class-based n-gram language model with many-to-many word-to-class mapping and combination of this model with the standard word-based n-gram can improve the recognition accuracy over the word-based baseline on the task of automatic transcription of unconstrained spontaneous Czech interviews.en
dc.subject.translatedspeech synthesisen
dc.subject.translatedrecognitionen
dc.subject.translatedlanguage modellingen
dc.type.statusPeer-revieweden
Vyskytuje se v kolekcích:Články / Articles (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
IrcingPavel_2009_UsingMorphological.pdfPlný text418,48 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17177

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.