Název: Listening-test-based annotation of communicative functions for expressive speech synthesis
Další názvy: Anotace expresivního řečového korpusu komunikačními funkcemi pomocí poslechového testu
Autoři: Grůber, Martin
Matoušek, Jindřich
Citace zdrojového dokumentu: GRŮBER, Martin; MATOUŠEK, Jindřich. Listening-test-based annotation of communicative functions for expressive speech synthesis. In: Text, speech and dialogue. Berlin: Springer, 2010, p. 283-290. (Lectures notes in computer; 6231). ISBN 978-3-642-15759-2.
Datum vydání: 2010
Nakladatel: Springer
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/GruberM_2010_Listening-test-based
http://hdl.handle.net/11025/17192
ISBN: 978-3-642-15759-2
Klíčová slova: expresivní syntéza řeči;poslechové testy;komunikační funkce
Klíčová slova v dalším jazyce: expressive speech synthesis;listening tests;communicative functions
Abstrakt: Článek popisuje vyhodnocení poslechového testu, jehož cílem bylo objektivně anotovat expresivní řečové nahrávky a tím dále vyvíjet doménově omezený syntetizér expresivní řeči. V této úloze jsou dva základní problémy. Prvním z nich je fakt, že expresivita jako taková musí být předem nějakým způsobem definována. Druhým problémem je subjektivní vnímání expresivní řeči různými posluchači. Nicméně, pro správnou funkci expresivního řečového syntetizéru musí být expresivní korpus objektivně a jednoznačně anotován. Nejprve jsme definovali expresivitu pomocí tzv. komunikačních funkcí. Předpokládáme, že pomocí těchto funkcí jsme schopni popsat způsob expresivního vyjádření v mluvené řeči. Abychom dosáhli objektivní anotace, vytvořili jsme poslechový test pro relativně velkou množinu posluchačů. Posluchači v tomto poslechovém testu měli za úkol označit věty z expresivního korpusu odpovídajícími komunikačními funkcemi. Naším cílem bylo získat co nejvíce těchto subjektivních anotací a pomocí již známých metod z těchto subjektivních anotací získat anotaci objektivní.
Abstrakt v dalším jazyce: This paper is focused on the evaluation of listening test thatwas realized with a view to objectively annotate expressive speech recordingsand further develop a limited domain expressive speech synthesissystem. There are two main issues to face in this task. The first matterin issue to be taken into consideration is the fact that expressivity inspeech has to be defined in some way. The second problem is that perceptionof expressive speech is a subjective question. However, for thepurposes of expressive speech synthesis using unit selection algorithms,the expressive speech corpus has to be objectively and unambiguouslyannotated. At first, a classification of expressivity was determined makinguse of communicative functions. These are supposed to describe thetype of expressivity and/or speaker?s attitude. Further, to achieve objectivityat a significant level, a listening test with relatively high numberof listeners was realized. The listeners were asked to mark sentences inthe corpus using communicative functions. The aim of the test was toacquire a sufficient number of subjective annotations of the expressiverecordings so that we would be able to create ?objective? annotation.There are several methods to obtain objective evaluation from lots ofsubjective ones, two of them are presented.
Práva: © Martin Grůber - Jindřich Matoušek
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
GruberM_2010_Listening-test-based.pdfPlný text152,61 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17192

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.