Název: | Detekce hudby a řeči v rozhlasových nahrávkách |
Další názvy: | Music and speech detection in radio recordings |
Autoři: | Müller, Luděk |
Vedoucí práce/školitel: | Zelinka Jan, Ing. PhD. |
Oponent: | Tychtl Zbyněk, Ing. Ph.D. |
Datum vydání: | 2022 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/50246 |
Klíčová slova: | wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic |
Klíčová slova v dalším jazyce: | wav2vec;transformer;inaspeechsegmenter;cnn;reciver operating charakteristic |
Abstrakt: | Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových pořadů za účelem jejich bezproblémového vystavování na internetovém portále mujRozhlas.cz. Je prezentováno stávající řešení, které je v současné době používané. Dále jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec framework. Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase |
Abstrakt v dalším jazyce: | This thesis aims to design and experimentally test a new optimal method of a voice-activity-detector, which should add successfully solve the task of automatically determining the beginnings and ends of radio broadcasts programs for the purpose of their seamless display on the internet portal mujRozhlas.cz An existing solution that is currently in use is presented. The work also describes the most promising methods based on convolutional neural networks and state-of-the-art methods using transformers and the wav2vec framework. The primary result of this work is the design of a new detector meeting the conditions set for its implementation to solve the task of automatic detection of the beginnings and ends of programs on the Czech Radio, as well as the creation of a set of datasets and scripts for comparing individual methods. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Diplomova_prace_LM2022_ZCU.pdf | Plný text práce | 6,24 MB | Adobe PDF | Zobrazit/otevřít |
Muller_V.pdf | Posudek vedoucího práce | 700,46 kB | Adobe PDF | Zobrazit/otevřít |
Muller_O.pdf | Posudek oponenta práce | 1,4 MB | Adobe PDF | Zobrazit/otevřít |
Muller_P.pdf | Průběh obhajoby práce | 266,57 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/50246
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.