Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Zelinka Jan, Ing. PhD. | |
dc.contributor.author | Müller, Luděk | |
dc.contributor.referee | Tychtl Zbyněk, Ing. Ph.D. | |
dc.date.accepted | 2022-9-8 | |
dc.date.accessioned | 2022-11-10T14:47:19Z | - |
dc.date.available | 2021-10-1 | |
dc.date.available | 2022-11-10T14:47:19Z | - |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-8-26 | |
dc.identifier | 89620 | |
dc.identifier.uri | http://hdl.handle.net/11025/50246 | - |
dc.description.abstract | Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových pořadů za účelem jejich bezproblémového vystavování na internetovém portále mujRozhlas.cz. Je prezentováno stávající řešení, které je v současné době používané. Dále jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec framework. Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase | cs |
dc.format | 97 | |
dc.language.iso | cs | |
dc.publisher | Západočeská univerzita v Plzni | |
dc.relation.isreferencedby | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89620 | - |
dc.rights | Plný text práce je přístupný bez omezení | |
dc.subject | wav2vec | cs |
dc.subject | transformer | cs |
dc.subject | inaspeechsegmenter | cs |
dc.subject | cnn | cs |
dc.subject | reciver operating charakteristic | cs |
dc.title | Detekce hudby a řeči v rozhlasových nahrávkách | cs |
dc.title.alternative | Music and speech detection in radio recordings | en |
dc.type | diplomová práce | |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-level | Navazující | |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | |
dc.thesis.degree-program | Aplikované vědy a informatika | |
dc.description.result | Obhájeno | |
dc.description.abstract-translated | This thesis aims to design and experimentally test a new optimal method of a voice-activity-detector, which should add successfully solve the task of automatically determining the beginnings and ends of radio broadcasts programs for the purpose of their seamless display on the internet portal mujRozhlas.cz An existing solution that is currently in use is presented. The work also describes the most promising methods based on convolutional neural networks and state-of-the-art methods using transformers and the wav2vec framework. The primary result of this work is the design of a new detector meeting the conditions set for its implementation to solve the task of automatic detection of the beginnings and ends of programs on the Czech Radio, as well as the creation of a set of datasets and scripts for comparing individual methods. | en |
dc.subject.translated | wav2vec | en |
dc.subject.translated | transformer | en |
dc.subject.translated | inaspeechsegmenter | en |
dc.subject.translated | cnn | en |
dc.subject.translated | reciver operating charakteristic | en |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Diplomova_prace_LM2022_ZCU.pdf | Plný text práce | 6,24 MB | Adobe PDF | Zobrazit/otevřít |
Muller_V.pdf | Posudek vedoucího práce | 700,46 kB | Adobe PDF | Zobrazit/otevřít |
Muller_O.pdf | Posudek oponenta práce | 1,4 MB | Adobe PDF | Zobrazit/otevřít |
Muller_P.pdf | Průběh obhajoby práce | 266,57 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/50246
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.