Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorSido Jakub, Ing.
dc.contributor.authorKrajňák, Jan
dc.contributor.refereePražák Ondřej, Ing.
dc.date.accepted2022-6-14
dc.date.accessioned2022-08-29T14:33:21Z-
dc.date.available2021-10-4
dc.date.available2022-08-29T14:33:21Z-
dc.date.issued2022
dc.date.submitted2022-5-5
dc.identifier89766
dc.identifier.urihttp://hdl.handle.net/11025/49552-
dc.description.abstractTato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami.cs
dc.format43 s. (65358 znaků)
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.relation.isreferencedbyhttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89766-
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectautomatická extrakce klíčových slovcs
dc.subjecttf-idfcs
dc.subjecttextrankcs
dc.subjectyakecs
dc.subjectkeybertcs
dc.subjectbertcs
dc.subjectčtkcs
dc.subjectsemevalcs
dc.titleAutomatická detekce klíčových slov v textucs
dc.title.alternativeAutomatic keyword detectionen
dc.typebakalářská práce
dc.thesis.degree-nameBc.
dc.thesis.degree-levelBakalářský
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-programInformatika a výpočetní technika
dc.description.resultObhájeno
dc.description.abstract-translatedThis thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods.en
dc.subject.translatedautomatic keyword extractionen
dc.subject.translatedtf-idfen
dc.subject.translatedtextranken
dc.subject.translatedyakeen
dc.subject.translatedkeyberten
dc.subject.translatedberten
dc.subject.translatedčtken
dc.subject.translatedsemevalen
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
A19B0103P.pdfPlný text práce1,77 MBAdobe PDFZobrazit/otevřít
A19B0103P_hodnoceni.pdfPosudek vedoucího práce117,37 kBAdobe PDFZobrazit/otevřít
A19B0103P_posudek.pdfPosudek oponenta práce235,9 kBAdobe PDFZobrazit/otevřít
A19B0103P_obhajoba.pdfPrůběh obhajoby práce85,35 kBAdobe PDFZobrazit/otevřít
A19B0103P_zadaniBP.pdfVŠKP - příloha12,83 kBAdobe PDFZobrazit/otevřít
A19B0103P_prilohy.zipVŠKP - příloha46,96 MBZIPZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/49552

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.