Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Sido Jakub, Ing. | |
dc.contributor.author | Krajňák, Jan | |
dc.contributor.referee | Pražák Ondřej, Ing. | |
dc.date.accepted | 2022-6-14 | |
dc.date.accessioned | 2022-08-29T14:33:21Z | - |
dc.date.available | 2021-10-4 | |
dc.date.available | 2022-08-29T14:33:21Z | - |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-5-5 | |
dc.identifier | 89766 | |
dc.identifier.uri | http://hdl.handle.net/11025/49552 | - |
dc.description.abstract | Tato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami. | cs |
dc.format | 43 s. (65358 znaků) | |
dc.language.iso | cs | |
dc.publisher | Západočeská univerzita v Plzni | |
dc.relation.isreferencedby | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89766 | - |
dc.rights | Plný text práce je přístupný bez omezení | |
dc.subject | automatická extrakce klíčových slov | cs |
dc.subject | tf-idf | cs |
dc.subject | textrank | cs |
dc.subject | yake | cs |
dc.subject | keybert | cs |
dc.subject | bert | cs |
dc.subject | čtk | cs |
dc.subject | semeval | cs |
dc.title | Automatická detekce klíčových slov v textu | cs |
dc.title.alternative | Automatic keyword detection | en |
dc.type | bakalářská práce | |
dc.thesis.degree-name | Bc. | |
dc.thesis.degree-level | Bakalářský | |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | |
dc.thesis.degree-program | Informatika a výpočetní technika | |
dc.description.result | Obhájeno | |
dc.description.abstract-translated | This thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods. | en |
dc.subject.translated | automatic keyword extraction | en |
dc.subject.translated | tf-idf | en |
dc.subject.translated | textrank | en |
dc.subject.translated | yake | en |
dc.subject.translated | keybert | en |
dc.subject.translated | bert | en |
dc.subject.translated | čtk | en |
dc.subject.translated | semeval | en |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
A19B0103P.pdf | Plný text práce | 1,77 MB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_hodnoceni.pdf | Posudek vedoucího práce | 117,37 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_posudek.pdf | Posudek oponenta práce | 235,9 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_obhajoba.pdf | Průběh obhajoby práce | 85,35 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_zadaniBP.pdf | VŠKP - příloha | 12,83 kB | Adobe PDF | Zobrazit/otevřít |
A19B0103P_prilohy.zip | VŠKP - příloha | 46,96 MB | ZIP | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/49552
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.