Automatická detekce klíčových slov v textu

Krajňák, Jan

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Sido Jakub, Ing.
dc.contributor.author	Krajňák, Jan
dc.contributor.referee	Pražák Ondřej, Ing.
dc.date.accepted	2022-6-14
dc.date.accessioned	2022-08-29T14:33:21Z	-
dc.date.available	2021-10-4
dc.date.available	2022-08-29T14:33:21Z	-
dc.date.issued	2022
dc.date.submitted	2022-5-5
dc.identifier	89766
dc.identifier.uri	http://hdl.handle.net/11025/49552	-
dc.description.abstract	Tato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami.	cs
dc.format	43 s. (65358 znaků)
dc.language.iso	cs
dc.publisher	Západočeská univerzita v Plzni
dc.relation.isreferencedby	https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89766	-
dc.rights	Plný text práce je přístupný bez omezení
dc.subject	automatická extrakce klíčových slov	cs
dc.subject	tf-idf	cs
dc.subject	textrank	cs
dc.subject	yake	cs
dc.subject	keybert	cs
dc.subject	bert	cs
dc.subject	čtk	cs
dc.subject	semeval	cs
dc.title	Automatická detekce klíčových slov v textu	cs
dc.title.alternative	Automatic keyword detection	en
dc.type	bakalářská práce
dc.thesis.degree-name	Bc.
dc.thesis.degree-level	Bakalářský
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-program	Informatika a výpočetní technika
dc.description.result	Obhájeno
dc.description.abstract-translated	This thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods.	en
dc.subject.translated	automatic keyword extraction	en
dc.subject.translated	tf-idf	en
dc.subject.translated	textrank	en
dc.subject.translated	yake	en
dc.subject.translated	keybert	en
dc.subject.translated	bert	en
dc.subject.translated	čtk	en
dc.subject.translated	semeval	en
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
A19B0103P.pdf	Plný text práce	1,77 MB	Adobe PDF	Zobrazit/otevřít
A19B0103P_hodnoceni.pdf	Posudek vedoucího práce	117,37 kB	Adobe PDF	Zobrazit/otevřít
A19B0103P_posudek.pdf	Posudek oponenta práce	235,9 kB	Adobe PDF	Zobrazit/otevřít
A19B0103P_obhajoba.pdf	Průběh obhajoby práce	85,35 kB	Adobe PDF	Zobrazit/otevřít
A19B0103P_zadaniBP.pdf	VŠKP - příloha	12,83 kB	Adobe PDF	Zobrazit/otevřít
A19B0103P_prilohy.zip	VŠKP - příloha	46,96 MB	ZIP	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/49552

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace