Název: Klasifikace skenovaných dokumentů
Další názvy: Classification of scanned documents
Autoři: Fafek, Jakub
Vedoucí práce/školitel: Martínek Jiří, Ing. Ph.D.
Oponent: Pártl František, Ing.
Datum vydání: 2024
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/57111
Klíčová slova: klasifikace dokumentu;skenovaný dokument;neuronová síť;klasifikace textu;klasifikace obrázku;ocr
Klíčová slova v dalším jazyce: document classification;scanned document;neural network;text classification;image classification;ocr
Abstrakt: Tato bakalářská práce se zabývá tématem klasifikace skenovaných dokumentů. Cílem této práce je vyvinout klasifikátor, který bude schopen rozlišit naskenované dokumenty do celkem deseti tříd. Jako příznak se použije text, který je rozpoznán pomocí metod optického rozpoznávání znaků (OCR). Dále bude využita hluboká konvoluční neuronová síť, která zohlední vizuální příznaky. Nakonec bude vytvořen klasifikátor, který zohledňuje oba typy příznaků. Klasifikátor bude vyhodnocen na datové sadě dokumentů Tobacco-3482.
Abstrakt v dalším jazyce: This bachelor thesis deals with the topic of classification of scanned documents. The aim of this thesis is to develop a~classifier that will be able to distinguish scanned documents into a~total of ten classes. Text will be used as a~feature which is recognized using optical character recognition (OCR) methods. Furthermore, a~deep convolutional neural network will be used to take visual features into account. Finally, a~classifier will be created that accounts for both types of features. The classifier will be evaluated on the Tobacco-3482 document dataset.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
A19B0034P_text_prace.pdfPlný text práce1,36 MBAdobe PDFZobrazit/otevřít
A19B0034P_Posudek.pdfPosudek oponenta práce215,39 kBAdobe PDFZobrazit/otevřít
A19B0034P_Hodnoceni.pdfPosudek vedoucího práce233,25 kBAdobe PDFZobrazit/otevřít
A19B0034P_Obhajoba.pdfPrůběh obhajoby práce124,5 kBAdobe PDFZobrazit/otevřít
A19B0034P_Zadani.pdfVŠKP - příloha21,77 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii
A19B0034P_prilohy_1.rarVŠKP - příloha91 MBRARZobrazit/otevřít  Vyžádat kopii
A19B0034P_prilohy_3.rarVŠKP - příloha592,95 MBRARZobrazit/otevřít  Vyžádat kopii
A19B0034P_prilohy_5.rarVŠKP - příloha1,19 GBRARZobrazit/otevřít  Vyžádat kopii
A19B0034P_prilohy_2.rarVŠKP - příloha1,4 GBRARZobrazit/otevřít  Vyžádat kopii
A19B0034P_prilohy_4.rarVŠKP - příloha1,53 GBRARZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/57111

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.