Název: | Deep Generalized Max Pooling |
Další názvy: | Hluboký zobecněný max pooling |
Autoři: | Christlein, Vincent Spranger, Lukas Seuret, Mathias Nicolaou, Anguelos Král, Pavel Maier, Andreas |
Citace zdrojového dokumentu: | CHRISTLEIN, V., SPRANGER, L., SEURET, M., NICOLAOU, A., KRÁL, P., MAIER, A.. Deep Generalized Max Pooling. In: The 15th IAPR International Conference on Document Analysis and Recognition. Piscataway: IEEE, 2019. s. 1090-1096. ISBN 978-1-72813-014-9 , ISSN 1520-5363. |
Datum vydání: | 2019 |
Nakladatel: | IEEE |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | 2-s2.0-85079832418 http://hdl.handle.net/11025/36757 |
ISBN: | 978-1-72813-014-9 |
ISSN: | 1520-5363 |
Klíčová slova: | pooling;hluboké učení;analýza dokumentů;klasifikace obrazů dokumentů;identifikace pisatele |
Klíčová slova v dalším jazyce: | pooling;deep learning;document analysis;document image classification;writer identification |
Abstrakt: | Global pooling layers are an essential part of Convolutional Neural Networks (CNN). Global average pooling or global max pooling are commonly used for converting convolutional features of variable size images to a fix-sized embedding. However, both pooling layer types are computed spatially independent. In contrast, we propose Deep Generalized Max Pooling that balances the contribution of all activations of a spatially coherent region by re-weighting all descriptors so that the impact of frequent and rare ones is equalized. We show that this layer is superior to both average and max pooling on the classification of Latin medieval manuscripts (CLAMM’16, CLAMM’17), as well as writer identification (Historical-WI’17). Globální poolingové vrstvy jsou nezbytnou součástí konvolučních neuronových sítí (CNN). Globální průměrný pooling nebo globální maximální pooling se běžně používají k převodu konvolučních příznaků obrazů s proměnnou velikostí na vektor s pevnou velikostí. Oba typy poolingových vrstev jsou však počítány prostorově nezávisle. Na rozdíl od toho navrhujeme „hluboký zobecněný max pooling“, který upravuje přínos všech aktivací prostorově koherentní oblasti převážením všech deskriptorů tak, aby byl vyrovnáván dopad častých a vzácných. Ukazujeme, že tato vrstva překonává výsledky průměrného i maximálního poolingu v úloze klasifikace latinských středověkých rukopisů (CLAMM’16, CLAMM’17), stejně jako v identifikaci pisatele (Historical-WI’17). |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © IEEE |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KIV) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Král 2Q8M1Auyriy0CX2DzHmTOJ.pdf | 828,54 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/36757
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.