Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.author | Vaněk, Jan | |
dc.contributor.author | Trmal, Jan | |
dc.contributor.author | Psutka, Josef V. | |
dc.contributor.author | Psutka, Josef | |
dc.date.accessioned | 2015-12-11T07:43:57Z | |
dc.date.available | 2015-12-11T07:43:57Z | |
dc.date.issued | 2012 | |
dc.identifier.citation | VANĚK, Jan; TRMAL, Jan; PSUTKA, Josef V.; PSUTKA, Josef. Full covariance gaussian mixture models evaluation on GPU. In: IEEE international symposium on signal processing and information technology. Vietnam: IEEE Press, 2012, p. [1-5]. ISBN 978-1-4673-5604-6. | en |
dc.identifier.isbn | 978-1-4673-5604-6 | |
dc.identifier.uri | http://www.kky.zcu.cz/cs/publications/VanekJ_2012_FullCovariance | |
dc.identifier.uri | http://hdl.handle.net/11025/16961 | |
dc.description.abstract | Směsi Gaussovských modelů jsou často používány v mnoha úlohách klasifikace či jiného zpracování dad. Používány jsou jako modely hustoty pravděpodobnosti v prostorech vyšších dimenzí. V případech, kdy je dimenze prostoru příznakových vektorů relativně veliká (např. v systémech automatického rozpoznávání řeči), jsou používány smesi Gaussovských modelů s diagonální kovarianční maticí, spíše než modely s plnou kovariancí. A to ze dvou důvodů: Prvním důvodem je problematičnost odhadu parametrů těchto plných kovariančních matic v případě omezeného množství trénovacích dat. Druhým důvodem je pak výrazně vyšší výpočetní náročnost vyhodnocování těchto modelů. Robustnost odhadů byla zkoumána v mnoha již publikovaných pracích. Tento článek popisuje efektivní implementaci výpočtu pravděpodobností těchto modelů na GPU a řeší tak problém velké výpočetní náročnosti. Výkonost byla testována na akustickém modelu systému automatického rozpoznávání řeči. Výsledky naší implementace ukazují, že i grafická karta levného notebooku je schopná zvlándnout vyhodnotit velké akustické modely ve reálném čase. Tři varianty algoritmu byly implementovány a porovnány mezi sebou na různých GPU: NVIDIA CUDA, NVIDIA OpenCL a ATI/AMD OpenCL. | cs |
dc.format | 5 s. | cs |
dc.format.mimetype | application/pdf | |
dc.language.iso | en | en |
dc.publisher | IEEE Press | en |
dc.rights | © Jan Vaněk - Jan Trmal - Josef V. Psutka - Josef Psutka | cs |
dc.subject | směsi Gaussovských modelů | cs |
dc.subject | plné kovarianční matice | cs |
dc.subject | automatické rozpoznávání řeči | cs |
dc.subject | GPU | cs |
dc.subject | CUDA | cs |
dc.subject | OpenCL | cs |
dc.title | Full covariance gaussian mixture models evaluation on GPU | en |
dc.title.alternative | Vyhodnocování směsí Gaussovských modelů s plnou kovarianční maticí na GPU | cs |
dc.type | článek | cs |
dc.type | article | en |
dc.rights.access | openAccess | en |
dc.type.version | publishedVersion | en |
dc.description.abstract-translated | Gaussian mixture models (GMMs) are often used in various data processing and classification tasks to model a continuous probability density in a multi-dimensional space. In cases, where the dimension of the feature space is relatively high (e.g. in the automatic speech recognition (ASR)), GMM with a higher number of Gaussians with diagonal covariances (DC) instead of full covariances (FC) is used from the two reasons. The first reason is a~problem how to estimate robust FC matrices with a~limited training data set. The second reason is a~much higher computational cost during the GMM evaluation. The first reason was addressed in many recent publications. In contrast, this paper describes an efficient implementation on Graphic Processing Unit (GPU) of the FC-GMM evaluation, which addresses the second reason. The performance was tested on acoustic models for ASR, and it is shown that even a low-end laptop GPU is capable to evaluate a large acoustic model in a fraction of the real speech time. Three variants of the algorithm were implemented and compared on various GPUs: NVIDIA CUDA, NVIDIA OpenCL, and ATI/AMD OpenCL. | en |
dc.subject.translated | Gaussian mixture models | en |
dc.subject.translated | full covariance | en |
dc.subject.translated | automatic speech recognition | en |
dc.subject.translated | GPU | en |
dc.subject.translated | CUDA | en |
dc.subject.translated | OpenCL | en |
dc.type.status | Peer-reviewed | en |
Vyskytuje se v kolekcích: | Články / Articles (KIV) Články / Articles (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
VanekJ_2012_FullCovariance.pdf | Plný text | 357,73 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/16961
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.