Title: Možnosti analytického rozšíření úložiště Data Lakehouse
Other Titles: Data Lakehouse analytical extension options
Authors: Bozděch, Josef
Advisor: Klečková Jana, Doc. Dr. Ing.
Referee: Kryl Martin, Ing.
Issue Date: 2024
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/57246
Keywords: delta lake;apache spark;vizualizace a statistika;datová analýza;preact;zpracování informací;data lakehouse
Keywords in different language: delta lake;apache spark;visualization a statistics;data analysis;preact;information processing;data lakehouse
Abstract: V diplomové práci jsou diskutovány analytické a statistické možnosti rozšíření datového úložiště Data Lakehouse. Nejdříve je zkoumán koncept úložiště data lakehouse, následně jsou popsány již existující implementace tohoto úložiště - Databricks a koncept Data Lakehouse, na který je v této práci navazováno. Následně jsou zkoumána dostupná data pro Data Lakehouse z platformy MRE ZČU zabývající se shromažďováním medicínských dat. Následně jsou navrhnuty možnosti rozšíření Data Lakehouse, následuje popis jejich implementace, výběr technologií a problémy, na které bylo narazeno při implementaci těchto návrhů. Nakonec je implementace otestována, výsledek práce porovnán s MRE, navrženy další možnosti rozšíření Data Lakehouse, shrnuty a vyhodnoceny dosažené výsledky.
Abstract in different language: The thesis discusses the analytical and statistical possibilities of extending the Data Lakehouse data warehouse. First, the concept of Data Lakehouse is examined, then existing implementations of this repository - Databricks and the Data Lakehouse concept, which is built upon in this thesis, are described. Subsequently, the available data for Data Lakehouse from the MRE platform of ZČU dealing with medical data collection is examined. Subsequently, options for extending the Data Lakehouse are proposed, followed by a description of their implementation, technology selection and the problems encountered in implementing these proposals. Finally, the implementation is tested, the result of the work is compared with the MRE, further options for extending the Data Lakehouse are proposed, and the results are summarized and evaluated.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DP_Bozdech_Josef_2024.pdfPlný text práce1,04 MBAdobe PDFView/Open
A22N0039Phodnoceni-ved.pdfPosudek vedoucího práce412,72 kBAdobe PDFView/Open
A22N0039Pposudek-op.pdfPosudek oponenta práce568,53 kBAdobe PDFView/Open
A22N0039Pobhajoba.pdfPrůběh obhajoby práce192,72 kBAdobe PDFView/Open
A22N0039P-zadani_DP.pdfVŠKP - příloha21,92 kBAdobe PDFView/Open    Request a copy
A22N0039P_prilohy.zipVŠKP - příloha6,02 MBZIPView/Open    Request a copy


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/57246

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.