Data science v prostředí Apache Spark

Hanzlík, Roman

Data science v prostředí Apache Spark

Repozitář DSpace/Manakin

Přihlásit se | cookies

Jazyk: English čeština

Data science v prostředí Apache Spark

Zobrazit celý záznam

Není dostupný náhled

Název:	Data science v prostředí Apache Spark
Autor:	Hanzlík, Roman
Vedoucí:	Šenkeřík, Roman
Abstrakt:	Tato diplomová práce představuje téma Data Science jako nový fenomén v oblasti počítačového zpracování dat. Hlavním cílem této práce je poskytnout prvotní náhled do problematiky Data Science a v krátkosti představit její dílčí oblasti se zaměřením na Big Data a Machine Learning jako dva pilíře, které hrají v posledních letech primární úlohu v rychle se měnící době, zejména v oblasti informačních technologií, což je odvětví, které zásadním způsobem zasahuje snad už do všech oblastí lidské činnosti. Teoretická část nejprve podává přehled historie zpracování dat a informací a představuje faktory, které vedly k potřebě nového přístupu ve zpracování dat. Značná část je věnována představení metodik v oblasti zpracování dat. Neodmyslitelnou součástí je samotná definice Data Science a jejich základních komponent, Big Data včetně datového inženýrství a přehled možností a typů analýz dat. Praktická část popisuje základní koncepty Apache Spark vč. několika možností instalací jako jsou on-premise či in-cloud. Dále se zaměřuje na představení možnosti Apache Spark v rámci jeho základních komponent přímo na reálných případech použití s využitím některých veřejně dostupných datových sad. Součástí práce je sada ukázkových příkladů s funkčními řádky kódů, které demonstrují využití dané technologie.
URI:	http://hdl.handle.net/10563/49953
Datum:	2021-01-15
Dostupnost:	Bez omezení
Ústav:	Ústav informatiky a umělé inteligence
Studijní obor:	Informační technologie
Klasifikace závěřečné práce a její obhajoby:	A 57488

Citace závěřečné práce

Soubory tohoto záznamu

Soubory	Velikost	Formát	Zobrazit	Popis
hanzlík_2021_dp.pdf	6.721Mb	PDF	Zobrazit/otevřít	None
hanzlík_2021_op.pdf	132.9Kb	PDF	Zobrazit/otevřít	None
hanzlík_2021_vp.pdf	349.1Kb	PDF	Zobrazit/otevřít	None

Tento záznam se objevuje v následujících kolekcích

Diplomové práce [879]

Zobrazit celý záznam

Data science v prostředí Apache Spark

Repozitář DSpace/Manakin

Data science v prostředí Apache Spark

Citace závěřečné práce

Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Prohledat DSpace

Procházet

Vše v DSpace

Tato kolekce

Můj účet