Kurzy Big Data Hadoop and Spark Developer
Školenia Big Data Hadoop a Spark Developer poskytované iLEARN
Dostupnosť a ceny kurzov Big Data Hadoop and Spark Developer
Odporúčané produkty
V tejto prezentácii nájdete výber školení a skúšok v kontexte Big Data Hadoop and Spark Developer .
Ak nevidíte požadovaný kurz alebo skúšku, kontaktujte nás.
VÝVOJÁR VEĽKÝCH DÁT HADOOP A SPARK
Svet sa stáva čoraz digitálnejším a význam veľkých dát a dátovej analýzy bude v nasledujúcich rokoch naďalej rásť. Výber kariéry v oblasti veľkých dát a analytiky môže byť práve to, čo ste sa snažili nájsť, aby ste splnili svoje kariérne očakávania.
Školenie Big Data Hadoop vásnaučí koncepty rámca Hadoop, jeho tvorbu v prostredí klastra a pripraví vás na certifikáciu Cloudera CCA175 Big Data.
CERTIFIKÁCIA PRE VÝVOJÁROV V OBLASTI BIG DATA HADOOP A SPARK
Nie je k dispozícii žiadna skúška, ale na získanie certifikátu musíte absolvovať 85 % kurzu, jeden projekt a jeden simulačný test s minimálnym skóre 80 %.
KURZ BIG DATA HADOOP AND SPARK DEVELOPER
V tomto kurze Big Data Hadoop sa naučíte rámec pre veľké dáta pomocou Hadoop a Spark vrátane HDFS, YARN a MapReduce. Kurz sa bude zaoberať aj programami Pig, Hive a Impala na spracovanie a analýzu veľkých súborov údajov uložených v HDFS a na prijímanie údajov sa budú používať Sqoop a Flume.
Ukáže sa vám spracovanie údajov v reálnom čase pomocou Sparku vrátane funkčného programovania v Sparku, implementácie aplikácií Spark, pochopenia paralelného spracovania v Sparku a používania optimalizačných techník Spark RDD. Naučíte sa tiež rôzne interaktívne algoritmy v Sparku a budete používať Spark SQL na vytváranie, transformáciu a dopytovanie dátových formulárov.
Nakoniec budete musieť realizovať reálne priemyselné projekty s využitím CloudLab v oblastiach bankovníctva, telekomunikácií, sociálnych médií, poisťovníctva a elektronického obchodu.
Tu nižšie si môžete prečítať list kurzu s informáciami o Big Data Hadoop and Spark Developer.
Objectives
Na konci kurzu budete vedieť:
- Rôzne komponenty ekosystému Hadoop, ako sú Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume a Apache Spark
- Hadoop Distributed File System (HDFS) a architektúra YARN
- MapReduce a jeho vlastnosti a osvojenie si pokročilých konceptov MapReduce
- Rôzne typy formátov súborov, schéma Avro, používanie Avro s Hive a Sqoop a vývoj schém
- Flume, architektúra Flume, zdroje, flume sinks, kanály a konfigurácie flume
- HBase, jej architektúra a ukladanie údajov a naučte sa rozdiel medzi HBase a RDBMS
- Podrobne o odolných distribučných dátových súboroch (RDD)
- Bežné prípady použitia Sparku a rôzne interaktívne algoritmy
Budete tiež vedieť:
- Prijímať údaje pomocou Sqoop a Flume
- Vytvárať databázy a tabuľky v Hive a Impala, porozumieť HBase a používať Hive a Impala na rozdeľovanie
- Získať praktické znalosti o Pig a jeho komponentoch
- Vykonávať funkčné programovanie v Sparku a implementovať a vytvárať Sparkové aplikácie
- Získať dôkladnú znalosť paralelného spracovania v Sparku a optimalizačných techník Spark RDD
- Vytvárať, transformovať a vyhľadávať dátové rámce pomocou Spark SQL
Who it is aimed at
Kariérne príležitosti v oblasti veľkých dát sú na vzostupe a Hadoop sa rýchlo stáva povinnou technológiou v architektúre veľkých dát. Školenia o veľkých dátach sú vhodné pre odborníkov v oblasti IT, správy údajov a analytiky, vrátane:
- Softvérových vývojárov a architektov
- Odborníkov na analytiku
- Senior IT profesionálov
- Odborníkov na testovanie a mainframe
- Odborníkov na správu údajov
- Odborníci na business intelligence
- Projektoví manažéri
- Začínajúci dátoví vedci
- Absolventi, ktorí chcú budovať kariéru v oblasti analýzy veľkých dát
Contents
Kurz zahŕňa tieto témy:
- Úvod do kurzu
- Lekcia 1 - Úvod do veľkých dát a ekosystému Hadoop
- Lekcia 2 - HDFS a YARN
- Lekcia 3 - MapReduce a Sqoop
- Lekcia 4 - Základy Hive a Impala
- Lekcia 5 - Práca s Hive a Impala
- Lekcia 6 - Typy dátových formátov
- Lekcia 7 - Pokročilý koncept Hive a rozdelenie dátových súborov
- Lekcia 8 - Apache Flume a HBase
- Lekcia 9 - Pig
- Lekcia 10 - Základy Apache Spark
- Lekcia 11 - RDD v Sparku
- Lekcia 12 - Implementácia aplikácií Spark
- Lekcia 13 - Paralelné spracovanie v Sparku
- Lekcia 14 - Optimalizačné techniky Spark RDD
- Lekcia 15 - Algoritmus Spark
- Lekcia 16 - Spark SQL
- BEZPLATNÝ KURZ - Apache Kafka
- BEZPLATNÝ KURZ - Jadro Javy
Prerequisites
Pre tento kurz neexistujú žiadne predpoklady. Je však výhodné mať určité znalosti jadra jazyka Java a jazyka SQL.Ak potrebujete oprášiť svoje znalosti jazyka Core Java, ponúkame bezplatný samostatný online kurz "Java essentials for Hadoop".
Duration
Trvanieonline kurzu:
- prístupk platforme na 1 rok