Kurser Big Data Hadoop and Spark Developer
Big Data Hadoop and Spark Developer kurser leveret af iLEARN
Tilgængelighed og priser for Big Data Hadoop and Spark Developer kurser
Udvalgte produkter
I denne showcase finder du et udvalg af kurser og eksamener inden for Big Data Hadoop and Spark Developer.
Hvis du ikke kan se det kursus eller den eksamen, du ønsker, bedes du kontakte os.
BIG DATA HADOOP AND SPARK DEVELOPER
Verden bliver mere og mere digital, og betydningen af big data og dataanalyse vil fortsætte med at vokse i de kommende år. At vælge en karriere inden for big data og analyse er måske lige det, du har forsøgt at finde for at opfylde dine karriereforventninger.
Big Data Hadoop-træningskurset lærer dig begreberne i Hadoop-rammen, dens dannelse i et klyngemiljø og forbereder dig til Clouderas CCA175 Big Data-certificering.
BIG DATA HADOOP AND SPARK DEVELOPER-CERTIFICERING
Der er ingen eksamen tilgængelig, men du skal gennemføre 85 % af kurset, et projekt og en simulationstest med en minimumsscore på 80 % for at få et certifikat.
BIG DATA HADOOP AND SPARK DEVELOPER-KURSUS
På dette Big Data Hadoop-kursus lærer du big data-rammen ved hjælp af Hadoop og Spark, herunder HDFS, YARN og MapReduce. Kurset dækker også Pig, Hive og Impala til at behandle og analysere store datasæt, der er lagret i HDFS, og bruger Sqoop og Flume til dataindlæsning.
Du vil få vist databehandling i realtid ved hjælp af Spark, herunder funktionel programmering i Spark, implementering af Spark-applikationer, forståelse af parallel behandling i Spark og brug af Spark RDD-optimeringsteknikker. Du vil også lære de forskellige interaktive algoritmer i Spark og bruge Spark SQL til at oprette, transformere og forespørge på dataformer.
Endelig skal du udføre virkelige, industribaserede projekter ved hjælp af CloudLab inden for områderne bank, telekommunikation, sociale medier, forsikring og e-handel.
Herunder kan du læse kursusarket med information om Big Data Hadoop and Spark Developer.
Objectives
Ved afslutningen af kurset vil du være i stand til at forstå:
- De forskellige komponenter i Hadoop-økosystemet, såsom Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume og Apache Spark.
- Hadoop Distributed File System (HDFS) og YARN-arkitektur
- MapReduce og dets karakteristika og assimilering af avancerede MapReduce-koncepter
- Forskellige typer filformater, Avro-skema, brug af Avro med Hive og Sqoop og skemaudvikling
- Flume, Flume-arkitektur, kilder, Flume-dræn, kanaler og Flume-konfigurationer
- HBase, dets arkitektur og datalagring, og lær forskellen mellem HBase og RDBMS
- Modstandsdygtige distributionsdatasæt (RDD) i detaljer
- De almindelige anvendelser af Spark og forskellige interaktive algoritmer
Du vil også være i stand til at:
- Indlæse data ved hjælp af Sqoop og Flume
- Oprette databaser og tabeller i Hive og Impala, forstå HBase og bruge Hive og Impala til partitionering
- Få et arbejdskendskab til Pig og dets komponenter
- Lav funktionel programmering i Spark, og implementer og byg Spark-applikationer
- Få en dybdegående forståelse af parallel behandling i Spark og Spark RDD-optimeringsteknikker
- Oprette, transformere og forespørge på datarammer med Spark SQL
Who it is aimed at
Karrieremulighederne inden for big data er stigende, og Hadoop er hurtigt ved at blive en must-know-teknologi inden for big data-arkitektur. Big Data-træning er velegnet til fagfolk inden for IT, datastyring og analyse, herunder:
- Softwareudviklere og -arkitekter
- Professionelle inden for analyse
- Senior IT-professionelle
- Professionelle inden for test og mainframe
- Professionelle inden for datahåndtering
- Professionelle inden for business intelligence
- Projektledere
- Håbefulde dataforskere
- Nyuddannede, der ønsker at opbygge en karriere inden for big data-analyse
Contents
Kurset dækker følgende emner:
- Introduktion til kurset
- Lektion 1 - Introduktion til big data og Hadoop-økosystemet
- Lektion 2 - HDFS og YARN
- Lektion3 - MapReduce og Sqoop
- Lektion 4 - Grundlæggende om Hive og Impala
- Lektion 5 - Arbejde med Hive og Impala
- Lektion 6 - Typer af dataformater
- Lektion 7 - Avanceret Hive-koncept og partitionering af datafiler
- Lektion 8 - Apache Flume og HBase
- Lektion 9 - Pig
- Lektion 10 - Grundlæggende om Apache Spark
- Lektion 11 - RDD'er i Spark
- Lektion 12 - Implementering af Spark-applikationer
- Lektion13 - Parallel behandling i Spark
- Lektion 14 - Spark RDD-optimeringsteknikker
- Lektion 15 - Spark-algoritmen
- Lektion 16 - Spark SQL
- GRATIS KURSUS - Apache Kafka
- GRATIS KURSUS - Core Java
Prerequisites
Der er ingen forudsætninger for dette kursus. Det er dog en fordel at have et vist kendskab til Core Java og SQL. Vi tilbyder et gratis online kursus i eget tempo"Java essentials for Hadoop", hvis du har brug for at genopfriske dine Core Java-færdigheder.
Duration
Online kursus varighed:
- 1 års adgang til platformen