Курсове Big Data Hadoop and Spark Developer
Курсове за обучение по Big Data Hadoop and Spark Developer, предоставени от iLEARN
Наличност и цени на курсовете Big Data Hadoop and Spark Developer
Препоръчани продукти
В тази витрина ще откриете селекция от курсове за обучение и изпити в контекста на Big Data Hadoop and Spark Developer .
Ако не виждате желания от вас курс или изпит, моля, свържете се с нас.
BIG DATA HADOOP AND SPARK DEVELOPER
Светът става все по-цифров и значението на големите данни и анализа на данни ще продължи да нараства през следващите години. Изборът на кариера в областта на големите данни и анализа на данни може да е точно това, което сте се опитвали да намерите, за да отговорите на очакванията си за кариера.
Курсът за обучение по Big Data Hadoop ще ви научи на концепциите на рамката Hadoop, формирането ѝ в клъстерна среда и ще ви подготви за сертификата CCA175 Big Data на Cloudera.
СЕРТИФИЦИРАНЕ ЗА РАЗРАБОТЧИЦИ НА ГОЛЕМИ ДАННИ HADOOP И SPARK
Няма наличен изпит, но за да получите сертификат, трябва да завършите 85% от курса, един проект и един симулационен тест, с минимален резултат 80%.
КУРС ЗА РАЗРАБОТЧИЦИ НА ГОЛЕМИ ДАННИ HADOOP И SPARK
С този курс за разработчици на големи данни Hadoop ще научите рамката за големи данни с помощта на Hadoop и Spark, включително HDFS, YARN и MapReduce. Курсът ще покрие и Pig, Hive и Impala за обработка и анализ на големи масиви от данни, съхранявани в HDFS, и ще използва Sqoop и Flume за постъпване на данни.
Ще ви бъде показана обработка на данни в реално време с помощта на Spark, включително функционално програмиране в Spark, реализиране на Spark приложения, разбиране на паралелната обработка в Spark и използване на техники за оптимизация на Spark RDD. Ще се запознаете също така с различните интерактивни алгоритми в Spark и ще използвате Spark SQL за създаване, трансформиране и заявяване на форми на данни.
И накрая, ще трябва да изпълните реални индустриални проекти с помощта на CloudLab в областите на банковото дело, телекомуникациите, социалните медии, застраховането и електронната търговия.
Тук по-долу можете да прочетете листа на курса с информация за Big Data Hadoop and Spark Developer.
Objectives
В края на курса ще можете да разберете:
- Различните компоненти на екосистемата Hadoop, като Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume и Apache Spark
- Архитектура на Hadoop Distributed File System (HDFS) и YARN
- MapReduce и неговите характеристики и усвояване на разширени концепции за MapReduce
- Различни видове файлови формати, схема Avro, използване на Avro с Hive и еволюция на Sqoop и схемата
- Flume, архитектура на Flume, източници, поглътители на Flume, канали и конфигурации на Flume
- HBase, нейната архитектура и съхранение на данни и научете разликата между HBase и RDBMS
- Устойчиви масиви от данни за разпределение (RDD) в детайли
- Често срещани случаи на използване на Spark и различни интерактивни алгоритми
Ще можете също така да:
- Да поглъщате данни с помощта на Sqoop и Flume
- Да създавате бази данни и таблици в Hive и Impala, да разбирате HBase и да използвате Hive и Impala за разделяне на данни
- Да придобиете практически познания за Pig и неговите компоненти
- Да програмирате функционално в Spark и да внедрявате и изграждате Spark приложения
- Получете задълбочени познания за паралелната обработка в Spark и техниките за оптимизация на Spark RDD
- Създаване, трансформиране и заявяване на рамки от данни със Spark SQL
Who it is aimed at
Възможностите за кариера в областта на големите данни се увеличават, а Hadoop бързо се превръща в задължителна технология в архитектурата на големите данни. Обучението по Big Data е подходящо за професионалисти в областта на ИТ, управлението на данни и анализа, включително:
- Разработчици на софтуер и архитекти
- Специалисти по анализи
- Старши ИТ специалисти
- Специалисти по тестване и мейнфрейм
- Специалисти по управление на данни
- Специалисти по бизнес разузнаване
- Ръководители на проекти
- Начинаещи учени в областта на данните
- Завършили студенти, които искат да направят кариера в областта на анализа на големи данни
Contents
Курсът обхваща следните теми:
- Въведение в курса
- Урок 1 - Въведение в големите данни и екосистемата Hadoop
- Урок 2 - HDFS и YARN
- Урок 3 - MapReduce и Sqoop
- Урок 4 - Основи на Hive и Impala
- Урок 5 - Работа с Hive и Impala
- Урок 6 - Видове формати на данни
- Урок 7 - Разширена концепция за Hive и разделяне на файлове с данни
- Урок 8 - Apache Flume и HBase
- Урок 9 - Pig
- Урок 10 - Основи на Apache Spark
- Урок 11 - RDDs в Spark
- Урок 12 - Изпълнение на приложения на Spark
- Урок 13 - Паралелна обработка в Spark
- Урок 14 - Техники за оптимизация на RDD в Spark
- Урок 15 - Алгоритъм на Spark
- Урок 16 - Spark SQL
- БЕЗПЛАТЕН КУРС - Apache Kafka
- БЕЗПЛАТЕН КУРС - Core Java
Prerequisites
Няма предварителни условия за този курс. Въпреки това е полезно да имате известни познания по Core Java и SQL. Предлагаме безплатен самостоятелен Онлайн курс"Java essentials for Hadoop", ако имате нужда да опресните уменията си по Core Java.
Duration
Продължителностна онлайн курса:
- 1 година достъпдо платформата