logo small



Avec ce cours Big Data Hadoop, vous apprendrez le système big data en utilisant Hadoop et Spark, y compris HDFS, YARN, et MapReduce. Le cours abordera aussi Pig, Hive et Impala pour traiter et analyser des grands ensembles de données stockées dans le HDFS et utiliser Sqoop et Flume pour l’importation des données.

On vous montrera le traitement des données en temps réel en utilisant Spark, notamment la programmation fonctionnelle dans Spark, la mise en œuvre des applications Spark, la compréhension du traitement parallèle dans Spark et l’utilisation des techniques d’optimisation Spark RDD. Vous apprendrez aussi les différents algorithmes interactifs dans Spark et à utiliser Spark SQL pour créer, transformer et rechercher les formulaires de données.

Finalement, il vous sera demandé d’exécuter des projets concrets et industriels en utilisant CloudLab dans le domaine bancaire, de la télécommunication, des réseaux sociaux, des assurances, et du commerce électronique.

DURÉE D'ACCÈS
  • 1 an d'accès à la plateforme
DÉTAILS DU COURS EN LIGNE BIG DATA HADOOP AND SPARK DEVELOPER
  • 16 leçons
  • Cours gratuit inclus - Apache Kafka
  • Cours gratuit inclus - Core Java
  • 5 projets industriels concrets
  • Durée de 24 heures
  • Accès 24 heures sur 24
CARACTÉRISTIQUES ET FORMAT DU COURS EN LIGNE

Il n’y a pas d’examen disponible, mais vous devez compléter 85% du cours, un projet et un test de simulation, avec un score minimum de 80%, pour obtenir une certification.

Lieu

En ligne

Prix par personne

649,00€

Durée de l'accès au cours

1 an

Objectifs

À la fin du cours vous serez capables de comprendre:

  • Les différents composants de l’écosystème Hadoop comme Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume et Apache Spark 
  • Hadoop Distributed File System (HDFS) et l’architecture YARN
  • MapReduce et ses caractéristiques et assimiler des concepts de MapReduce avancés
  • Différents types de formats de fichier, le schéma Avro, l’utilisation de Avro avec Hive et l’évolution de Sqoop et de Schema
  • Flume, l’architecture de Flume, les sources, les chutes de Flume, les réseaux et les configurations de Flume
  • HBase, son architecture et son stockage de données, et apprendre la différence entre HBase et RDBMS
  • Resilient Distribution Datasets (RDD) en détail
  • Les scénarios d’usage de Spark les plus communs et différents algorithmes interactifs

Vous serez aussi capables de:

  • Introduire des données en utilisant Sqoop et Flume
  • Créer une base de données et des tableaux dans Hive et Impala, comprendre HBase, et utiliser Hive et Impala pour la séparation
  • Se familiariser avec Pig et ses composants
  • Faire une programmation fonctionnelle dans Spark, exécuter et construire des applications Spark
  • Acquérir une compréhension approfondie du traitement parallèle dans Spark et des techniques d’optimisation Spark RDD
  • Créer, transformer et rechercher des trames de données avec Spark SQL

Adressé à

Les opportunités de carrière dans le big data sont en hausse et Hadoop devient rapidement une technologie essentielle dans l’architecture big data. La formation Big Data est appropriée pour la Technologie de l’Information, la gestion des données et les professionnels des analyses de données, notamment:

  • Développeurs de logiciels et architectes
  • Professionnels en analyse des données
  • Professionnels supérieurs dans la Technologie de l’Information
  • Professionnels en tests et unités centrales
  • Professionnels en gestion des données
  • Professionnels en informatique décisionnelle
  • Chefs de projet
  • Futurs data scientists
  • Diplômés qui comptent faire carrière dans l’analyse des données

Contenus

Le cours aborde les sujets suivants:

  • Introduction au cours
  • Leçon 1 - Introduction aux big data et à l’écosystème Hadoop 
  • Leçon 2 - HDFS et YARN 
  • Leçon 3 - MapReduce et Sqoop 
  • Leçon 4 - Les bases de Hive et Impala 
  • Leçon 5 - Travailler avec Hive et Impala 
  • Leçon 6 - Types de formats de données 
  • Leçon 7 - Concepts Hive avancés et séparation des fichiers de données 
  • Leçon 8 - Apache Flume et HBase 
  • Leçon 9 - Pig 
  • Leçon 10 - Les bases d’Apache Spark 
  • Leçon 11 - RDDs dans Spark 
  • Leçon 12 - Exécution des applications Spark 
  • Leçon 13 - Traitement parallèle de Spark
  • Leçon 14 - Techniques d’optimisation Spark RDD
  • Leçon 15 - Algorithme Spark 
  • Leçon 16 - Spark SQL 
  • COURS GRATUIT - Apache Kafka
  • COURS GRATUIT - Core Java

Prérequis

Il n’y a aucun prérequis pour ce cours. Cependant, avoir une connaissance de Core Java et de SQL est utile. Nous offrons un cours en ligne gratuit et d’auto-formation "Java essentials for Hadoop" si vous avez besoin de réviser vos compétences Core Java.

Langue matériel cours

Anglais

Confidentialité et gestion des données à caractère personnel de la part de ILX Group*

Afin de pouvoir bénéficier des services offerts par ILX Group, nous vous prions de prendre connaissance de la politique de confidentialité présente à ce lien et de fournir votre consentement. Le consentement est obligatoire pour l'achat et la fourniture du service.



PROMOTION - AJOUTEZ GRATUITEMENT LE COURS ScrumLearn Master Certified

Avec l'achat d'un paquet "cours en ligne avec examen", iLEARN offre la possibilité d'accéder gratuitement au cours en ligne ScrumLearn Master Certified pendant 30 jours.
iLEARN vous donne également la possibilité d'ajouter l'examen ScrumLearn Master Certified pour seulement 149€.
Le cours et l'examen sont disponibles en français, anglais, italien et espagnol.





Big Data Hadoop and Spark Developer 1 an sans examen cours en ligne en dispensé par iLEARN Innovative Learning

logo footer

iCONS - Innovative Consulting S.r.l.
Galleria J.F. Kennedy 10/A
20831 Seregno (MB) - Italy

0039 0362 330107
[email protected]

ISO 9001

Logo CSQ

2020 © iCONS - Innovative Consulting S.r.l.

iLEARN is a business unit of iCONS - Innovative Consulting Srl - VAT number 03334560962
iCONS - Innovative Consulting srl is certified ISO 9001 for training and consulting services.

Lean IT is a trademark of Lean IT Association LLC. DASA DevOps is a trademark of Agile Skills Association LLC 2018. BRMP® is a trademark of Business Relationship Management Institute, Inc. The Six Sigma logo is a Trade Mark of 6sigmastudy™ (a brand of VMEdu,Inc.). The SCRUMStudy logo is a Trade Mark of SCRUMStudy™ (a brand of VMEdu,Inc.). CAPM®, PMP®, PMI-ACP®, PMI-RMP® and PMI-PgMP® are Registered Trade Marks of PMI. ITIL®, PRINCE2®, PRINCE2 Agile®, P3O®, MSP®, MoP®, M_o_R® and MoV® are Registered Trade Marks of AXELOS Limited. The Swirl Logo™ are Trade Marks of AXELOS Limited. CCBA® and CBAP are registered certification marks owned by International Institute of Business Analysis™ (IIBA®). These certification marks are used with the express permission of International Institute of Business Analysis. TOGAF® and ArchiMate® are registered trademarks of The Open Group in the United States and other countries. COBIT® 5, CISA® and CISM® are Registered Trade Marks of the Information Systems Audit and Control Association and the IT Governance Institute. APMG-International™ AgilePM®, APMG-International™ ISO/IEC 20000, APMG-International™ ISO/IEC 27001, APMG-International™ Sourcing Governance, APMG-International™ Service Catalogue, APMG-International™ Change Analyst, APMG-International™ CMDB, APMG-International™ GDPR Awareness, APMG-International™ Praxis Framework, APMG-International™ Problem Analyst, APMG-International™ Change Management, APMG- International™ VeriSM and APMG-International™ Managing Benefits are Trade Marks of APM Group Limited.