Prérequis
- Connaissance de base d'Apache Spark.
- Quelques connaissances du Cloud.
Fonctionnalités
- Une formation qui accorde une large place à la pratique : de nombreux exercices seront réalisés tout au long de la formation.
- Des retours d'expérience et conseils de consultants experts du domaine.
Public ciblé
- Data Engineer, Data Scientist, Data Analyst & Data Architectes
DESCRIPTION DU COURS
Databricks offre beaucoup de flexibilité de création, gestion et l’utilisation d’un cluster Spark. On peux utiliser Databricks pour créer des cluster dans un cloud AWS, Azure ou Google.
Dans cette formation on va présenter Databricks avec Azure cloud, la déférence avec les autres cloud n’est pas majeur.
La formation prépare les Data Engineer à créer des cluster et utiliser Spark, commence par une introduction à Databricks pour comprendre l’origine et l’historique, la relation avec Apache Spark, et comment créer et gérer un Cluster.
Aussi on présente les types de cluster et de ressources, la partie DevOps et la partie sécurité et monitoring avec Databricks.
CERTIFICATION
DataTipsLearning vous délivre un certificat de complétion.
Aussi on vous aide à préparer un certificat officiel Spark Databricks ou un certificat Azure Data Engineer.
NOUS ABORDERONS LES SUJETS SUIVANTS
Le plan complet de la formation est bien décrit dans la partie détails, ou vous pouvez le télécharger aussi.
Essentiellement on va aborder les sujets suivants:
- Présenter Databricks et Apache Spark.
- Créer un Workspace et un cluster.
- Se connecter à de différentes sources pour lire et écrire des données.
- Comprendre les différents types de cluster et de ressources.
- Mettre en œuvre un traitement en streaming.
- Connecter Databricks à des outils gestion de versions comme Git.
- Comprendre la partie DevOps & Sécurité de Databricks.
Course Features
- Lectures 21
- Quizzes 1
- Duration 3 jours
- Skill level Tous niveaux
- Language Anglais/Français
- Students 60
- Assessments Yes