EnglishDeutschFrançaisEspañolPortuguês

Databricks · DB-SPARK · Associate

Databricks Certified Associate Developer for Apache Spark

Valide les compétences fondamentales en développement Apache Spark, incluant l'API DataFrame, Spark SQL, le Structured Streaming et l'optimisation d'applications. 45+ questions pratiques IA avec explications. Essai gratuit, garantie de réussite.

Essai gratuit

7 jours d’essai gratuit, sans carte bancaire

45 Questions
90min Durée
70/ 100 Score requis
$200 Frais d’examen

À propos de l’examen

L'examen Databricks Certified Associate Developer for Apache Spark évalue votre capacité à développer des applications avec Apache Spark. Il couvre les API DataFrame et DataSet, Spark SQL, l'architecture des clusters, le Structured Streaming et l'optimisation des performances. L'examen est indépendant du langage sur le plan conceptuel, mais une bonne connaissance des implémentations en Python ou en Scala est attendue.

Contenu de l’examen

L'examen comporte 45 questions à choix multiples notées, à compléter en 90 minutes. Aucun support n'est autorisé. Des questions pilotes non notées peuvent apparaître. Disponible en ligne ou dans un centre d'examen. Databricks ne publie pas de score de passage officiel. Le score affiché est une estimation prudente basée sur les standards du secteur.

DataFrame and DataSet API Applications 30%

Création d'applications Spark à l'aide des API DataFrame et DataSet, transformations, actions et schémas de manipulation des données.

Apache Spark Architecture and Components 20%

Architecture des clusters Spark, rôles du driver et des executors, gestion de la mémoire, partitionnement et optimiseur Catalyst.

Using Spark SQL 20%

Requêtes SQL sur Spark, création et gestion des tables et vues, fonctions de fenêtrage (window functions) et optimisation des performances SQL.

Troubleshooting and Tuning 10%

Débogage d'applications Spark, compréhension de l'interface Spark UI, identification des goulets d'étranglement, optimisation du shuffle et stratégies de mise en cache.

Structured Streaming 10%

Création d'applications de streaming, watermarking, modes de sortie, triggers et traitement avec état (stateful processing).

Using Spark Connect 5%

Déploiement d'applications avec Spark Connect, connectivité distante et architecture client-serveur découplée.

Pandas API on Apache Spark 5%

Utilisation de l'API Pandas sur Spark pour effectuer des opérations DataFrame familières à grande échelle, et compréhension des différences avec Pandas natif.

À quoi s’attendre

multiple choice
100%

Où les candidats échouent

La section API DataFrame (30 %) requiert plus qu'une connaissance basique de l'API. Attendez-vous à des questions sur l'évaluation paresseuse (lazy evaluation), la distinction entre actions et transformations, et le comportement au niveau des partitions. Les questions d'architecture (20 %) testent la compréhension des mécanismes internes de Spark comme l'optimiseur Catalyst et la gestion mémoire Tungsten. Spark Connect (5 %) est un sujet plus récent que de nombreux guides d'étude négligent, mais il apparaît bel et bien à l'examen.

Logistique de l’examen

Les frais d'inscription s'élèvent à 200 USD. Disponible uniquement en anglais. Aucun prérequis. Une expérience de 6 mois ou plus en développement Apache Spark est recommandée. La certification est valable 2 ans.

Mode de passage Online proctored or test center
Politique de reprise No mandatory waiting period. Retake fee applies.
Validité 2 ans
Débouchés Développeur Spark, Ingénieur Data, Développeur Big Data, Ingénieur en systèmes distribués
Renouvellement Recertification requise tous les 2 ans en repassant la version actuelle de l'examen.
Temps de préparation ~80 heures

Prêt à réussir ?

Rejoignez des milliers de professionnels qui ont réussi grâce à la pratique assistée par IA.

Essai gratuit