Apache Spark
Fondamental
Jointure simple entre deux DataFrames Spark

Type d'évaluation

Mise en situation réelle

Analyse

Intelligence Artificielle

Compétences ciblées

spark
pyspark
join
dataframe
enrichissement

Scénario Technique

Contexte Deux fichiers existent : un fichier de commandes et un fichier de clients. L'équipe souhaite enrichir les commandes avec les informations clients. Le Problème Le script actuel utilise une boucle Python pour associer chaque commande à son client, ce qui est impraticable à grande échelle. Contraintes Utiliser join() de PySpark avec une jointure de type inner sur la colonne client_id. Sélectionner uniquement les colonnes utiles du résultat. Livrable attendu Un script PySpark réalisant une jointure correcte entre les deux DataFrames et affichant le résultat enrichi.

Prêt à évaluer ce talent ?

Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.

Commencer le Défis