Apache Spark
Fondamental
Gestion des valeurs nulles dans un pipeline Spark
Type d'évaluation
Mise en situation réelle
Analyse
Intelligence Artificielle
Compétences ciblées
spark
pyspark
null
fillna
dropna
Scénario Technique
Contexte Un DataFrame de produits contient des valeurs nulles dans les colonnes prix et categorie, bloquant les calculs d'agrégation. Le Problème Les fonctions d'agrégation retournent null dès qu'une valeur manquante est présente. Contraintes Remplacer les nulls de prix par 0.0 avec fillna(). Supprimer les lignes où categorie est null avec dropna(). Aucune librairie externe. Livrable attendu Un script PySpark gérant les nulls de manière appropriée selon la nature de chaque colonne.
Prêt à évaluer ce talent ?
Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.