Apache Spark
Fondamental
Gestion des valeurs nulles dans un pipeline Spark

Type d'évaluation

Mise en situation réelle

Analyse

Intelligence Artificielle

Compétences ciblées

spark
pyspark
null
fillna
dropna

Scénario Technique

Contexte Un DataFrame de produits contient des valeurs nulles dans les colonnes prix et categorie, bloquant les calculs d'agrégation. Le Problème Les fonctions d'agrégation retournent null dès qu'une valeur manquante est présente. Contraintes Remplacer les nulls de prix par 0.0 avec fillna(). Supprimer les lignes où categorie est null avec dropna(). Aucune librairie externe. Livrable attendu Un script PySpark gérant les nulls de manière appropriée selon la nature de chaque colonne.

Prêt à évaluer ce talent ?

Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.

Commencer le Défis