Scikit-learn
Avancé
Correction d’un pipeline avec fuite de données via encodage global
Type d'évaluation
Mise en situation réelle
Analyse
Intelligence Artificielle
Compétences ciblées
data-leakage
encoding
pipeline
bugfix
classification
Scénario Technique
Contexte : Un modèle de classification catégorielle affiche des performances anormalement élevées. Le Problème : L’encodage des variables catégorielles est appliqué avant séparation train/test. Extrait logique actuelle : encoder.fit_transform(X) train_test_split(X, y) Contraintes : Appliquer encodage uniquement sur le train via Pipeline ou ColumnTransformer. Réappliquer transformation sur test. Livrable attendu : Corriger le pipeline afin d’éliminer toute fuite d’information liée au prétraitement.
Prêt à évaluer ce talent ?
Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.