Scikit-learn
Avancé
Correction d’un pipeline avec fuite de données via encodage global

Type d'évaluation

Mise en situation réelle

Analyse

Intelligence Artificielle

Compétences ciblées

data-leakage
encoding
pipeline
bugfix
classification

Scénario Technique

Contexte : Un modèle de classification catégorielle affiche des performances anormalement élevées. Le Problème : L’encodage des variables catégorielles est appliqué avant séparation train/test. Extrait logique actuelle : encoder.fit_transform(X) train_test_split(X, y) Contraintes : Appliquer encodage uniquement sur le train via Pipeline ou ColumnTransformer. Réappliquer transformation sur test. Livrable attendu : Corriger le pipeline afin d’éliminer toute fuite d’information liée au prétraitement.

Prêt à évaluer ce talent ?

Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.

Commencer le Défis
    Scikit-learn - Correction d’un pipeline avec fuite de données via encodage global | Test Technique & Recrutement