Machine Learning
Avancé
Correction d’un pipeline avec data leakage via normalisation globale
Type d'évaluation
Mise en situation réelle
Analyse
Intelligence Artificielle
Compétences ciblées
data-leakage
preprocessing
regression
pipeline
bugfix
Scénario Technique
Contexte : Un modèle de régression est entraîné pour prédire des ventes mensuelles. Le Problème : La normalisation des données est effectuée avant la séparation train/test, introduisant une fuite d’information. Extrait logique actuelle : scaler.fit_transform(X) train_test_split(X, y) Contraintes : Appliquer la normalisation uniquement sur les données d’entraînement. Réutiliser les paramètres pour le test. Maintenir reproductibilité. Livrable attendu : Proposer une correction du pipeline éliminant toute fuite de données liée au prétraitement.
Prêt à évaluer ce talent ?
Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.