NLP
Fondamental
Correction d’un modèle utilisant un vocabulaire trop large
Type d'évaluation
Mise en situation réelle
Analyse
Intelligence Artificielle
Compétences ciblées
tfidf
feature-selection
optimization
bugfix
text-classification
Scénario Technique
Contexte : Un modèle TF-IDF produit une matrice très volumineuse et difficile à entraîner. Le Problème : Aucun filtrage de vocabulaire n’est appliqué. Extrait logique actuelle : TfidfVectorizer() Sans limite de features. Contraintes : Limiter nombre maximal de features ou filtrer mots rares. Réentraîner le modèle. Comparer performance et temps d’entraînement. Livrable attendu : Proposer une optimisation du pipeline NLP réduisant complexité tout en maintenant performance.
Prêt à évaluer ce talent ?
Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.