Correction d’un modèle utilisant un vocabulaire trop large

Type d'évaluation

Mise en situation réelle

Analyse

Intelligence Artificielle

Compétences ciblées

tfidf

feature-selection

optimization

bugfix

text-classification

Scénario Technique

Contexte : Un modèle TF-IDF produit une matrice très volumineuse et difficile à entraîner. Le Problème : Aucun filtrage de vocabulaire n’est appliqué. Extrait logique actuelle : TfidfVectorizer() Sans limite de features. Contraintes : Limiter nombre maximal de features ou filtrer mots rares. Réentraîner le modèle. Comparer performance et temps d’entraînement. Livrable attendu : Proposer une optimisation du pipeline NLP réduisant complexité tout en maintenant performance.

Prêt à évaluer ce talent ?

Accédez à l'interface de test complète pour soumettre votre architecture ou votre code.