Vendredi 20 Juin 2025
Scikit-learn, la bibliothèque open source de référence pour le machine learning en Python, continue son développement avec la sortie de la version 1.7, disponible depuis le 5 juin. Cette nouvelle version optimise l'expérience utilisateur, assure une meilleure compatibilité avec d'autres solutions et améliore l'efficacité des processus d'apprentissage automatique.
Améliorations et nouvelles fonctionnalités

Visualisation HTML améliorée des estimateurs
L'affichage HTML dans Jupyter propose désormais la liste complète des paramètres, mettant en évidence ceux qui diffèrent des réglages par défaut. Un bouton simplifie la copie des noms pleinement qualifiés, accélérant la configuration des pipelines imbriqués et la recherche d'hyperparamètres.
Validation personnalisée pour Gradient Boosting basé histogramme
Les modèles HistGradientBoosting peuvent maintenant recevoir un ensemble de validation explicite (X_val, y_val, sample_weight_val) grâce à la méthode .fit() afin de mieux ajuster l'arrêt anticipé. Cette fonctionnalité améliore la gestion du surapprentissage, mais elle dépend du système de routage de métadonnées (enable_metadata_routing=True), qui est encore peu répandu.
Visualisation ROC native depuis des résultats croisés
La nouvelle méthode from_cv_results() pour RocCurveDisplay permet de créer automatiquement plusieurs courbes ROC à partir des résultats de validation croisée (cross_validate). Cette fonctionnalité facilite l'analyse comparative des modèles et intègre directement le diagnostic visuel dans les workflows de machine learning, sans nécessiter d'outils externes.
Compatibilité étendue avec l'API Array
Plusieurs métriques (e.g., fbeta_score, explained_variance_score) acceptent dorénavant des structures de données compatibles avec l'API Array (en particulier celles issues de PyTorch ou CuPy). Le module array-api-compat est intégré de manière native.
Mises à jour du Perceptron multicouche
Le Perceptron multicouche inclut maintenant la perte Poisson, en plus de la perte squared_error par défaut. Il prend aussi en charge les poids d'échantillon, ce qui améliore sa flexibilité pour différentes applications.
Migration vers les tableaux clairsemés
Tous les estimateurs qui peuvent recevoir les matrices creuses classiques (scipy.sparse) en entrée, peuvent désormais utiliser les nouveaux tableaux clairsemés (sparray), préparant ainsi la transition en cours de SciPy.
Installation
La nouvelle version est installable via pip : pip install --upgrade scikit-learn
ou avec conda : conda install -c conda-forge scikit-learn