Publication de Scikit-learn 1.7 : pour une utilisation simplifiée et une performance accrue

Vendredi 20 Juin 2025

Scikit-learn, la bibliothèque open source de référence pour le machine learning en Python, continue son développement avec la sortie de la version 1.7, disponible depuis le 5 juin. Cette nouvelle version optimise l'expérience utilisateur, assure une meilleure compatibilité avec d'autres solutions et améliore l'efficacité des processus d'apprentissage automatique.

Améliorations et nouvelles fonctionnalités

Publication de Scikit-learn 1.7 : pour une utilisation simplifiée et une performance accrue

Visualisation HTML améliorée des estimateurs

L'affichage HTML dans Jupyter propose désormais la liste complète des paramètres, mettant en évidence ceux qui diffèrent des réglages par défaut. Un bouton simplifie la copie des noms pleinement qualifiés, accélérant la configuration des pipelines imbriqués et la recherche d'hyperparamètres.

Validation personnalisée pour Gradient Boosting basé histogramme

Les modèles HistGradientBoosting peuvent maintenant recevoir un ensemble de validation explicite (X_val, y_val, sample_weight_val) grâce à la méthode .fit() afin de mieux ajuster l'arrêt anticipé. Cette fonctionnalité améliore la gestion du surapprentissage, mais elle dépend du système de routage de métadonnées (enable_metadata_routing=True), qui est encore peu répandu.

Visualisation ROC native depuis des résultats croisés

La nouvelle méthode from_cv_results() pour RocCurveDisplay permet de créer automatiquement plusieurs courbes ROC à partir des résultats de validation croisée (cross_validate). Cette fonctionnalité facilite l'analyse comparative des modèles et intègre directement le diagnostic visuel dans les workflows de machine learning, sans nécessiter d'outils externes.

Compatibilité étendue avec l'API Array

Plusieurs métriques (e.g., fbeta_score, explained_variance_score) acceptent dorénavant des structures de données compatibles avec l'API Array (en particulier celles issues de PyTorch ou CuPy). Le module array-api-compat est intégré de manière native.

Mises à jour du Perceptron multicouche

Le Perceptron multicouche inclut maintenant la perte Poisson, en plus de la perte squared_error par défaut. Il prend aussi en charge les poids d'échantillon, ce qui améliore sa flexibilité pour différentes applications.

Migration vers les tableaux clairsemés

Tous les estimateurs qui peuvent recevoir les matrices creuses classiques (scipy.sparse) en entrée, peuvent désormais utiliser les nouveaux tableaux clairsemés (sparray), préparant ainsi la transition en cours de SciPy.

Installation

La nouvelle version est installable via pip : pip install --upgrade scikit-learn ou avec conda : conda install -c conda-forge scikit-learn

Publication de Scikit-learn 1.7 : pour une utilisation simplifiée et une performance accrue

Vendredi 20 Juin 2025

Ils nous font confiance