Auto ML : définition et techniques de machine learning automatisé
L'auto ML, ou automatisation du machine learning, est conçu pour générer automatiquement des modèles d'apprentissage optimisés en fonction de cas d'usage.
Qu’est-ce que l’auto ML ?
Comme son nom l'indique, l’auto ML (ou automated machine learning) automatise la création d'un modèle de machine learning. Cette méthode no code met ainsi le développement de modèles d'IA entre les mains des experts non-spécialistes en data science.
En général, les outils d'auto ML vont se fonder sur des algorithmes relativement simples et explicables pour bâtir leurs modèles, par exemple une classification, une régression linéaire ou la prévision d'une série chronologique.
Comment fonctionne l'auto ML ?
En fonction d'une problématique à résoudre (maintenance préventive, prédiction financière, reconnaissance d'images...), l'auto ML sélectionne d'abord plusieurs algorithmes possibles. Ensuite, il les entraîne sur la base d'un set de données d'apprentissage préalablement défini.
Via une couche de scoring, il compare leurs résultats en mixant plusieurs combinaisons d'hyperparamètres. Dans le cas du deep learning, ces derniers correspondent par exemple au nombre de couches du réseau de neurones et au nombre de nœuds au sein de chaque couche. Compte tenu de l'objectif cible à atteindre, le modèle le plus performant est retenu au final.
Quel est l'avantage de l'auto ML ?
Le principal avantage de l’auto ML réside dans le gain de temps du traitement des données et des phases de test nécessaires à la mise en fonctionnement d'un modèle suffisamment performant. Grâce à la capacité de centralisation des données, leur gestion gagne également en cohérence.
Comme indiqué plus haut, il n’est pas non plus nécessaire de posséder des connaissances avancées en data science ou en intelligence artificielle pour se recourir à l’auto ML. Il convient toutefois d’adapter l’usage de l’auto ML au contexte. Certaines situations demandent une intervention humaine pour choisir l’approche de programmation la plus pertinente.
Quelles sont les différents outils d’auto ML ?
Il existe différentes technologies pour se servir de l’auto ML. Parmi les principales techniques employées, on peut évoquer :
- DataRobot : plateforme spécialisée dans le benchmarking des modèles, elle permet de réaliser des modèles de maintenance préventive, de reconnaissance d’images, voire de prédiction financière.
- Google Vertex for autoML : un système qui fonctionne sur le double principe de l’apprentissage par renforcement et non supervisé, notamment pour gérer le feature engineering et la mise en production des modèles.
- Dataiku : cette technologie d'auto ML intégrée au studio de data science de Dataiku propose un système de visualisation de codes afin de mieux appréhender l’architecture sélectionnée et d’interpréter les résultats obtenus.
- Knime : cette solution permet d’effectuer une analyse intégrative des données à la suite de leur traitement. Il convient pour réaliser la partition de data sets.