MLOps : qu'est-ce que c'est ?

MLOps : qu'est-ce que c'est ? Abréviation de machine learning operations, le MLOps a pour objectif de concevoir des modèles d'apprentissage adaptés à leur déploiement en production, puis de les maintenir tout au long de leur cycle de vie.

Le MLOps, qu'est-ce que c'est ?

Le MLOps a objectif de concevoir et maintenir des modèles de machine learning utilisables sur le terrain. A l'instar du DevOps pour les applications, il passe par la maîtrise de l'ensemble de leur cycle de vie. L'objectif ? Tenir compte des contraintes de déploiement dès l'étape de conception et d'entrainement du modèle. Suivant la logique des méthodes agiles, le MLOps se concrétise par la mise en place de pipelines d'apprentissage combinés à des outils de monitoring des modèles. 

L'ingénieur MLOPs en est le protagoniste. Cette profession émergente est le produit du métissage entre le data scientist (spécialiste de la science des données) et du data ingénieur.

Quelles sont les briques du MLOps ?

Le MLOps passe par la mise en place de plusieurs briques visant à piloter l'intégralité du cycle du machine learning : 

  • Une boutique de modèles réutilisables (model store),
  • Une boutique de caractéristiques réutilisables (feature store),
  • Un outil d'intégration et de livraison continu (CI/CD),
  • Un outil de monitoring et de traçabilité des modèles,
  • Un environnement de collaboration.

Quels sont les outils de MLOps ?

Parmi les outils majeurs de MLOps, on peut citer :

  • DataiKu (application propriétaire),
  • DataRobot (application propriétaire),
  • Domino Data (application propriétaire),
  • Kubeflow (application open source créée par Google),
  • Metaflow (application open source),
  • MLFlow (application open source),
Comparatifs des outils de MLOps
Techno Experiment tracking et versioning AutoML Orchestration et gestion des déploiement Monitoring Collaboration
Dataiku x   x x x
Datarobot x x x x  
Domino Data  x   x x x
Kubeflow     x    
Metaflow x        
MLFlow x   x    
Autres solutions souvent évoquées : Algorithmia (acquis par DataRobot), Cnvrg.io, Polyaxon, Valohai et plus récemment Comet, Landing AI ou encore Weights & Biases.

Du côté des cloud providers, AWS, Google et Microsoft Azure intègrent tous trois la dimension MLOps à leur plateforme de machine learning respective, Amazon SageMaker pour le premier, Vertex pour le deuxième et Azure Machine Learning pour le troisième. 

Comment se former au MLOps ?

Plusieurs modules de formation au MLOps sont proposés en ligne et dans les facultés de sciences ou les écoles d’ingénieur. L’ingénieur MLOps est avant tout un spécialiste de la donnée. Une formation de data scientist est le sésame pour entrer dans la profession. Il doit maîtriser en outre les règles de la programmation et l’ingénierie logicielle.

Datascientest est pour l'heure le seul institut à proposer une formation au MLOps référencée sur l'Application formation, formation permettant par conséquent un financement via son compte formation. 

MLOps vs DevOps

Le DevOps, contraction en anglais de Developement (Dev) et Operations (Ops), combine deux fonctions essentielles : le développement d’application et l’ingénierie de système. L'enjeu étant de prendre en compte les contraintes de déploiement dès la phase de programmation et ainsi améliorer la qualité du produit fini. Le MLOps découle du DevOps, mais répond plus spécifiquement aux applications orientées machine learning.