Domino Data Lab : la plateforme de machine learning MLOps
Domino Data Lab est une plateforme de machine learning orientée MLOps. Elle s'articule autour d'une IA Factory taillée pour unifier la gestion et la gouvernance des modèles d'apprentissage, ainsi que la collaboration autour de ces derniers.
Domino Data Lab, c'est quoi ?
Se présentant comme une IA factory, Domino Data Lab comprend des outils pour développer, déployer, monitorer et manager des modèles de machine learning. La plateforme s'articule autour de trois briques principales : un système de stockage de caractéristiques d'apprentissage, une usine de modèles, et une infrastructure de portail en self-service pour accéder aux ressources machine nécessaires à la phase d'entrainement.
Quelles sont les fonctionnalités de Domino MLOps Platform ?
Au sein de ses trois principales briques, Domino Data Lab intègre de nombreuses fonctionnalités :
- Système de stockage de caractéristiques d'apprentissage : gestion d'espace de travail, gestion de projet, contrôle de version, intégration à Git et Jira, gouvernance, model lineage...
- Usine à modèles : elle intègre un studio de data science, mais aussi des outils de CI/CD (intégration et livraison continues) et de déploiement des modèles par API. La model factory gère les modèles Python et R, mais aussi ceux issus des plateformes de Sas, MatLab et DataRobot. En aval, une console de monitoring mesure leur performance, les écarts, les dérives, etc.
- Portail en self-service : il permet en quelques clics de configurer les clusters de calcul Kubernetes nécessaires au déploiement des environnements d'apprentissage. Le portail donne accès aux frameworks de calcul distribué Spark, Ray ou Dask, et permet de propulser différents environnements de développement : Python, R, JupyterLab, VSCode, Sas, MatLab...
Est-ce que Domino Data Lab est gratuit ?
Domino Data Lab est disponible sous une formule payante. Pour connaître les tarifs, il est nécessaire de prendre contact avec la société. Il est toutefois possible de découvrir ses différentes fonctionnalités grâce à une version d’essai gratuite pour une période de 14 jours.
Domino Model Monitor, c’est quoi ?
A l’issue du développement et du déploiement de modèles, Domino Model Monitor est un utilitaire qui assure, entre autres, le suivi des performances. Il anticipe toute altération, notamment en identifiant la perte de données ou un changement dans le code source. La gestion par tableau de bord sert à personnaliser son dispositif de surveillance, analyser l’impact commercial et lancer des actions spécifiques dites "proactives".
Domino Data Lab vs Dataiku
Dataiku se présente historiquement sous la forme d'un studio de data science axé machine learning. Face à Domino Data Lab et son orientation MLOps, Dataiku a largement rattrapé son retard. La plateforme couvre désormais l'ensemble du cycle de vie des modèles de machine learning. Sur le plan du collaboratif, elle fait également le poids grâce à de multiples fonctionnalités : wiki, partage de tableaux de bord de résultats, système de gestion des rôles et de traçabilité des actions, etc.
A la différence de Domino Data Lab, Dataiku intègre y compris un moteur de machine learning automatisé (auto ML).
Domino Data Lab vs Databricks
Databricks se positionne avant tout comme une data platform universelle répondant à la fois aux cas d'usage orientés entrepôt de données et BI, data lake, mais aussi streaming de données et calcul distribué.
Reste que Databricks s'enrichit de plus en plus de fonctionnalités orientées machine learning. La société de San Francisco a acquis l'environnement de data science low-code / no code 8080 Labs en octobre 2021, puis la plateforme de MLOps Cortex Labs en avril 2022. Deux technologies qu'elle est en train d'intégrer.
Domino Data Lab : documentation, tutoriels et Wiki
Domino Data Lab propose de la documentation et des guides de démarrage, ainsi que des tutoriels vidéo pour bien se familiariser avec ses différentes ressources.