Google Vertex AI : la plateforme d'IA en mode cloud de Google
Google Vertex AI, ex-Google AI Platform, est une plateforme cloud de machine learning conçue pour développer, entrainer et déployer des modèles d'apprentissage à grande échelle.
Google Vertex, c’est quoi ?
Google Vertex AI, anciennement appelé Google AI Platform, est une plateforme cloud de machine learning conçue pour développer et entrainer des modèles d'apprentissage à grande échelle, puis les déployer.
Google Vertex AI recouvre l'ensemble du cycle de vie d'un modèle de machine learning, de la préparation des données d'apprentissage au déploiement du modèle en production.
Quelles sont les fonctionnalités de Google Vertex ?
Google Vertex intègre nativement plusieurs services cloud :
- Un service d'étiquetage permet de solliciter des équipes de Google pour labelliser les données d'entrainement (image, vidéo, texte) en cas d'apprentissage supervisé.
- Un service d'entrainement permet de régler les hyperparamètres du modèle (hyperparameter tuning) via Vertex AI Vizier, et d'exécuter l'apprentissage du modèle sur une infrastructure Google Cloud GPU ou TPU.
- Un service de prédiction déploie le modèle, ou l'infère dans le langage des data scientis, en vue de réaliser les prédictions recherchées.
- Vertex AI Model Monitoring estime les écarts entre le résultat du modèle une fois déployé et le résultat recherché. Un décalage qui peut porter également sur la distribution des données de caractéristiques.
- Vertex Explainable AI identifie l'importance de telle ou telle caractéristique dans le calcul des résultats au sein des modèles de classification et de régression.
- Vertex AI Pipelines décrit les pipelines de machine learning, de la phase d'apprentissage au déploiement, en vue de faciliter leur réutilisation dans une logique de MLOps. Vertex ML Metadata assure leur traçabilité.
- Vertex AI Feature Store stocke les caractéristiques des modèles de machine learning. Il permet de les organiser, de les partager au sein des équipes de data science, et de faciliter leur réutilisation.
- Vertex AI Model Registry gère les modèles développés au sein d'une bibliothèque.
Comment utiliser Google Vertex ?
La console Google Cloud pilote l'entrainement des modèles d'apprentissage, l'allocation des ressources machines nécessaires, mais aussi le versioning des modèles. Elle donne accès à Google Monitoring pour mesurer la performance du modèle en phase de validation, ou en phase de production en vue d'évaluer la nécessité de le réentraîner.
En amont, Google recommande de recourir à son service en ligne de commande (CLI) pour gérer Google Vertex. Pour créer les modèles, un environnement de développement reposant sur JupyterLab, baptisé Baptisé Vertex AI Workbench, propose une série de packages de deep learning compatibles avec les bibliothèques de machine learning les plus populaires (TensorFlow , PyTorch, Scikit-Learn). En aval, Google conseille de d'utiliser l'API REST pour accéder aux prédictions.
Qu'est-ce que Learning VM Images ?
Composant de Google Vertex, Deep Learning VM Images est une galerie d'instances de machine learning pré-packagées. Elles sont respectivement optimisées pour les librairies de machine learning TensorFlow, PyTorch, R, XGBoost, MXNet, CNTK ou encore CNTK. Chacune est taillée pour un ou plusieurs types de processeurs (CPU et GPU).
Google Cloud propose-t-il des services complémentaires ?
Pour compléter Google Vertex, Google met en avant toute une série de services cloud complémentaires, dont les deux plus importants sont :
- Dataprep by Trifacta pour la préparation des données d'entrainement,
- Google AutoML pour automatiser la création des modèles de machine learning (orientés reconnaissance d'image, de vidéo, traitement automatique de langue, traduction...).
Quel est le prix de Google Vertex ?
Le prix de Google Vertex est fonction du temps de calcul utilisé pour entraîner un modèle et le mettre à disposition. Pour la phase d'apprentissage, Prévision Vertex AI est par exemple tarifé 21,25 dollars par heure dans toutes les régions cloud de Google.
Quant au calcul d'une prédiction, son prix s'élève à 0,2 dollars pour 1000 points de données à concurrence 0,1 million de points de données. "Un point de données de prédiction est un point temporel de l'horizon de prévision. Par exemple, avec une précision quotidienne sur 7 jours, vous disposez de 7 points par série temporelle", précise Google.
Google Vertex vs AI Platform
AI Platform est l'ancien nom de Google Vertex. La plateforme d'IA de Google Cloud a été rebaptisé mi-2021.
Google Vertex vs AWS SageMaker
Google Vertex se veut à la fois plus riche et plus simple à utiliser qu'AWS SageMaker. Il faut dire que la plateforme de Google est lancée dès 2018. Dès le départ, Google Cloud fait par ailleurs de son service d'automatisation du machine learning son offre star. AWS propose bien une console dans ce domaine (AWS Autopilot). Lancée en mars 2022, elle est évidemment beaucoup moins puissante que Google AutoML.
Google Vertex : documentation et tutoriel
Google Cloud propose une documentation et des tutoriels en français pour prendre en main Google Vertex :