Apprentissage supervisé : définition et exemples d'algorithme
En machine learning, l'apprentissage supervisé consiste à entrainer un modèle à partir de données préalablement étiquetées ou annotées. Il est utilisé aussi bien en traitement du langage qu'en vision par ordinateur ou analyse prédictive.
L’apprentissage supervisé, c'est quoi ?
L’apprentissage supervisé ou supervised learning est une méthode de machine learning s'appuyant sur des données ou exemples labellisés (étiquetés ou annotés) pour entraîner des modèles d'intelligence artificielle (IA) prédictifs.
En se basant sur cette base d'apprentissage, par exemple des photos assorties de la mention de ce qu'elles représentent, les paramètres du modèle s’ajustent en vue ensuite de réagir efficacement face à des situations similaires. Au fur et à mesure de l'enrichissement du modèle, le résultat gagne en pertinence, réduisant la marge d’erreur.
Quelles sont les applications de l'apprentissage supervisé ?
Il existe de nombreuses applications de l'apprentissage supervisé :
- le traitement automatique du langage,
- la reconnaissance vocale,
- la vision par ordinateur,
- la bio-informatique…
On utilise également l’apprentissage supervisé pour la détection de spams dans les mails, la gestion des chatbots et voicebots, ainsi que pour la robotique. Cette méthode permet aussi le développement des technologies embarquées dédiées aux véhicules autonomes.
Quels sont les algorithmes d’apprentissage supervisé ?
Pour créer un modèle d'apprentissage supervisé, on peut recourir à différents algorithmes :
- la régression linéaire : y = c + b * x ,
- la régression logistique : h(x) = 1 / (1 + e^-x),
- l’arbre de décision avec différentes variables de sortie,
- la machine à vecteur de support (SVM).
On peut également évoquer l’algorithme k-NN pour réaliser des tests et la classification naïve bayésienne pour catégoriser des volumes de données importants.
Quelle différence entre apprentissage supervisé et non supervisé ?
Aux côtés de l’apprentissage supervisé, il est également possible d’effectuer un apprentissage non supervisé. Une méthode de machine learning qui n’utilise pas de données d'apprentissage préalablement annotées ou étiquetées à la différence de l'apprentissage supervisé. Le modèle découvre alors par lui même la structure et les tendances présentent au sein du data set.
L’apprentissage non supervisé peut servir à partitionner des données (ou data clustering) ou encore à programmer un système de suggestion, par exemple un moteur de recommandation de produit tenant compte de clusters d'appétences client. Les fonctions de détection d’anomalies utilisent généralement la technique de l’apprentissage non supervisé.