Réseau bayésien : définition et cas d'application
Un réseau bayésien est un modèle graphiste probabiliste très courant dans le domaine de l'intelligence artificielle et du machine learning.
Qu'est-ce qu'un réseau bayésien ?
Un réseau bayésien est un modèle graphique probabiliste simple. Très utilisé en machine learning, il s'agit d'un graphe (de type acyclique) composé de nœuds, chacun représentant une variable aléatoire. Les nœuds sont reliés par des liens de causalité.
A chaque nœud enfant, ou variable expliquée, est associé des fonctions de probabilité conditionnelle correspondant à chaque nœud parent (variable explicative). Une table de probabilités conditionnelles se traduit par un vecteur de probabilité différent pour chaque combinaison possible des valeurs des variables parents. Un réseau bayésien combine ainsi le système des graphes avec la théorie des probabilités.
Pourquoi utiliser un réseau bayésien ?
On a principalement recours aux réseaux bayésiens dans les moteurs de recommandation, le data mining et les moteurs de recherche, mais aussi dans l'analyse de risque, la détection des spams et le diagnostic (industriel ou médical).
Quel est le rôle des réseaux bayésiens en machine learning ?
En machine learning (ou apprentissage automatique), les réseaux bayésiens sont utilisés dans deux cas : l'identification de la structure d'un réseau cible d'une part, l'estimation des tables de probabilités d'un réseau d'autre part.
Il est possible d'estimer la structure d'un réseau cible en utilisant des approches différentes. On peut utiliser des variables contraignantes pour tester les indépendances conditionnelles et en traduire la structure du réseau et les liens de causalité entre les variables qui le composent. Autre solution : recourir à des scores estimant l'adéquation des liens de dépendance / indépendance au sein de chaque réseau identifié pour identifier celui qui se rapproche le plus du réseau ciblé.
L'inférence bayésienne, c'est quoi ?
L'inférence bayésienne désigne l'utilisation d'un réseau bayésien. L'inférence bayésienne découle du théorème de Bayes. A partir d'une probabilité conditionnelle, elle vise à estimer le degré de confiance à accorder à la conséquence hypothétique d'une cause (variable explicative) sur un effet observé (variable expliquée) à partir d'une fonction de probabilité. A chaque nouvelle donnée ingérée, l'inférence est remise à jour, et la prédiction est ainsi optimisée au fur et à mesure.
Qu'est-ce qu'un réseau bayésien dynamique ?
Un réseau bayésien dynamique est une extension d'un réseau bayésien classique. Il s'appuie sur les mêmes bases : il s'agit bien d'une modélisation de type acyclique, contenant différents nœuds.
Sa différence réside dans le fait de déterminer une séquence discrète entre les variables aléatoires. Plus spécifiquement, les réseaux bayésiens dynamiques sont des représentations des connaissances prenant en compte l'évolution des variables dans le temps. Par exemple, l'évolution des ventes dans le futur dépend à la fois des ventes réalisées dans le passé et des ventes présentes. Les réseaux bayésiens dynamiques se révèlent plus complexes, et les hypothèses obtenues varient selon la temporalité.