Analyse descriptive, qu'est-ce que c'est ?
Par définition, l'analyse descriptive vise à évaluer les données statistiques passés pour mieux anticiper les tendances à venir. On distingue l'analyse univariée de l'analyse bivariée.
L'analyse descriptive, c'est quoi ?
L’analyse descriptive consiste à synthétiser des données historiques afin d'en tirer des informations utiles (insights). En répondant à la question "que s'est-il passé ?", elle vise à comprendre les tendances d'un marché, les comportements de clients, les impacts d'un processus afin d'améliorer ses performances opérationnelles.
En fournissant une image précise de son fonctionnement et en l'enrichissant avec d'autres sources de données, l’analyse descriptive permet par exemple d'identifier les points forts et les ponts faibles d'une organisation. Le suivi dans le temps d'indicateurs de performance clés (KPI) lui apporte une aide à la décision pour dégager des axes de progression. En cela, l’analyse descriptive se distingue de l'analyse prescriptive et l'analyse prédictive, tournées, elles, vers l'avenir.
Comment faire une bonne analyse descriptive ?
L'analyse descriptive repose sur une branche des statistiques faisant appel à de nombreuses techniques permettant de dégager les caractéristiques ou les tendances d'un jeu de données. Afin de prendre en compte les données les plus pertinentes, elle passe tout d'abord par la définition de métriques à suivre qu'il s'agisse, par exemple, de la croissance du nombre d'abonnés ou leur taux de réengagement.
L'analyse descriptive peut recourir à des outils de business intelligence mais aussi à des algorithmes de machine learning afin d'extrapoler les résultats à venir à partir d'événements survenus.
Analyse descriptive statistique en Python
Langage de programmation le plus populaire chez les experts de la data science, Python est utilisé pour calculer des données statistiques descriptives telles que la valeur minimale et maximale, la moyenne ou l’écart type. Python est généralement associé à la bibliothèque Pandas dans l'analyse complexe de données.
Analyse descriptive univariée
Comme son nom l'indique, l’analyse descriptive univariée explore une seule variable ou un ensemble de variables mais considérées indépendamment. Par exemple, elle consistera à mesurer la proportion de femmes dans un échantillon de candidats dans un processus de recrutement. Par opposition, une analyse prenant en compte plusieurs variables est dite multivariée.
Analyse descriptive bivariée
L'analyse descriptive bivariée vise à mettre en évidence les relations pouvant exister entre deux variables. Il s'agit de vérifier si un lien observé sur un échantillon peut être généralisable à l’ensemble de la population considérée.