Matplotlib : maîtriser la bibliothèque Python de data visualisation
Disponible en open source, la bibliothèque de programmation Python Matplotlib permet de générer des graphiques et de modéliser des projets de data visualisation.
Matplotlib, c’est quoi ?
Inspiré de Matlab, Matplotlib est une bibliothèque conçue pour tracer et visualiser des graphiques via le langage de programmation Python et ses extensions de mathématique numérique Numpi et SciPy. Disponible en open source sous licence type BSD, elle est livrée avec une API orientée objet pour intégrer ses graphiques à des applications construites à partir divers kits d'outil d'UX : GTK, pyFltk, PyQt, PyQtk, PySide, Tkinter ou encore wxPython. Matplotlib dispose également d'une interface procédurale, baptisée PyLab, très comparable à l'éditeur de Matlab.
Matplotlib se distingue d'autres produits similaires par les éléments suivants :
- un code open source,
- une documentation riche,
- la possibilité d'exporter des graphiques en JPG, PNG ou PDF,
- une interface procédurale.
Comment installer Matplotlib ?
Pour installer Matplotlib, il est recommandé de passer par une distribution en Python comme Anaconda. Cette dernière a l'avantage d'inclure la bibliothèque.
Il est également possible de procéder de manière similaire avec pip, et autres gestionnaires de paquets en Python incluant Matplotlib. Ces solutions permettent d’éviter des mises à jour manuelles des bibliothèques, ainsi que la gestion des dépendances qui en découlent.
Comment fonctionne Matplotlib ?
Matplotlib peut être utilisé de deux façons :
- Via un développement orienté objet qui s'avère être le mode le plus verbeux mais aussi le plus riche,
- Via le module Pyplot inclus dans Matplotlib, qui regroupe de nombreuses fonctions préconstruites pour créer des graphiques. Il permet notamment de choisir un type de graphique, personnaliser les axes, ajouter du texte...
Comment importer Matplotlib dans Python ?
La commande "import matplotlib.pyplot" est conçue pour importer une fonction Matplotlib issue du module Pyplot. Comme indiqué ci-dessus, Pyplot regroupe de nombreuses fonctions préconstruites pour créer des graphiques, du choix du type de graph à la personnalisation des axes en passant par l'ajout de texte.
Quels sont les modules de Matplotlib les plus populaires ?
Pour gérer au mieux les fonctions de data visualisation et de créations de graphiques, Matplotlib intègre divers modules :
- Pyplot pour créer un histogramme,
- Legend pour rédiger des légendes et configurer les paramètres d’affichage,
- Plot pour réaliser des tracés de données étiquetées ou d’ensemble de données,
- Subplot pour importer un axe,
- Scatter pour générer un nuage de points avec marqueur de couleur.
Où trouver la liste des couleurs (Colormap) supportées par Matplotlib ?
Les couleurs (ou colormap) dans Matplotlib peuvent se présentées sous différentes formes dans le code source :
- un code RGB avec un triplet de valeurs comprises entre 0 et 1,
- une dénomination de couleurs en anglais,
- la proportion et les nuances des couleurs primaires exprimées en langage HTML,
- un langage binaire pour estimer le niveau de gris,
- une lettre, généralement celle de la première lettre de la couleur en anglais.