Data warehouse : comment le mettre en place ?
Par définition, un data warehouse collecte et traite un grand volume de données à la structure définie. Cet entrepôt de données est un prérequis technique à la business intelligence.
C'est quoi un data warehouse ?
Un data warehouse, ou entrepôt de données, permet de collecter un large volume de données pour les analyser et en dégager des informations exploitables. En centralisant ainsi des données issues de multiples bases relationnelles et systèmes de transactionnelles, il a vocation à être le réceptacle principal des données d'une entreprise, à des fins de reporting et d'analytique.
Pourquoi construire un data warehouse ?
A partir d'un certain volume de données structurées ou semi-structurées, il devient indispensable de construire un data warehouse. Consolider ces données en un espace unique facilite leur accès et leur partage à toutes les directions de l'entreprise. Le data warehouse est un prérequis technique à la business intelligence qui, à l'aide de rapports et de tableaux de bord, éclaire la prise de décisions stratégiques. En termes de gouvernance, il contribue à la qualification et à la traçabilité de la donnée tout en répondant aux exigences réglementaires (RGPD).
Comment fonctionne un data warehouse ?
Un data warehouse fonctionne à la manière d’un réceptacle où se déversent les données en provenance de sources diverses : bases, fichiers, feuilles de calcul, applications... Avant d'être chargées, les données sont nettoyées, dédoublonnées, converties au bon format. Une fois ingérées dans l'entrepôt de données, elles sont traitées et transformées. Les utilisateurs accèdent à l'information à l’aide d'interfaces de requêtage basées sur le langage SQL ou des outils de business intelligence.
Comment construire un data warehouse ?
Avant de construire un data warehouse, il convient de bien définir les besoins utilisateurs. Servira-t-il à faire du reporting, des analyses, du décisionnel ? Il s'agit ensuite de cartographier l’ensemble des sources de données qui viendront alimenter l'entrepôt. Quels sont, par ailleurs, la qualité et l'état de préparation de ces données ? Une fois le data warehouse opérationnel, l'administrateur définit les droits d'accès des différents profils utilisateurs.
Data warehouse vs database
Un entrepôt de données est une sorte de très grande base de données (database) optimisée pour l'interrogation et l'analyse.