Home » Articole » FR » Affaires » Business Intelligence » Documentation des données sources pour le cadre dans l’informatique décisionnelle

Documentation des données sources pour le cadre dans l’informatique décisionnelle

Cette étape nécessite de passer des concepts (KPI, dimensions) aux mesures (données). Il est difficile, voire impossible, de mesurer directement des concepts. Comment mesure-t-on le revenu ? Recettes brutes ou nettes ? L’objectif n’est pas de trouver la bonne mesure mais la plus appropriée en fonction de la théorie qui sous-tend la stratégie. Il est donc nécessaire de rechercher dans les bases de données et les entrepôts de données des mesures qui se rapprochent des concepts. La dernière étape consiste à déterminer le niveau d’analyse le plus bas dans les sources de données. Ceci complète le lien entre les KPI (concepts) et les faits (mesures).

Répertoire des métadonnées

Notez que la facilité d’atteindre cet objectif dépend de l’étendue de l’exhaustivité du répertoire de métadonnées. Un répertoire de métadonnées « est la base de données qui contient toutes les données décrivant l’entrepôt de données » (Poe et al. 1997). Il est difficile à mettre en œuvre car, concernant un projet d’entrepôt de données, « le processus est le livrable » (Poe et al 1997). Idéalement, l’architecture des données et le répertoire des métadonnées seront facilement accessibles. Si ce n’est pas le cas, trouver les mesures s’avérera beaucoup plus difficile.

Cette étape nécessitera également la contribution des administrateurs de l’entrepôt de données. L’interview de l’administrateur devrait fournir une connaissance de l’architecture qui s’avérera inestimable pour comprendre comment faire correspondre les concepts aux mesures.

La documentation des sources de données pour les cadres nécessite :

  • Comprendre l’architecture de l’entrepôt de données d’entreprise
  • Obtention des métadonnées de la source de données
  • Faire correspondre les concepts aux colonnes appropriées de la base de données ou de l’entrepôt de données

Comprendre l’architecture de l’entrepôt de données d’entreprise

L’identification des sources de données de l’entreprise pour les mesures nécessite d’abord de comprendre l’architecture des données de l’entreprise. Tout d’abord, nous devons identifier les composants d’une architecture d’entrepôt de données. Ceux-ci incluent (Poe et al. 1997):

  • Extraction de données à partir de systèmes sources, bases de données, fichiers, etc.
  • Les données des systèmes sources sont intégrées avant d’être chargées dans l’entrepôt de données
  • Un entrepôt de données est une base de données en lecture seule conçue spécifiquement pour l’aide à la décision
  • Outil ou application frontal utilisé pour accéder à l’entrepôt de données

Ainsi, une architecture de données d’entreprise comprend toutes les sources de données utilisées pour remplir l’entrepôt de données, la structure de l’entrepôt de données, l’extraction des données de l’entrepôt de données dans les magasins de données et la manière dont ces données sont ensuite extraites et utilisées par les utilisateurs ou les unités commerciales.

Architectures d’entrepôt de données

Poe et al. (1997) couvrent les architectures d’entrepôt de données et fournissent des exemples de diagrammes. S’inspirant de leurs travaux, la première architecture de données d’entreprise est présentée dans la figure montrant un entrepôt de données alimentant des magasins de donnéess. Notez que la base de données peut être n’importe quel type de source de données. L’objectif est d’identifier toutes les sources de données dans l’entreprise. En effet, chaque source de données peut contenir des colonnes, dans le cas d’un magasin de données de style base de données, qui mesurent les KPI. Ceux-ci peuvent exister dans le magasin de données, l’entrepôt de données ou la base de données. Notez qu’il est beaucoup plus facile d’extraire les données nécessaires d’un entrepôt de données ou d’une structure de magasin que d’une base de données.

Entrepôt de données alimentant les magasins de données Figure : Entrepôt de données alimentant les magasins de données

Un autre type d’architecture d’entrepôt de données est présenté dans la figure représentant aucun entrepôt de données d’entreprise. Cette structure présente certaines difficultés car il est peu probable que les mesures et les données existent en dehors des bases de données dans une structure facilement extractible. Ce cas est généralement rare dans les grandes organisations.

Aucun entrepôt de données d'entreprise Figure : Aucun entrepôt de données d’entreprise

Enfin, il y a le cas où une Base de données intégrée alimente un entrepôt de données. Dans ce cas, l’utilisateur métier ou l’unité commerciale extrait les données à des fins de reporting et met également à jour les données. Quel que soit le type de source, il est important d’obtenir l’architecture de l’entrepôt de données de l’entreprise, en particulier les métadonnées de chaque source de données.

Base de données intégrée alimentant un entrepôt de données Figure : Base de données intégrée alimentant un entrepôt de données

Organisation des métadonnées de la source de données

Les métadonnées sont des données sur les données. Il fournit des informations sur :

  • Structures de données
  • Relations entre les structures de données au sein ou entre les bases de données

Pour les entrepôts de données, il existe deux types de métadonnées :

  • Les métadonnées d’intégration montrent les associations entre les systèmes source et l’entrepôt
  • Les métadonnées de transformation mappent les données de l’entrepôt aux outils frontaux des utilisateurs finaux

Les métadonnées de transformation sont importantes car elles incluent des noms d’entreprise et des hiérarchies.

Faire correspondre les concepts aux faits de la base de données ou de l’entrepôt de données

Enfin, il est nécessaire d’identifier les colonnes de la base de données qui correspondent le mieux aux concepts. Par exemple, si le départ à l’heure est le KPI que nous voulions mesurer, le but est de trouver une mesure suffisante de ce concept. Une base de données opérationnelle ou l’entrepôt de données devrait avoir une colonne identifiant la date et l’heure auxquelles le train devait partir par rapport aux données et à l’heure de départ réelles.

Date Union Pacific Faits sur l’Union Pacifique

Faire correspondre les concepts aux faits de la base de données ou de l’entrepôt de données

L’autre activité consiste à identifier les dimensions qui seront utilisées pour analyser les faits. Par exemple, la gamme de produits est une dimension importante. Le tarif par livre de fret diffère-t-il en fonction de la composition des marchandises ? Quel est le taux moyen ? Vaut-il la peine de cibler un client spécifique afin d’augmenter le fret à partir de ce mix de produits ?

Dimensiunile Union Pacific Dimensions Union Pacifique

Référence

  • Poe, Vidette; Patricia Klauer and Stephen Brobst. (1998). Building a Data Warehouse: Second Edition. Prentice Hall: Upper Saddle River, NJ 07458.

Source: Wikibooks sous licence CC BY-SA 3.0. Traduction et adaptation: Nicolae Sfetcu.

French Riviera Tourist Guide (Guide touristique Côte d’Azur)
French Riviera Tourist Guide (Guide touristique Côte d’Azur)

Bilingual English/French Book (Livre bilingue anglais/français) French Riviera is one of the first modern resort areas. It began as a winter health resort at the end of the 18th century. With the arrival of the railway it became the playground … Lire la suite

non noté $5,99 Choix des options
Guide touristique Côte d’Azur
Guide touristique Côte d’Azur

La Côte d’Azur est l’un des premiers station balnéaire moderne. Il a commencé comme une station thermale d’hiver à la fin du 18ème siècle. Avec l’arrivée du chemin de fer dans le milieu du 19e siècle, il est devenu l’endroit … Lire la suite

non noté $3,99 Choix des options
Londres: Affaires, Voyager, Culture (London: Business, Travel, Culture)
Londres: Affaires, Voyager, Culture (London: Business, Travel, Culture)

Guide touristique bilingue anglais/français (Bilingual English/French Tourist Guide) Londres, seule ville à avoir organisé trois fois les Jeux olympiques (1908, 1948, 2012), est dynamique et très diverse sur le plan culturel. Elle joue un rôle important dans l’art et dans … Lire la suite

non noté $5,99 Choix des options

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.