Un magasin de données est la couche d’accès de l’environnement d’entrepôt de données qui est utilisée pour transmettre les données aux utilisateurs. Le magasin de données est un sous-ensemble de l’entrepôt de données et est généralement orienté vers un secteur d’activité ou une équipe spécifique. Alors que les entrepôts de données ont une profondeur à l’échelle de l’entreprise, les informations des magasins de données se rapportent à un seul service. Dans certains déploiements, chaque département ou unité commerciale est considéré comme le propriétaire de son magasin de données, y compris l’ensemble du matériel informatique, des logiciels et des données. Cela permet à chaque département d’isoler l’utilisation, la manipulation et le développement de leurs données. Dans d’autres déploiements où des dimensions conformes sont utilisées, cette propriété de l’unité commerciale ne sera pas vraie pour les dimensions partagées telles que client, produit, etc.
Les organisations créent des entrepôts de données et des magasins de données, car les informations de la base de données ne sont pas organisées de manière à les rendre facilement accessibles, ce qui nécessite des requêtes trop compliquées ou gourmandes en ressources.
Alors que les bases de données transactionnelles sont conçues pour être mises à jour, les entrepôts de données ou les magasins de données sont en lecture seule. Les entrepôts de données sont conçus pour accéder à de grands groupes d’enregistrements associés. Les magasins de données améliorent le temps de réponse de l’utilisateur final en permettant aux utilisateurs d’avoir accès au type spécifique de données qu’ils doivent consulter le plus souvent en fournissant les données d’une manière qui prend en charge la vue collective d’un groupe d’utilisateurs.
Un magasin de données est essentiellement une version condensée et plus ciblée d’un entrepôt de données qui reflète les réglementations et les spécifications de processus de chaque unité commerciale au sein d’une organisation. Chaque magasin de données est dédié à une fonction commerciale ou à une région spécifique. Ce sous-ensemble de données peut couvrir plusieurs ou tous les domaines fonctionnels d’une entreprise. Il est courant que plusieurs magasins de données soient utilisés afin de répondre aux besoins de chaque unité commerciale (différents magasins de données peuvent être utilisés pour obtenir des informations spécifiques pour différents services de l’entreprise, tels que la comptabilité, le marketing, les ventes, etc.).
Le terme connexe magasin de données de tableur est une étiquette dérogatoire décrivant la situation qui se produit lorsqu’un ou plusieurs analystes commerciaux développent un système de feuilles de calcul liées pour effectuer une analyse commerciale, puis le développent à une taille et un degré de complexité qui le rendent presque impossible à maintenir.
Magasin de données vs entrepôt de données
Entrepôt de données :
- Contient plusieurs domaines
- Contient des informations très détaillées
- Fonctionne pour intégrer toutes les sources de données
- N’utilise pas nécessairement un modèle dimensionnel mais alimente des modèles dimensionnels.
Magasin de données :
- Tient souvent un seul domaine, par exemple, Finance ou Ventes
- Peut contenir des données plus résumées (bien que beaucoup contiennent des détails complets)
- Se concentre sur l’intégration d’informations provenant d’un domaine donné ou d’un ensemble de systèmes sources
- Est construit en se concentrant sur un modèle dimensionnel utilisant un schéma en étoile.
Schémas de conception
- Schéma en étoile – choix de conception assez populaire ; permet à une base de données relationnelle d’émuler la fonctionnalité analytique d’une base de données multidimensionnelle
Schéma en flocon
Raisons de créer un magasin de données
- Accès facile aux données fréquemment utilisées
- Crée une vue collective par un groupe d’utilisateurs
- Améliore le temps de réponse de l’utilisateur final
- Facilité de création
- Coût inférieur à la mise en œuvre d’un entrepôt de données complet
- Les utilisateurs potentiels sont plus clairement définis que dans un entrepôt de données complet
- Contient uniquement les données professionnelles essentielles et sont moins encombrés.
Magasin de données dépendant
Selon l’école d’entreposage de données Inmon, un magasin de données dépendant est un sous-ensemble logique (vue) ou un sous-ensemble physique (extrait) d’un entrepôt de données plus grand, isolé pour l’une des raisons suivantes :
- Un besoin d’actualisation pour un modèle de données ou un schéma spécial : par exemple, pour restructurer pour OLAP
- Performances : pour décharger le magasin de données sur un ordinateur distinct pour une plus grande efficacité ou pour éliminer le besoin de gérer cette charge de travail sur l’entrepôt de données centralisé.
- Sécurité : pour séparer un sous-ensemble de données autorisé de manière sélective
- Opportunité : pour contourner la gouvernance des données et les autorisations requises pour intégrer une nouvelle application dans l’entrepôt de données d’entreprise
- Terrain d’essai : pour démontrer la viabilité et le potentiel de retour sur investissement (ROI) d’une application avant de la migrer vers l’entrepôt de données d’entreprise
- Politique : une stratégie d’adaptation pour l’informatique (technologie de l’information) dans les situations où un groupe d’utilisateurs a plus d’influence que le financement ou n’est pas un bon citoyen sur l’entrepôt de données centralisé.
- Politique : une stratégie d’adaptation pour les consommateurs de données dans les situations où une équipe d’entrepôt de données n’est pas en mesure de créer un entrepôt de données utilisable.
Selon l’école d’entreposage de données Inmon, les compromis inhérents aux magasins de données incluent une évolutivité limitée, la duplication des données, l’incohérence des données avec d’autres silos d’informations et l’incapacité à exploiter les sources de données de l’entreprise.
L’école alternative de l’entreposage de données est celle de Ralph Kimball. Selon lui, un entrepôt de données n’est rien de plus que l’union de tous les magasins de données. Cette vue permet de réduire les coûts et d’accélérer le développement, mais peut créer un entrepôt de données incohérent, en particulier dans les grandes organisations. Par conséquent, l’approche de Kimball convient mieux aux petites et moyennes entreprises.
Source: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, License CC BY-SA 4.0. Traduction et adaptation: Nicolae Sfetcu. © 2023 MultiMedia Publishing, L’informatique décisionnelle et l’analyse exploratoire des données dans les entreprises, Collection Sciences de l’information
Laisser un commentaire