Acest pas necesită trecerea de la concepte (KPI-uri, dimensiuni) la măsuri (date). Este dificil, dacă nu chiar imposibil, să se măsoare direct conceptele. Cum se măsoară venitul? Venit brut sau net? Scopul nu este de a găsi măsura corectă, ci cea mai potrivită bazată pe teoria care conduce strategia. Prin urmare, este necesar să căutați în baze de date și depozite de date măsuri care să aproximeze concepte. Ultimul pas este determinarea celui mai scăzut nivel de analiză din sursele de date. Aceasta completează legătura dintre KPI (concepte) și fapte (măsuri).
Director de metadate
Rețineți că ușurința de a atinge acest obiectiv depinde de gradul de completare a directorului de metadate. Un director de metadate „este baza de date care transportă toate datele care descriu depozitul de date” (Poe, Vidette; Patricia Klauer and Stephen Brobst. (1998). Building a Data Warehouse: Second Edition. Prentice Hall: Upper Saddle River, NJ 07458). Este dificil de implementat deoarece, în ceea ce privește un proiect de depozit de date, „procesul este livrabil” (Poe și colab. 1998). În mod ideal, arhitectura datelor și directorul de metadate vor fi ușor accesibile. Dacă nu este cazul, constatarea măsurilor se va dovedi mult mai dificilă.
Această etapă va necesita, de asemenea, introducerea administratorilor de depozite de date. Intervievarea administratorului ar trebui să ofere cunoștințe despre arhitectura care se va dovedi neprețuită în înțelegerea modului de potrivire a conceptelor cu măsurile.
Documentarea surselor de date pentru cadre necesită:
-
Înțelegerea arhitecturii depozitului de date pentru întreprinderi
-
Obținerea metadatelor sursei de date
-
Potrivirea conceptelor cu baza de date adecvată sau coloanele depozitului de date
Înțelegerea arhitecturii depozitului de date al întreprinderii
Identificarea surselor de date ale companiei pentru măsuri necesită mai întâi înțelegerea arhitecturii datelor întreprinderii. În primul rând, trebuie să identificăm componentele unei arhitecturi de depozit de date. Acestea includ (Poe și colab. 1998):
-
Extragerea datelor din sisteme sursă, baze de date, fișiere etc.
-
Datele din sistemele sursă sunt integrate înainte de a fi încărcate în depozitul de date
-
Un depozit de date este o bază de date numai pentru citire, conceput special pentru sprijinirea deciziilor
-
Instrument sau aplicație front-end utilizată pentru a accesa depozitul de date
Deci, o arhitectură de date pentru întreprindere include toate sursele de date utilizate pentru popularea depozitului de date, structura depozitului de date, extragerea datelor din depozitul de date în data mart, și modul în care aceste date sunt apoi extrase și utilizate de către utilizatori sau unități de afaceri .
Arhitecturi de depozite de date
Poe și colab. (1998) acoperă arhitecturile depozitului de date și oferă exemple de diagrame. Pornind de la munca lor, prima arhitectură de date a întreprinderii este prezentată în figura care arată un depozit de date alimentând un magazin de date. Rețineți că baza de date ar putea fi orice tip de sursă de date. Scopul este de a identifica toate sursele de date din companie. Acest lucru se datorează faptului că fiecare sursă de date ar putea conține coloane, în cazul unui magazin de date în stil de bază de date, care măsoară KPI-urile. Acestea ar putea exista în magazin de date, depozit de date sau bază de date. Rețineți că este mult mai ușor să extrageți datele necesare dintr-un depozit de date sau o structură de magazin decât dintr-o bază de date.
(Figura: Depozit de date alimentând magazine de date)
Un alt tip de arhitectură de depozit de date este prezentat în figura care nu prezintă un depozit de date pentru întreprinderi. Această structură prezintă unele dificultăți, deoarece este mai puțin probabil ca măsurile și datele să existe în afara bazelor de date într-o structură ușor de extras. Acest caz este, în general, rar în organizațiile mari.
(Figura: Fără depozit de date pentru întreprinderi)
În cele din urmă, este cazul în care o bază de date integrată alimentează un depozit de date. În acest caz, utilizatorul sau unitatea de afaceri extrage atât datele în scopul raportării, cât și actualizează datele. Indiferent de tipul sursei, este important să se obțină arhitectura depozitului de date al întreprinderii, în special metadatele pentru fiecare sursă de date.
(Figura: Baza de date integrată alimentând un depozit de date)
Organizarea metadatelor sursei de date
Metadatele sunt date despre date. Oferă informații despre:
- Structuri de date
- Relațiile dintre structurile de date din sau între bazele de date
Pentru depozitele de date există două tipuri de metadate:
- Metadatele de integrare arată asocierile dintre sistemele sursă și depozit
- Metadatele de transformare care mapează datele de la depozit la instrumentele front-end ale utilizatorilor finali
Metadatele de transformare sunt importante, deoarece includ nume de companii și ierarhii.
Potrivirea conceptelor cu datele bazei de date sau depozitului de date
În cele din urmă, este necesar să se identifice coloanele bazei de date care se potrivesc îndeaproape conceptelor. De exemplu, dacă plecarea la timp este KPI pe care am vrut să îl măsurăm, scopul este să găsim o măsură suficientă a acestui concept. O bază de date operațională sau depozitul de date ar trebui să aibă o coloană care să identifice data și ora la care trenul a fost programat să plece față de datele și ora efectivă a plecării.
Potrivirea conceptelor cu datele din baza de date sau depozitul de date
Cealaltă activitate este de a identifica dimensiunile care vor fi utilizate pentru a analiza faptele. De exemplu, mixul de mărfuri este o dimensiune importantă. Tariful pe kilogram de marfă diferă în funcție de mixul de mărfuri? Care este rata medie? Merită să vizați un anumit client pentru a crește încărcătura din acel mix de mărfuri?
Include texte traduse din Wikibooks
Lasă un răspuns