Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Business Intelligence » Documentarea surselor de date pentru cadre în Business Intelligence

Documentarea surselor de date pentru cadre în Business Intelligence

Acest pas necesită trecerea de la concepte (KPI-uri, dimensiuni) la măsuri (date). Este dificil, dacă nu chiar imposibil, să se măsoare direct conceptele. Cum se măsoară venitul? Venit brut sau net? Scopul nu este de a găsi măsura corectă, ci cea mai potrivită bazată pe teoria care conduce strategia. Prin urmare, este necesar să căutați în baze de date și depozite de date măsuri care să aproximeze concepte. Ultimul pas este determinarea celui mai scăzut nivel de analiză din sursele de date. Aceasta completează legătura dintre KPI (concepte) și fapte (măsuri).

Director de metadate

Rețineți că ușurința de a atinge acest obiectiv depinde de gradul de completare a directorului de metadate. Un director de metadate „este baza de date care transportă toate datele care descriu depozitul de date” (Poe, Vidette; Patricia Klauer and Stephen Brobst. (1998). Building a Data Warehouse: Second Edition. Prentice Hall: Upper Saddle River, NJ 07458). Este dificil de implementat deoarece, în ceea ce privește un proiect de depozit de date, „procesul este livrabil” (Poe și colab. 1998). În mod ideal, arhitectura datelor și directorul de metadate vor fi ușor accesibile. Dacă nu este cazul, constatarea măsurilor se va dovedi mult mai dificilă.

Această etapă va necesita, de asemenea, introducerea administratorilor de depozite de date. Intervievarea administratorului ar trebui să ofere cunoștințe despre arhitectura care se va dovedi neprețuită în înțelegerea modului de potrivire a conceptelor cu măsurile.

Documentarea surselor de date pentru cadre necesită:

  • Înțelegerea arhitecturii depozitului de date pentru întreprinderi

  • Obținerea metadatelor sursei de date

  • Potrivirea conceptelor cu baza de date adecvată sau coloanele depozitului de date

Înțelegerea arhitecturii depozitului de date al întreprinderii

Identificarea surselor de date ale companiei pentru măsuri necesită mai întâi înțelegerea arhitecturii datelor întreprinderii. În primul rând, trebuie să identificăm componentele unei arhitecturi de depozit de date. Acestea includ (Poe și colab. 1998):

  • Extragerea datelor din sisteme sursă, baze de date, fișiere etc.

  • Datele din sistemele sursă sunt integrate înainte de a fi încărcate în depozitul de date

  • Un depozit de date este o bază de date numai pentru citire, conceput special pentru sprijinirea deciziilor

  • Instrument sau aplicație front-end utilizată pentru a accesa depozitul de date

Deci, o arhitectură de date pentru întreprindere include toate sursele de date utilizate pentru popularea depozitului de date, structura depozitului de date, extragerea datelor din depozitul de date în data mart, și modul în care aceste date sunt apoi extrase și utilizate de către utilizatori sau unități de afaceri .

Arhitecturi de depozite de date

Poe și colab. (1998) acoperă arhitecturile depozitului de date și oferă exemple de diagrame. Pornind de la munca lor, prima arhitectură de date a întreprinderii este prezentată în figura care arată un depozit de date alimentând un magazin de date. Rețineți că baza de date ar putea fi orice tip de sursă de date. Scopul este de a identifica toate sursele de date din companie. Acest lucru se datorează faptului că fiecare sursă de date ar putea conține coloane, în cazul unui magazin de date în stil de bază de date, care măsoară KPI-urile. Acestea ar putea exista în magazin de date, depozit de date sau bază de date. Rețineți că este mult mai ușor să extrageți datele necesare dintr-un depozit de date sau o structură de magazin decât dintr-o bază de date.

Depozit de date alimentând magazine de date (Figura: Depozit de date alimentând magazine de date)

Un alt tip de arhitectură de depozit de date este prezentat în figura care nu prezintă un depozit de date pentru întreprinderi. Această structură prezintă unele dificultăți, deoarece este mai puțin probabil ca măsurile și datele să existe în afara bazelor de date într-o structură ușor de extras. Acest caz este, în general, rar în organizațiile mari.

Fără depozit de date pentru întreprinderi (Figura: Fără depozit de date pentru întreprinderi)

În cele din urmă, este cazul în care o bază de date integrată alimentează un depozit de date. În acest caz, utilizatorul sau unitatea de afaceri extrage atât datele în scopul raportării, cât și actualizează datele. Indiferent de tipul sursei, este important să se obțină arhitectura depozitului de date al întreprinderii, în special metadatele pentru fiecare sursă de date.

Baza de date integrată alimentând un depozit de date (Figura: Baza de date integrată alimentând un depozit de date)

Organizarea metadatelor sursei de date

Metadatele sunt date despre date. Oferă informații despre:

  • Structuri de date
  • Relațiile dintre structurile de date din sau între bazele de date

Pentru depozitele de date există două tipuri de metadate:

  1. Metadatele de integrare arată asocierile dintre sistemele sursă și depozit
  2. Metadatele de transformare care mapează datele de la depozit la instrumentele front-end ale utilizatorilor finali

Metadatele de transformare sunt importante, deoarece includ nume de companii și ierarhii.

Potrivirea conceptelor cu datele bazei de date sau depozitului de date

În cele din urmă, este necesar să se identifice coloanele bazei de date care se potrivesc îndeaproape conceptelor. De exemplu, dacă plecarea la timp este KPI pe care am vrut să îl măsurăm, scopul este să găsim o măsură suficientă a acestui concept. O bază de date operațională sau depozitul de date ar trebui să aibă o coloană care să identifice data și ora la care trenul a fost programat să plece față de datele și ora efectivă a plecării.

Date Union Pacific (Date Union Pacific)

Potrivirea conceptelor cu datele din baza de date sau depozitul de date

Cealaltă activitate este de a identifica dimensiunile care vor fi utilizate pentru a analiza faptele. De exemplu, mixul de mărfuri este o dimensiune importantă. Tariful pe kilogram de marfă diferă în funcție de mixul de mărfuri? Care este rata medie? Merită să vizați un anumit client pentru a crește încărcătura din acel mix de mărfuri?

Dimensiunile Union Pacific (Dimensiunile Union Pacific)

Include texte traduse din Wikibooks

Big Data
Big Data

O analiză detaliată și cuprinzătoare asupra modului în care datele masive transformă societatea, afacerile și viața.

Nu a fost votat 14.45 lei53.11 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Apa grea: O școală a cercetării științifice și tehnologice românești, o paradigmă în sensul lui Kuhn
Apa grea: O școală a cercetării științifice și tehnologice românești, o paradigmă în sensul lui Kuhn

Descoperă unul dintre cele mai ambițioase proiecte industriale ale României moderne!

Nu a fost votat 0.00 lei15.42 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *