Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Magazin de date (Data Mart)

Magazin de date (Data Mart)

Un magazin de date (data mart) este un model de structură / acces specific mediilor de depozitare a datelor, utilizat pentru recuperarea datelor orientate către client. Magazinul de date este un subset al depozitului de date și este de obicei orientat către o anumită linie de afaceri sau echipă. În timp ce depozitele de date au o profunzime la nivelul întregii întreprinderi, informațiile din magazinele de date aparțin unui singur departament. În unele implementări, fiecare departament sau unitate de afaceri este considerat proprietarul magazinului său de date, inclusiv toate componentele hardware, software și date. Acest lucru permite fiecărui departament să izoleze utilizarea, manipularea și dezvoltarea datelor lor. În alte implementări în care sunt utilizate dimensiuni conforme, această proprietate a unității de afaceri nu va fi valabilă pentru dimensiunile partajate, cum ar fi clientul, produsul etc.

Depozitele și magazinele de date sunt construite deoarece informațiile din baza de date nu sunt organizate într-un mod care le face ușor accesibile. Această organizare necesită interogări prea complicate, dificil de accesat sau cu resurse mari.

În timp ce bazele de date tranzacționale sunt proiectate pentru a fi actualizate, depozitele sau magazinele de date sunt doar citite. Depozitele de date sunt concepute pentru a accesa grupuri mari de înregistrări conexe. Magazinele de date îmbunătățesc timpul de răspuns al utilizatorului final, permițându-le utilizatorilor să aibă acces la tipul specific de date pe care trebuie să le vadă cel mai adesea, oferind datele într-un mod care să susțină viziunea colectivă a unui grup de utilizatori.

Un magazin de date este practic o versiune condensată și mai concentrată a unui depozit de date care reflectă reglementările și specificațiile de proces ale fiecărei unități de afaceri din cadrul unei organizații. Fiecare magazin de date este dedicat unei anumite funcții sau regiuni comerciale. Acest subset de date poate cuprinde multe sau toate domeniile funcționale ale unei întreprinderi. Este obișnuit ca mai multe magazine de date să fie utilizate pentru a satisface nevoile fiecărei unități de afaceri individuale (diferite magazine de date pot fi utilizate pentru a obține informații specifice pentru diferite departamente ale întreprinderii, cum ar fi contabilitate, marketing, vânzări etc.).

Termenul asociat spreadmart este un peiorativ care descrie situația care apare atunci când unul sau mai mulți analiști de afaceri dezvoltă un sistem de foi de calcul legate pentru a efectua o analiză a afacerii, apoi îl dezvoltă la o dimensiune și un grad de complexitate care face aproape imposibil de întreținut. (Termenul pentru această condiție este „Excel Hell”.)

Depozit de date (Data Warehouse) cu magazine de date (Data Marts) (Prezentare generală a depozitului de date, cu magazine de date afișate în dreapta sus.)

Magazin de date vs depozit de date

Depozit de date:

  • Deține mai multe domenii de subiect
  • Deține informații foarte detaliate
  • Funcționează pentru a integra toate sursele de date
  • Nu folosește neapărat un model dimensional, ci alimentează modele dimensionale.

Magazin de date:

  • Adesea deține doar un singur subiect – de exemplu, Finanțe sau Vânzări
  • Poate conține date mai sintetizate (deși pot conține detalii complete)
  • Se concentrează pe integrarea informațiilor dintr-un anumit domeniu sau dintr-un set de sisteme sursă
  • Este construit axat pe un model dimensional folosind o schemă stelară.

Scheme de proiectare

  • Schema stelară – alegere de design destul de populară; permite unei baze de date relaționale să emuleze funcționalitatea analitică a unei baze de date multidimensionale
  • Schema fulgului de zăpadă
  • Schema de activitate – o schemă bazată pe serii de timp

Motive pentru crearea unui magazin de date

  • Acces ușor la datele frecvent necesare
  • Creează o vizualizare colectivă de către un grup de utilizatori
  • Îmbunătățește timpul de răspuns al utilizatorului final
  • Ușurința creației
  • Cost mai mic decât implementarea unui depozit complet de date
  • Utilizatorii potențiali sunt definiți mai clar decât într-un depozit complet de date
  • Conține doar date esențiale de afaceri și este mai puțin aglomerat.
  • Are informații cheie despre date

Magazine de date dependente

Conform școlii de depozitare a datelor Inmon, un magazin de date dependent este un subset logic (vizualizare) sau un subset fizic (extras) al unui depozit de date mai mare, izolat din unul dintre următoarele motive:

  • O nevoie de reîmprospătare pentru un model sau schemă de date speciale: de exemplu, o restructurare pentru OLAP
  • Performanță: pentru a descărca magazinul de date pe un computer separat pentru o eficiență mai mare sau pentru a elimina necesitatea de a gestiona acea sarcină de lucru în depozitul de date centralizat.
  • Securitate: pentru a separa selectiv un subset de date autorizat
  • Oportunitate: pentru a ocoli guvernarea datelor și autorizațiile necesare pentru a încorpora o nouă aplicație în Enterprise Data Warehouse
  • Teren de încercare: pentru a demonstra viabilitatea și potențialul de rentabilitate al investiției (ROI) al unei aplicații înainte de a o migra la Enterprise Data Warehouse
  • Politică: o strategie de coping pentru IT (tehnologia informației) în situațiile în care un grup de utilizatori are mai multă influență decât finanțarea sau nu este un bun cetățean în depozitul centralizat de date.
  • Politică: o strategie de coping pentru consumatorii de date în situații în care o echipă de depozit de date nu este capabilă să creeze un depozit de date utilizabil.

Potrivit școlii Inmon de depozitare a datelor, compromisurile inerente martorilor de date includ scalabilitate limitată, duplicarea datelor, neconcordanță a datelor cu alte silozuri de informații și incapacitatea de a utiliza sursele de date ale întreprinderii.

Școala alternativă de stocare a datelor este cea a lui Ralph Kimball. În opinia sa, un depozit de date nu este altceva decât unirea tuturor magazinelor de date. Această viziune ajută la reducerea costurilor și oferă o dezvoltare rapidă, dar poate crea un depozit de date inconsecvent, în special în organizațiile mari. Prin urmare, abordarea lui Kimball este mai potrivită pentru corporațiile mici și mijlocii.

Include texte traduse și adaptate de Nicolae Sfetcu din Wikipedia

Big Data
Big Data

Odată cu creșterea volumului de date pe Internet, în media socială, cloud computing, dispozitive mobile și date guvernamentale, Big Data devine în același timp o amenințare și o oportunitate în ceea ce privește gestionarea și utilizarea acestor date, menținând în … Citeşte mai mult

Nu a fost votat $2,99$6,99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,18 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *