Home » Articole » Articole » Calculatoare » Baze de date » Stocarea informațiilor în depozitele de date

Stocarea informațiilor în depozitele de date

postat în: Baze de date 0

Fapte

Un fapt este o valoare, sau măsurare, care reprezintă un fapt despre entitatea sau sistemul administrat.

Faptele, raportate de entitatea raportoare, se spune că sunt la nivel brut; de exemplu, într-un sistem de telefonie mobilă, dacă un BTS (stație de emisie-recepție de bază) primește 1.000 de cereri de alocare a canalelor de trafic, alocă 820 și respinge restul, va raporta trei fapte sau măsurători unui sistem de management:


  • tch_req_total = 1000

  • tch_req_success = 820

  • tch_req_fail = 180

Faptele la nivel brut sunt în continuare agregate la niveluri superioare în diferite dimensiuni pentru a extrage din acesta mai multe informații relevante pentru servicii sau afaceri. Acestea se numesc agregate sau rezumate sau fapte agregate.

De exemplu, dacă există trei BTS într-un oraș, atunci faptele de mai sus pot fi agregate de la BTS la nivelul orașului în dimensiunea rețelei. De exemplu:


  • tch_req_success_city = tch_req_success_bts1 + tch_req_success_bts2 +
    tch_req_success_bts3

  • avg_tch_req_success_city = (tch_req_success_bts1 + tch_req_success_bts2 +
    tch_req_success_bts3) / 3

Abordare dimensională versus normalizată pentru stocarea datelor

Există trei sau mai multe abordări principale pentru stocarea datelor într-un depozit de date – cele mai importante abordări sunt abordarea dimensională și abordarea normalizată.

Abordarea dimensională se referă la abordarea lui Ralph Kimball care afirmă că depozitul de date ar trebui să fie modelat folosind un model dimensional / schemă stelară. Abordarea normalizată, numită și modelul 3NF (Third Normal Form), se referă la abordarea lui Bill Inmon care afirmă că depozitul de date ar trebui să fie modelat folosind un model E-R / model normalizat.

Abordarea dimensională

Într-o abordare dimensională, datele despre tranzacții sunt partiționate în „fapte”, care sunt în general date numerice despre tranzacții și „dimensiuni”, care sunt informațiile de referință care oferă context faptelor. De exemplu, o tranzacție de vânzare poate fi împărțită în fapte precum numărul de produse comandate și prețul total plătit pentru produse și în dimensiuni precum data comenzii, numele clientului, numărul produsului, expedierea comenzii și facturarea locații și agentul de vânzări responsabil pentru primirea comenzii.

Un avantaj cheie al unei abordări dimensionale este că depozitul de date este mai ușor de înțeles și utilizat de utilizator. De asemenea, extragerea datelor din depozitul de date tinde să funcționeze foarte repede. Structurile dimensionale sunt ușor de înțeles pentru utilizatorii de afaceri, deoarece structura este împărțită în măsurători / fapte și context / dimensiuni. Faptele sunt legate de procesele de afaceri ale organizației și de sistemul operațional, în timp ce dimensiunile care le înconjoară conțin context despre măsurare. Un alt avantaj oferit de modelul dimensional este că nu implică de fiecare dată o bază de date relațională. Astfel, acest tip de tehnică de modelare este foarte util pentru interogările utilizatorilor finali din depozitul de date.

Modelul faptelor și dimensiunilor poate fi de asemenea înțeles ca un cub de date. În cazul în care dimensiunile sunt coordonatele categorice într-un cub multidimensional, faptul este o valoare corespunzătoare coordonatelor.

Principalele dezavantaje ale abordării dimensionale sunt următoarele:

  1. Pentru a menține integritatea faptelor și dimensiunilor, încărcarea depozitului de date cu date din diferite sisteme operaționale este complicată.
  2. Este dificil de modificat structura depozitului de date dacă organizația care adoptă abordarea dimensională schimbă modul în care își desfășoară activitatea.

Abordarea normalizată

În abordarea normalizată, datele din depozitul de date sunt stocate respectând, într-o anumită măsură, reguli de normalizare a bazei de date. Tabelele sunt grupate în funcție de domenii care reflectă categorii generale de date (de exemplu, date despre clienți, produse, finanțe etc.). Structura normalizată împarte datele în entități, ceea ce creează mai multe tabele într-o bază de date relațională. Atunci când se aplică în întreprinderi mari, rezultatul este zeci de tabele care sunt legate între ele printr-o rețea de îmbinări. Mai mult, fiecare dintre entitățile create este convertită în tabele fizice separate atunci când baza de date este implementată. Principalul avantaj al acestei abordări este că este simplu să adăugați informații în baza de date. Unele dezavantaje ale acestei abordări sunt că, din cauza numărului de tabele implicate, poate fi dificil pentru utilizatori să unească date din diferite surse în informații semnificative și să acceseze informațiile fără o înțelegere precisă a surselor de date și a structurii datelor a depozitului de date.

Ambele modele normalizate și dimensionale pot fi reprezentate în diagrame entitate-asociere, deoarece ambele conțin tabele relaționale unite. Diferența dintre cele două modele este gradul de normalizare (cunoscut și sub denumirea de forme normale). Aceste abordări nu se exclud reciproc și există și alte abordări. Abordările dimensionale pot implica normalizarea datelor într-un anumit grad.

În Information-Driven Business, Robert Hillard propune o abordare pentru a compara cele două abordări pe baza nevoilor de informații ale problemei de afaceri. Tehnica arată că modelele normalizate conțin mult mai multe informații decât echivalentele lor dimensionale (chiar și atunci când sunt utilizate aceleași câmpuri în ambele modele), dar aceste informații suplimentare sunt în detrimentul usabilității. Tehnica măsoară cantitatea de informații în termeni de entropie informațională și de utilizare în termeni de măsură de transformare a datelor în Lumile Mici.

Include texte traduse și adaptate de Nicolae Sfetcu din Wikipedia

Statistica pentru afaceri
Statistica pentru afaceri

Statistica pentru afaceri este un ghid practic elementar de statistică, cu eșantioanele de date și exemplele orientate spre afaceri. Statistica face posibilă analiza problemelor de afaceri din lumea reală cu date reale, astfel încât să puteți determina dacă o strategie … Citeşte mai mult

Nu a fost votat 17.87 lei38.30 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Ghidul Google SEO
Ghidul Google SEO

Ghidul de iniţiere Google privind optimizarea pentru motoarele de căutare, Versiunea 1.1, 13 noiembrie 2008 Acest document a fost lansat iniţial ca un efort pentru a ajuta echipele Google, însă este la fel de util şi pentru webmasterii începători în … Citeşte mai mult

Nu a fost votat 0.00 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Ghid WordPress pentru dezvoltatori
Ghid WordPress pentru dezvoltatori

WordPress este o platformă pentru site-uri web rapidă, fiabilă, cu facilități multiple pentru dezvoltatori și ușor de utilizat. Totusi, dezvoltatorii și beneficiarii au de multe ori nevoie să adauge funcționalități suplimentare pentru a răspunde nevoilor lor. Acest ghid oferă unele … Citeşte mai mult

Nu a fost votat 17.87 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *