Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Mediu generic pentru depozite de date și magazine de date. Istoria depozitelor de date.

Mediu generic pentru depozite de date și magazine de date. Istoria depozitelor de date.

Mediu generic

Mediul pentru depozitele de date și magazinele include următoarele:

  • Sisteme sursă care furnizează date către depozit sau magazin;
  • Tehnologia și procesele de integrare a datelor care sunt necesare pentru pregătirea datelor pentru utilizare;
  • Arhitecturi diferite pentru stocarea datelor în depozitul de date sau în magazinele de date ale unei organizații;
  • Diferite instrumente și aplicații pentru varietatea de utilizatori;
  • Metadatele, calitatea datelor și procesele de guvernare trebuie să existe pentru a se asigura că depozitul sau magazinul își îndeplinește scopurile.

În ceea ce privește sistemele sursă enumerate mai sus, Rainer afirmă: „O sursă comună pentru datele din depozitele de date sunt bazele de date operaționale ale companiei, care pot fi baze de date relaționale”.

În ceea ce privește integrarea datelor, Rainer afirmă: „Este necesar să extragem date din sistemele sursă, să le transformăm și să le încărcîm într-un magazin sau depozit de date”.

Rainer discută despre stocarea datelor în depozitul de date sau în magazinele de date ale unei organizații.

Metadatele sunt date despre date. „Personalul IT are nevoie de informații despre sursele de date; nume de baze de date, tabele și coloane; reîmprospătați programele; și măsuri de utilizare a datelor”.

Astăzi, cele mai de succes companii sunt cele care pot răspunde rapid și flexibil la schimbările și oportunitățile pieței. O cheie a acestui răspuns este utilizarea eficace și eficientă a datelor și a informațiilor de către analiști și manageri. Un „depozit de date” este un depozit de date istorice care sunt organizate pe subiecte pentru a sprijini factorii de decizie din organizație. Odată ce datele sunt stocate într-un magazin de date sau într-un depozit, acestea pot fi accesate.

Istorie

Conceptul de depozitare de date datează de la sfârșitul anilor 1980, când cercetătorii IBM Barry Devlin și Paul Murphy au dezvoltat „depozitul de date de afaceri”. În esență, conceptul de depozitare a datelor a fost menit să ofere un model arhitectural pentru fluxul de date de la sistemele operaționale la mediile de sprijinire a deciziilor. Conceptul a încercat să abordeze diferitele probleme asociate cu acest flux, în principal costurile ridicate asociate acestuia. În absența unei arhitecturi de depozitare a datelor, era necesară o cantitate enormă de redundanță pentru a susține mai multe medii de asistență decizională. În corporațiile mai mari, era obișnuit ca mediile multiple de sprijinire a deciziilor să funcționeze independent. Deși fiecare mediu a servit utilizatori diferiți, adesea necesitau o mare parte din aceleași date stocate. Procesul de colectare, curățare și integrare a datelor din diverse surse, de obicei din sisteme operaționale existente pe termen lung (denumite de obicei sisteme vechi), a fost de obicei parțial replicat pentru fiecare mediu. În plus, sistemele operaționale au fost reexaminate frecvent pe măsură ce au apărut noi cerințe de sprijinire a deciziilor. Adesea, noile cerințe au necesitat culegerea, curățarea și integrarea de noi date de la „magazinul de date” care au fost adaptate pentru acces facil de către utilizatori.

Evoluții cheie în primii ani de depozitare de date au fost:

  • 1960 – General Mills și Dartmouth College, într-un proiect de cercetare comun, dezvoltă termenii dimensiuni și fapte.
  • Anii 1970 – ACNielsen și IRI oferă magazine de date dimensionale pentru vânzările cu amănuntul.
  • Anii 1970 – Bill Inmon începe să definească și să discute despre termenul: Data Warehouse.
  • 1975 – Sperry Univac introduce MAPPER (Menținerea, pregătirea și producerea rapoartelor executive), un sistem de gestionare și raportare a bazelor de date care include primul 4GL din lume. Prima platformă concepută pentru construirea de centre de informare (un precursor al platformelor contemporane de întreprindere de depozitare a datelor)
  • 1983 – Teradata introduce un sistem de gestionare a bazelor de date conceput special pentru sprijinirea deciziilor.
  • 1984 – Metaphor Computer Systems, fondată de David Liddle și Don Massaro, lansează Data Interpretation System (DIS). DIS a fost un pachet hardware/software și GUI pentru utilizatorii de afaceri pentru a crea un sistem analitic și de gestionare a bazelor de date.
  • 1988 – Barry Devlin și Paul Murphy publică articolul An architecture for a business and information system unde introduc termenul „business data warehouse”.
  • 1990 – Red Brick Systems, fondată de Ralph Kimball, introduce Red Brick Warehouse, un sistem de gestionare a bazelor de date special pentru depozitarea datelor.
  • 1991 – Prism Solutions, fondată de Bill Inmon, introduce Prism Warehouse Manager, software pentru dezvoltarea unui depozit de date.
  • 1992 – Bill Inmon publică cartea Building the Data Warehouse.
  • 1995 – S-a înființat Data Warehousing Institute, o organizație pentru profit care promovează depozitarea datelor.
  • 1996 – Ralph Kimball publică cartea The Data Warehouse Toolkit.
  • 2012 – Bill Inmon a dezvoltat și a făcut publică tehnologia cunoscută sub numele de „dezambiguizare textuală”. Dezambiguizarea textuală aplică contextul textului brut și reformatează textul brut și contextul într-un format standard de bază de date. Odată ce textul brut este trecut prin dezambiguizare textuală, acesta poate fi accesat și analizat ușor și eficient prin tehnologia standard de business intelligence. Dezambiguizarea textuală se realizează prin executarea ETL textuală. Dezambiguizarea textuală este utilă oriunde este găsit text brut, cum ar fi în documente, e-mail și așa mai departe.

Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

© 2021 MultiMedia Publishing, Business Intelligence și Analytica în afaceri, Colecția Știința Informației

Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile
Introducere în inteligența artificială
Introducere în inteligența artificială

Inteligența artificială s-a dezvoltat exploziv în ultimii ani, facilitând luarea deciziilor inteligente și automate în cadrul scenariilor de implementare. Inteligența artificială se referă la un ecosistem de modele și tehnologii pentru percepție, raționament, interacțiune și învățare.  Asistăm la o convergență … Citeşte mai mult

Nu a fost votat $2.99$5.24 Selectează opțiunile
Introducere în Business Intelligence
Introducere în Business Intelligence

Colecția ȘTIINȚA INFORMAȚIEI ”Introducere în Business Intelligence” oferă cititorilor informații cuprinzătoare despre business intelligence, explorând toate aspectele importante ale inteligenței de afaceri în scenariul actual. Subiectele tratate se referă la abordările de bază ale business intelligence. Cartea își propune să … Citeşte mai mult

Nu a fost votat $2.99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *