Home » Articole » Articole » Calculatoare » Baze de date » Managementul datelor master

Managementul datelor master

În afaceri, managementul datelor master (de bază) (MDM) cuprinde procesele, guvernanța, politicile, standardele și instrumentele care definesc și gestionează în mod constant datele critice ale unei organizații pentru a oferi un singur punct de referință.

Datele care sunt gestionate pot include:

  • date de referință – obiectele comerciale pentru tranzacții și dimensiunile pentru analiză
  • date analitice – sprijină luarea deciziilor

În informatică, un instrument de gestionare a datelor master poate fi utilizat pentru a sprijini gestionarea datelor master prin eliminarea duplicatelor, standardizarea datelor (întreținerea în masă) și încorporarea unor reguli pentru a elimina datele incorecte de la intrarea în sistem, pentru a crea o sursă autorizată de date master. Datele master sunt produsele, conturile și părțile pentru care sunt finalizate tranzacțiile comerciale. Problema cauzei principale provine din segmentarea unității de afaceri și a liniei de produse, în care același client va fi deservit de linii de produse diferite, cu date redundante introduse despre client (alias parte în rolul de client) și cont pentru a procesa tranzacţie. Redundanța datelor privind părțile și contul este agravată în ciclul de viață din front-back office, unde este nevoie de sursa unică cu autoritate pentru datele despre părți, cont și produs, dar este adesea introdusă sau mărită redundant.

Managementul datelor master are ca obiectiv furnizarea de procese pentru colectarea, agregarea, potrivirea, consolidarea, asigurarea calității, persistența și distribuirea acestor date în o organizație pentru a asigura coerența și controlul în întreținerea continuă și utilizarea aplicației a aceste informații.

Termenul reamintește conceptul de fișier master dintr-o epocă anterioară a calculatoarelor.

Definiție

Managementul datelor master (MDM) este o metodă cuprinzătoare de a permite unei întreprinderi să conecteze toate datele sale critice la un singur fișier, numit fișier principal, care oferă un punct de referință comun. Când se face corect, managementul datelor master simplifică partajarea datelor între personal și departamente. În plus, managementul datelor master poate facilita calculul în mai multe arhitecturi, platforme și aplicații de sistem.

În esență, managementul datelor master (MDM) poate fi privit ca o „disciplină pentru îmbunătățirea specializată a calității” definită de politicile și procedurile puse în aplicare de o organizație de guvernare a datelor. Scopul final este de a oferi comunității utilizatorilor finali o „versiune unică de încredere a adevărului” pe care să se bazeze deciziile.

Probleme

La un nivel de bază, managementul datelor master urmărește să se asigure că o organizație nu utilizează versiuni multiple (potențial inconsecvente) ale acelorași date master în diferite părți ale operațiunilor sale, ceea ce poate apărea în organizațiile mari. Un exemplu tipic de gestionare slabă a datelor master este scenariul unei bănci la care un client a contractat un credit ipotecar și banca începe să trimită solicitări de credit ipotecar acelui client, ignorând faptul că persoana respectivă are deja o relație de cont ipotecar cu banca. Acest lucru se întâmplă deoarece informațiile despre clienți utilizate de secțiunea de marketing din cadrul băncii nu sunt integrate cu informațiile despre clienți utilizate de secțiunea de servicii pentru clienți a băncii. Astfel, cele două grupuri nu știu că un client existent este, de asemenea, considerat o țintă pentru vânzări. Procesul de conectare a înregistrărilor este utilizat pentru a asocia înregistrări diferite care corespund aceleiași entități, în acest caz aceleiași persoane.

Alte probleme includ (de exemplu) probleme legate de calitatea datelor, clasificarea și identificarea consecventă a datelor și problemele de reconciliere a datelor. Gestionarea datelor master ale sistemelor de date disparate necesită transformări ale datelor, deoarece datele extrase din sistemul de date sursă disparate sunt transformate și încărcate în hub-ul de gestionare a datelor master. Pentru a sincroniza datele master sursă disparate, datele master gestionate extrase din centrul de gestionare a datelor master sunt din nou transformate și încărcate în sistemul de date sursă disparate pe măsură ce datele master sunt actualizate. Ca și în cazul altor mișcări de date bazate pe extracție, transformare și încărcare, aceste procese sunt costisitoare și ineficiente de dezvoltat și de întreținut, ceea ce reduce foarte mult rentabilitatea investiției pentru produsul de gestionare a datelor master.

Unul dintre cele mai comune motive pentru care unele corporații mari se confruntă cu probleme masive cu gestionarea datelor master este creșterea prin fuziuni sau achiziții. Orice organizație care fuzionează va crea, de obicei, o entitate cu date principale duplicate (deoarece fiecare avea probabil cel puțin o bază de date master proprie înainte de fuziune). În mod ideal, administratorii bazei de date rezolvă această problemă prin deduplicarea datelor master ca parte a fuziunii. În practică, totuși, reconcilierea mai multor sisteme de date master poate prezenta dificultăți din cauza dependențelor pe care aplicațiile existente le au de bazele de date master. Drept urmare, de cele mai multe ori cele două sisteme nu se îmbină complet, dar rămân separate, cu un proces special de reconciliere definit care asigură coerența între datele stocate în cele două sisteme. În timp, însă, pe măsură ce au loc fuziuni și achiziții ulterioare, problema se înmulțește, apar tot mai multe baze de date master, iar procesele de reconciliere a datelor devin extrem de complexe și, în consecință, de negestionat și nesigure. Datorită acestei tendințe, se pot găsi organizații cu 10, 15 sau chiar până la 100 de baze de date master separate, slab integrate, care pot cauza probleme operaționale serioase în domeniile satisfacției clienților, eficienței operaționale, asistenței decizionale și conformității cu reglementările.

Soluții

Procesele întâlnite în mod obișnuit în gestionarea datelor master includ identificarea sursei, colectarea datelor, transformarea datelor, normalizarea, administrarea regulilor, detectarea și corectarea erorilor, consolidarea datelor, stocarea datelor, distribuția datelor, clasificarea datelor, serviciile de taxonomie, crearea elementelor principale, maparea schemelor, codificarea produselor, îmbogățirea datelor și guvernarea datelor.

Selecția entităților luate în considerare pentru managementul datelor master depinde oarecum de natura unei organizații. În cazul obișnuit al întreprinderilor comerciale, managementul datelor master se poate aplica unor entități precum client (integrarea datelor clienților), produs (gestionarea informațiilor despre produs), angajat și furnizor. Procesele de management a datelor master identifică sursele din care să colecteze descrieri ale acestor entități. În cursul transformării și normalizării, administratorii adaptează descrierile pentru a se conforma formatelor standard și domeniilor de date, făcând posibilă eliminarea instanțelor duplicate ale oricărei entități. Astfel de procese au ca rezultat, în general, un depozit organizațional de management a datelor master, din care toate solicitările pentru o anumită instanță de entitate produc aceeași descriere, indiferent de sursele de origine și de destinația care solicită.

Instrumentele includ rețele de date, sisteme de fișiere, un depozit de date, magazine de date, un depozit de date operațional, mineritul datelor, analiza datelor, vizualizarea datelor, federarea datelor și virtualizarea datelor. Unul din cele mai noi instrumente, managementul datelor master virtuale utilizează virtualizarea datelor și un server de metadate persistent pentru a implementa o ierarhie automată de management a datelor master pe mai multe niveluri.

Transmiterea datelor master

Există mai multe moduri prin care datele master pot fi adunate și distribuite către alte sisteme. Aceasta include:

  • Consolidarea datelor – Procesul de captare a datelor master din mai multe surse și integrarea într-un singur hub (magazin de date operațional) pentru replicare la alte sisteme de destinație.
  • Federarea datelor – Procesul de furnizare a unei singure vizualizări virtuale a datelor master de la una sau mai multe surse către unul sau mai multe sisteme de destinație.
  • Propagarea datelor – Procesul de copiere a datelor master de la un sistem la altul, de obicei prin interfețe punct la punct în sistemele vechi.

Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

Lucrul cu baze de date
Lucrul cu baze de date

Descoperă puterea bazelor de date cu acest ghid complet.

Nu a fost votat 18.24 lei36.52 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

O explorare critică a provocărilor etice și a implicațiilor legale asociate Big Data.

Nu a fost votat 0.00 lei10.74 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat 13.67 lei23.95 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *