Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Modelarea datelor pentru baza de date

Modelarea datelor pentru baza de date

Modelarea datelor este primul pas în procesul de proiectare a bazelor de date. Acest pas este uneori considerat a fi o fază de proiectare la nivel înalt și abstractă, denumită și design conceptual. Scopul acestei faze este de a descrie:

  • Datele conținute în baza de date (de exemplu, entități: studenți, lectori, cursuri, discipline)
  • Relațiile dintre elementele de date (de exemplu, studenții sunt supravegheați de lectori; lectorii predă cursuri)
  • Constrângerile asupra datelor (de exemplu, numărul de student are exact opt ​​cifre; un subiect are doar patru sau șase unități de credit)

În al doilea pas, elementele de date, relațiile și constrângerile sunt toate exprimate utilizând conceptele furnizate de modelul de date la nivel înalt. Deoarece aceste concepte nu includ detaliile implementării, rezultatul procesului de modelare a datelor este o reprezentare (semi)formală a structurii bazei de date. Acest rezultat este destul de ușor de înțeles, astfel încât este utilizat ca referință pentru a vă asigura că sunt îndeplinite toate cerințele utilizatorului.

Al treilea pas este proiectarea bazei de date. În acest pas, am putea avea doi sub-pași: unul numit proiectare logică a bazei de date, care definește o bază de date într-un model de date al unui SGBD specific și altul numit proiectare fizică a bazei de date, care definește structura internă de stocare a bazei de date, organizarea fișierelor sau tehnici de indexare. Acești doi sub-pași sunt pași de implementarea bazei de date și operații / dezvoltarea interfeței utilizatorilor.

În fazele de proiectare a bazei de date, datele sunt reprezentate folosind un anumit model de date. Modelul de date este o colecție de concepte sau notații pentru descrierea datelor, relații de date, semantica datelor și constrângerile de date. Majoritatea modelelor de date includ, de asemenea, un set de operații de bază pentru manipularea datelor din baza de date.

Gradele de abstractizare a datelor

În această secțiune vom analiza procesul de proiectare a bazei de date în termeni de specificitate. Așa cum orice proiectare începe la un nivel înalt și continuă la un nivel de detaliu din ce în ce mai mare, la fel și proiectarea bazei de date. De exemplu, atunci când construiți o casă, începeți cu câte dormitoare și băi va avea casa, indiferent dacă va fi la un nivel sau la mai multe niveluri, etc. Următorul pas este să faceți ca un arhitect să proiecteze casa dintr-o perspectivă mai structurată. Acest nivel devine mai detaliat în ceea ce privește dimensiunile reale ale camerei, modul în care va fi conectată locuința, unde vor fi amplasate instalațiile sanitare etc. Ultimul pas este angajarea unui antreprenor pentru construirea casei. Aceasta privește designul de la un nivel ridicat de abstractizare la un nivel crescut de detalii.

Proiectarea bazei de date este foarte asemănătoare. Începe cu identificarea de către utilizatori a regulilor de afaceri; apoi proiectanții și analiștii bazei de date creează proiectarea bazei de date; și apoi administratorul bazei de date implementează proiectarea utilizând un SGBD.

Următoarele subsecțiuni rezumă modelele în ordinea descrescătoare a nivelului de abstractizare.

Modele externe

  • Reprezintă vizualizarea utilizatorului asupra bazei de date
  • Conține mai multe vizualizări externe diferite

Sunt strâns legate de lumea reală așa cum este percepută de fiecare utilizator

Modele conceptuale

  • Oferă capabilități flexibile de structurare a datelor
  • Prezintă o „vizualizare a comunității”: structura logică a întregii baze de date
  • Conține date stocate în baza de date
  • Afișează relațiile dintre date, inclusiv:
    • Constrângeri
    • Informații semantice (de exemplu, reguli comerciale)
    • Informații de securitate și integritate
  • Iau în considerare o bază de date ca o colecție de entități (obiecte) de diferite tipuri
  • Sunt baza pentru identificarea și descrierea la nivel înalt a principalelor obiecte de date; evită detaliile
  • Sunt independente de baza de date, indiferent de baza de date pe care o veți utiliza

Modele interne

Cele trei cele mai cunoscute modele de acest gen sunt modelul de date relaționale, modelul de date de rețea și modelul de date ierarhic. Aceste modele interne:

  • Iau în considerare o bază de date ca o colecție de înregistrări de dimensiuni fixe
  • Sunt mai aproape de nivelul fizic sau de structura fișierului
  • Sunt o reprezentare a bazei de date așa cum este văzută de SGBD.
  • Solicită proiectantului să potrivească caracteristicile și constrângerile modelului conceptual cu cele ale modelului de implementare selectat
  • Implică maparea entităților din modelul conceptual la tabelele din modelul relațional

Modele fizice

  • Sunt reprezentarea fizică a bazei de date
  • Au cel mai scăzut nivel de abstractizare
  • Cum sunt stocate datele; au de-a face cu
    • Performanța în timpul rulării
    • Utilizarea și compresia stocării
    • Organizarea fișierelor și metodele de acces
    • Criptarea datelor
  • Sunt nivelul fizic – administrat de sistemul de operare (OS)
  • Furnizează concepte care descriu detaliile despre modul în care datele sunt stocate în memoria computerului

Nivelul de abstractizare a datelor

Într-o vedere picturală, puteți vedea cum funcționează împreună diferitele modele. Să privim acest lucru de la cel mai înalt nivel, modelul extern.

Modelul extern este punctul de vedere al utilizatorului final asupra datelor. De obicei, o bază de date este un sistem de întreprindere care servește nevoile mai multor departamente. Cu toate acestea, un departament nu este interesat să vadă datele altor departamente (de exemplu, departamentului de resurse umane (HR) nu îi pasă să vadă datele departamentului de vânzări). Prin urmare, o vizualizare a utilizatorului va diferi de alta.

Modelul extern necesită ca proiectantul să împartă un set de cerințe și constrângeri în module funcționale care pot fi examinate în cadrul modelelor lor externe (de exemplu, resurse umane versus vânzări).

În calitate de proiectant de date, trebuie să înțelegeți toate datele, astfel încât să puteți construi o bază de date la nivel de întreprindere. Pe baza nevoilor diferitelor departamente, modelul conceptual este primul model creat.

În această etapă, modelul conceptual este independent atât de software cât și de hardware. Nu depinde de software-ul SGBD utilizat pentru implementarea modelului. Nu depinde de hardware-ul utilizat în implementarea modelului. Modificările din hardware sau din software-ul SGBD nu au niciun efect asupra proiectării bazei de date la nivel conceptual.

Odată selectat un SGBD, îl puteți implementa. Acesta este modelul intern. Aici creați toate tabelele, constrângerile, cheile, regulile etc. Acest lucru este adesea denumit designul logic.

Modelul fizic este pur și simplu modul în care datele sunt stocate pe disc. Fiecare furnizor de baze de date are propriul mod de stocare a datelor.

Baze de date - Nivele de abstractizare a datelor (Nivele de abstractizare a datelor.)

Scheme

O schemă este o descriere generală a unei baze de date și este de obicei reprezentată de diagrama entitate-relație (entity relationship diagram, ERD). Există multe subscheme care reprezintă modele externe și astfel afișează vederi externe ale datelor. Mai jos este o listă de elemente de luat în considerare în timpul procesului de proiectare a unei baze de date.

  • Scheme externe: există mai multe
  • Subscheme multiple: acestea afișează mai multe vizualizări externe ale datelor
  • Schema conceptuală: există doar una. Această schemă include elemente de date, relații și constrângeri, toate reprezentate într-un ERD.
  • Schema fizică: există doar una

Independența datelor logice și fizice

Independența datelor se referă la imunitatea aplicațiilor utilizatorilor față de modificările făcute în definirea și organizarea datelor. Abstracțiile de date expun numai acele elemente care sunt importante sau pertinente pentru utilizator. Complexitatea este ascunsă utilizatorului bazei de date.

Independența datelor și independența de funcționare formează împreună caracteristica abstractizării datelor. Există două tipuri de independență a datelor: logică și fizică.

Independența logică a datelor

O schemă logică este un design conceptual al bazei de date realizat pe hârtie sau pe o tablă albă, la fel ca desenele arhitecturale pentru o casă. Abilitatea de a schimba schema logică, fără a schimba schema externă sau vizualizarea utilizatorului, se numește independență logică a datelor. De exemplu, adăugarea sau eliminarea de noi entități, atribute sau relații la această schemă conceptuală ar trebui să fie posibilă fără a fi nevoie să modificați schemele externe existente sau să rescrieți programele de aplicații existente.

Cu alte cuvinte, modificările schemei logice (de exemplu, modificări ale structurii bazei de date, cum ar fi adăugarea unei coloane sau a altor tabele) nu ar trebui să afecteze funcția aplicației (vizualizări externe).

Independența fizică a datelor

Independența fizică a datelor se referă la imunitatea modelului intern la modificările modelului fizic. Schema logică rămâne neschimbată, chiar dacă sunt făcute modificări ale organizării fișierelor sau structurilor de stocare, dispozitivelor de stocare sau strategiei de indexare.

Independența fizică a datelor se referă la ascunderea detaliilor structurii de stocare de aplicațiile utilizatorului. Aplicațiile nu ar trebui să fie implicate în aceste probleme, deoarece nu există nicio diferență în operațiunea efectuată asupra datelor.

Termeni cheie

  • model conceptual: structura logică a întregii scheme conceptuale a bazei de date: un alt termen pentru schema logică
  • independența datelor: imunitatea aplicațiilor utilizatorilor față de modificările făcute în definirea și organizarea datelor
  • model de date: o colecție de concepte sau notații pentru descrierea datelor, relațiile de date, semantica datelor și constrângerile de date
  • modelarea datelor: primul pas în procesul de proiectare a bazelor de date
  • proiectarea logică a bazei de date: definește o bază de date într-un model de date al unui sistem specific de gestionare a bazelor de date
  • proiectarea fizică a bazei de date: definește structura internă de stocare a bazei de date, organizarea fișierelor sau tehnici de indexare
  • diagramă entitate relație (ERD): un model de date care descrie baza de date care prezintă tabele, atribute și relații
  • model extern: reprezintă vizualizarea utilizatorului a bazei de date
  • schema externă: vizualizare utilizator
  • model intern: o reprezentare a bazei de date așa cum este văzută de SGBD
  • independența logică a datelor: capacitatea de a schimba schema logică fără a schimba schema externă
  • proiectare logică: unde creați toate tabelele, constrângerile, cheile, regulile etc.
  • schema logică: un design conceptual al bazei de date realizat pe hârtie sau pe o tablă, la fel ca desenele arhitecturale pentru o casă
  • sistem de operare (OS): gestionează nivelul fizic al modelului fizic
  • independență fizică a datelor: imunitatea modelului intern la modificările modelului fizic
  • model fizic: reprezentarea fizică a bazei de date
  • schema: o descriere generală a unei baze de date

Sursa: Adrienne Watt, Database Design – 2nd Edition. Descărcare gratuită de la B.C. Open Textbook Collection. © 2014 Adrienne Watt and Nelson Eng. Licența (inclusiv imagini) CC BY 4.0. Traducere Nicolae Sfetcu

© 2021 MultiMedia Publishing, Baze de date, Volumul 1

Adobe Photoshop pentru începători
Adobe Photoshop pentru începători

”Adobe Photoshop pentru începători” este un ghid pentru crearea, editarea și îmbunătățirea imaginilor și a proiectelor, cu informații despre noțiunile de bază în Adobe Photoshop. Adobe Photoshop este un program cu puterea unui studio de fotografie profesionist, cu o multitudine … Citeşte mai mult

Nu a fost votat 9.38 lei20.31 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Inteligența competitivă - Concept - Studii
Inteligența competitivă – Concept – Studii

Trăim într-o lume condusă de hiper-concurență, în care oferta de afaceri depășește cererea. Pentru ca o organizație să supraviețuiască într-un mediu atât de agresiv competitiv, este necesară o mai bună înțelegere a concurenței și a forțelor concurente care îi afectează … Citeşte mai mult

Nu a fost votat 9.38 lei14.84 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *