Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Vizualizarea datelor în business intelligence

Vizualizarea datelor în business intelligence

Vizualizarea datelor este privită de multe discipline ca un echivalent modern al comunicării vizuale. Implică crearea și studiul reprezentării vizuale a datelor, însemnând „informații care au fost abstractizate într-o formă schematică, inclusiv atribute sau variabile pentru unitățile de informații”.

Un obiectiv principal al vizualizării datelor este de a comunica informațiile în mod clar și eficient prin grafice statistice, diagrame și grafice de informații. Datele numerice pot fi codificate folosind puncte, linii sau bare, pentru a comunica vizual un mesaj cantitativ. Vizualizarea eficientă îi ajută pe utilizatori să analizeze și să argumenteze despre date și dovezi. Face datele complexe mai accesibile, mai înțelese și utilizabile. Utilizatorii pot avea anumite sarcini analitice, cum ar fi realizarea de comparații sau înțelegerea cauzalității, iar principiul de proiectare al graficului (adică afișarea comparațiilor sau afișarea cauzalității) urmează sarcinii. Tabelele sunt în general folosite în cazul în care utilizatorii vor căuta o anumită măsurătoare, în timp ce diagramele de diferite tipuri sunt folosite pentru a afișa modele sau relații în date pentru una sau mai multe variabile.

Vizualizarea datelor este atât o artă, cât și o știință. Este văzută ca o ramură a statisticii descriptive de către unii, dar și ca un instrument de dezvoltare a teoriei de către alții. Rata cu care sunt generate datele a crescut. Datele create de activitatea pe internet și un număr tot mai mare de senzori din mediu, cum ar fi sateliții, sunt denumite „Big Data”. Procesarea, analiza și comunicarea acestor date prezintă o varietate de provocări etice și analitice pentru vizualizarea datelor. Domeniul științei datelor și practicienii numiți oameni de știință ai datelor au apărut pentru a ajuta la abordarea acestei provocări.

Prezentare generală

Vizualizarea datelor în știința datelor
Credit: Farcaster, Wikipedia, licența CC BY-SA 3.0

(Vizualizarea datelor este unul dintre pașii în analizarea datelor și prezentarea acestora utilizatorilor.)

Vizualizarea datelor se referă la tehnicile utilizate pentru a comunica date sau informații prin codificarea acestora ca obiecte vizuale (de exemplu, puncte, linii sau bare) conținute în grafice. Scopul este de a comunica informațiile în mod clar și eficient utilizatorilor. Este unul dintre pașii analizei datelor sau științei datelor. Potrivit lui Friedman (2008),

„scopul principal al vizualizării datelor este de a comunica informațiile în mod clar și eficient prin mijloace grafice. Nu înseamnă că vizualizarea datelor trebuie să arate plictisitoare pentru a fi funcțională sau extrem de sofisticată pentru a arăta frumoasă. Pentru a transmite ideile în mod eficient, atât forma estetică, cât și funcționalitatea trebuie să meargă mână în mână, oferind perspective asupra unui set de date destul de rar și complex, comunicând aspectele cheie într-un mod mai intuitiv. Cu toate acestea, designerii nu reușesc adesea să atingă un echilibru între formă și funcție, creând vizualizări de date superbe care nu își servesc scopul principal – de a comunica informații”.

Într-adevăr, Fernanda Viegas și Martin M. Wattenberg au sugerat că o vizualizare ideală nu ar trebui doar să comunice clar, ci să stimuleze implicarea și atenția privitorului.
Fără a se limita la comunicarea unei informații, o vizualizare a datelor bine concepută este, de asemenea, o modalitate de a înțelege mai bine datele (într-o perspectivă de cercetare bazată pe date), deoarece ajută la descoperirea tendințelor, la realizarea de perspective, la explorarea surselor și la a spune povești.

Vizualizarea datelor este strâns legată de grafica informațională, vizualizarea informațiilor, vizualizarea științifică, analiza exploratorie a datelor și grafica statistică. În noul mileniu, vizualizarea datelor a devenit o zonă activă de cercetare, predare și dezvoltare. Potrivit lui Post et al. (2002), a unit vizualizarea științifică cu cea informațională.

Caracteristicile afișărilor grafice eficiente

Diagrama lui Charles Joseph Minard din 1869 a Marșului lui Napoleon(Diagrama lui Charles Joseph Minard din 1869 a Marșului lui Napoleon – un exemplu timpuriu de grafică informativă.)

Profesorul Edward Tufte a explicat că utilizatorii afișajelor de informații execută anumite sarcini analitice, cum ar fi realizarea de comparații sau determinarea cauzalității. Principiul de proiectare a graficului informațional ar trebui să susțină sarcina analitică, arătând comparația sau cauzalitatea.

În cartea sa din 1983, The Visual Display of Quantitative Information, Edward Tufte definește „afișări grafice” și principii pentru afișarea grafică eficientă în următorul pasaj:

„Excelența în grafica statistică constă în idei complexe comunicate cu claritate, precizie și eficiență. Afișajele grafice ar trebui să:

  • afișeze datele
  • determine spectatorul să se gândească la substanță mai degrabă decât la metodologie, design grafic, tehnologia producției grafice sau la altceva
  • evite să distorsioneze ceea ce au de spus datele
  • prezinte multe numere într-un spațiu mic
  • facă coerente seturi mari de date
  • încurajeze ochiul să compare diferite date
  • dezvăluie datele la mai multe niveluri de detaliu, de la o vedere de ansamblu la structura fină
  • servească un scop destul de clar: descriere, explorare, intabulare sau decorare
  • fie strâns integrate cu descrierile statistice și verbale ale unui set de date.

Grafica dezvăluie date. Într-adevăr, grafica poate fi mai precisă și mai revelatoare decât calculele statistice convenționale.”

De exemplu, diagrama Minard arată pierderile suferite de armata lui Napoleon în perioada 1812-1813. Sunt reprezentate șase variabile: dimensiunea armatei, locația acesteia pe o suprafață bidimensională (x și y), timpul, direcția de mișcare și temperatura. Lățimea liniei ilustrează o comparație (dimensiunea armatei în anumite momente), în timp ce axa temperaturii sugerează o cauză a modificării dimensiunii armatei. Această afișare multivariată pe o suprafață bidimensională spune o poveste care poate fi înțeleasă imediat în timp ce identifică datele sursă pentru a construi credibilitatea. Tufte a scris în 1983 că: „Ar putea fi cel mai bun grafic statistic realizat vreodată”.

Neaplicarea acestor principii poate duce la grafice înșelătoare, care distorsionează mesajul sau susțin o concluzie eronată. Potrivit lui Tufte, zgomotul grafic se referă la decorarea interioară străină a graficului care nu îmbunătățește mesajul sau la efecte tridimensionale sau de perspectivă gratuite. Separarea inutilă a cheii explicative de imaginea în sine, ceea ce face ca ochiul să călătorească înainte și înapoi de la imagine la cheie, este o formă de „rămășiță administrativă”. Raportul dintre „date și cerneală” ar trebui să fie maximizat, ștergând cerneala non-data acolo unde este posibil.

Biroul de buget al Congresului a rezumat mai multe bune practici pentru afișajele grafice într-o prezentare din iunie 2014. Acestea au inclus: a) Cunoașterea publicului; b) Proiectarea de elemente grafice care pot sta singure în afara contextului raportului; și c) Proiectarea graficelor care comunică mesajele cheie din raport.

Referințe

Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

Statistica pentru afaceri
Statistica pentru afaceri

Statistica pentru afaceri este un ghid practic elementar de statistică, cu eșantioanele de date și exemplele orientate spre afaceri. Statistica face posibilă analiza problemelor de afaceri din lumea reală cu date reale, astfel încât să puteți determina dacă o strategie … Citeşte mai mult

Nu a fost votat $3,99$8,55 Selectează opțiunile
Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat $2,99$11,99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *