Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Tableau: Curățarea datelor

Tableau: Curățarea datelor

Setul de date folosit pentru aceste exemple este un subset al unui set de date de la Banca Mondială (http://data.worldbank.org/data-catalog/crowd-sourced-price-collection). Datele au fost colectate ca parte a unui studiu pilot care examinează fezabilitatea colectării de date despre prețurile alimentelor. Datele privind prețurile au fost colectate de persoane neprofesioniste pentru treizeci de produse alimentare specifice pe parcursul mai multor luni în opt țări. Fișierul setului de date conține date geografice (oraș și țară), date de timp (săptămâna de observare), informații despre produs (nume, cantitate) și preț (în dolari SUA).

1) Deschideți Tableau Desktop.

2) Faceți clic pe pictograma din stânga sus, examinați opțiunile oferite pe acest ecran.

3) În Connect Pane, faceți clic pe Excel.

4) Navigați la fișierul Foodstuff Dataset de pe computer și deschideți-l.

5) Vizualizați datele în panoul de previzualizare de mai jos.

6) Găsiți câmpul de date numit Location. Divizați acest câmp în oraș și țară.

  1. Faceți clic pe triunghiul meniului derulant pentru coloana Location ( ▼ ) și selectați Split.
  2. Spuneți lui Tableau că Location 1 este un oraș dând clic pe pictograma =Abc și alegând Geographic Role => City.
  3. Spuneți lui Tableau că Location 2 este o țară dând clic pe pictograma =Abc și alegând Geographic Role => Country/Region.
  4. Redenumiți „Location – Split 1” în City
  5. Redenumiți „Location – Split 2” în Country.

7) Putem vedea din acest ecran că ceea ce avem acum este un rând pentru fiecare locație care oferă prețuri observate în mai multe săptămâni de observare. Acesta poate fi un format bun pentru a afișa vizual datele, dar este o modalitate slabă de a permite analizarea datelor. Trebuie să punem datele „în ordine”. Pentru a ne ordona datele, vrem să facem ceea ce Tableau numește „pivotare”.

  1. Folosiți tasta Shift pentru a evidenția toate coloanele Week (1 ianuarie 2012 până la 29 aprilie 2012).
  2. Faceți clic dreapta pe coloanele selectate și alegeți Pivot.
  3. Redenumiți coloana „Pivot Field Names” în „Date”, iar coloana „Pivot Field Values” în „Nominal Price”.
  4. Spuneți lui Tableau să trateze câmpul Date ca o dată făcând clic pe pictograma  =Abc  și alegând Date.

Pentru a examina, ne-am curățat datele pentru analiză: 1) luând un nume de locație care a fost formatat „oraș, țară” și împărțindu-l în două câmpuri etichetate corespunzător și 2) ordonând datele noastre prin pivotarea acestora astfel încât fiecare rând să conţină doar o singură observaţie. Foarte bine!

Tableau - Data Interpreter Figura 1. Vedere Data Interpreter după curățarea datelor

8) Acum, faceți clic pe „Sheet 1” din partea de jos pentru a începe!

Suplimentar:

  • Accesați Tableau Online Help selectând Open Help din opțiunea Help din Bara de instrumente. Căutați termenul „Excel” folosind câmpul de căutare din dreapta sus. Examinați diferitele pagini de ajutor. Căutați „data interpreter” și examinați diferitele pagini de ajutor.
  • Opriți computerul și faceți clic pe pictograma din stânga sus, apoi, în panoul Discover din dreapta, faceți clic pe subiectul „Connecting to Data”. Rețineți această opțiune când puteți reda videoclipuri cu audio.
  • Efectuați o căutare pe Google cu „Tidy Data” și examinați PDF-ul Wickham care va fi în partea de sus.

Sursa: Paul Albert, Tableau: Power Start Workbook, licența CC BY-NC-SA 4.0. Traducere Nicolae Sfetcu

Introducere în Business Intelligence
Introducere în Business Intelligence

O resursă esențială pentru toți cei interesați de analiza datelor și de optimizarea proceselor de afaceri.

Nu a fost votat 14.32 lei25.71 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Lucrul cu baze de date
Lucrul cu baze de date

Descoperă puterea bazelor de date cu acest ghid complet.

Nu a fost votat 19.11 lei38.26 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Statistica pentru afaceri
Statistica pentru afaceri

Instrumentul esențial pentru decizii inteligente în mediul de afaceri!

Nu a fost votat 19.11 lei40.94 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *