Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Tableau: Curățarea datelor

Tableau: Curățarea datelor

Setul de date folosit pentru aceste exemple este un subset al unui set de date de la Banca Mondială (http://data.worldbank.org/data-catalog/crowd-sourced-price-collection). Datele au fost colectate ca parte a unui studiu pilot care examinează fezabilitatea colectării de date despre prețurile alimentelor. Datele privind prețurile au fost colectate de persoane neprofesioniste pentru treizeci de produse alimentare specifice pe parcursul mai multor luni în opt țări. Fișierul setului de date conține date geografice (oraș și țară), date de timp (săptămâna de observare), informații despre produs (nume, cantitate) și preț (în dolari SUA).

1) Deschideți Tableau Desktop.

2) Faceți clic pe pictograma din stânga sus, examinați opțiunile oferite pe acest ecran.

3) În Connect Pane, faceți clic pe Excel.

4) Navigați la fișierul Foodstuff Dataset de pe computer și deschideți-l.

5) Vizualizați datele în panoul de previzualizare de mai jos.

6) Găsiți câmpul de date numit Location. Divizați acest câmp în oraș și țară.

  1. Faceți clic pe triunghiul meniului derulant pentru coloana Location ( ▼ ) și selectați Split.
  2. Spuneți lui Tableau că Location 1 este un oraș dând clic pe pictograma =Abc și alegând Geographic Role => City.
  3. Spuneți lui Tableau că Location 2 este o țară dând clic pe pictograma =Abc și alegând Geographic Role => Country/Region.
  4. Redenumiți „Location – Split 1” în City
  5. Redenumiți „Location – Split 2” în Country.

7) Putem vedea din acest ecran că ceea ce avem acum este un rând pentru fiecare locație care oferă prețuri observate în mai multe săptămâni de observare. Acesta poate fi un format bun pentru a afișa vizual datele, dar este o modalitate slabă de a permite analizarea datelor. Trebuie să punem datele „în ordine”. Pentru a ne ordona datele, vrem să facem ceea ce Tableau numește „pivotare”.

  1. Folosiți tasta Shift pentru a evidenția toate coloanele Week (1 ianuarie 2012 până la 29 aprilie 2012).
  2. Faceți clic dreapta pe coloanele selectate și alegeți Pivot.
  3. Redenumiți coloana „Pivot Field Names” în „Date”, iar coloana „Pivot Field Values” în „Nominal Price”.
  4. Spuneți lui Tableau să trateze câmpul Date ca o dată făcând clic pe pictograma  =Abc  și alegând Date.

Pentru a examina, ne-am curățat datele pentru analiză: 1) luând un nume de locație care a fost formatat „oraș, țară” și împărțindu-l în două câmpuri etichetate corespunzător și 2) ordonând datele noastre prin pivotarea acestora astfel încât fiecare rând să conţină doar o singură observaţie. Foarte bine!

Tableau - Data Interpreter Figura 1. Vedere Data Interpreter după curățarea datelor

8) Acum, faceți clic pe „Sheet 1” din partea de jos pentru a începe!

Suplimentar:

  • Accesați Tableau Online Help selectând Open Help din opțiunea Help din Bara de instrumente. Căutați termenul „Excel” folosind câmpul de căutare din dreapta sus. Examinați diferitele pagini de ajutor. Căutați „data interpreter” și examinați diferitele pagini de ajutor.
  • Opriți computerul și faceți clic pe pictograma din stânga sus, apoi, în panoul Discover din dreapta, faceți clic pe subiectul „Connecting to Data”. Rețineți această opțiune când puteți reda videoclipuri cu audio.
  • Efectuați o căutare pe Google cu „Tidy Data” și examinați PDF-ul Wickham care va fi în partea de sus.

Sursa: Paul Albert, Tableau: Power Start Workbook, licența CC BY-NC-SA 4.0. Traducere Nicolae Sfetcu

Statistica pentru afaceri
Statistica pentru afaceri

Statistica pentru afaceri este un ghid practic elementar de statistică, cu eșantioanele de date și exemplele orientate spre afaceri. Statistica face posibilă analiza problemelor de afaceri din lumea reală cu date reale, astfel încât să puteți determina dacă o strategie … Citeşte mai mult

Nu a fost votat $3.99$8.55 Selectează opțiunile
Big Data: Modele de afaceri - Securitatea megadatelor
Big Data: Modele de afaceri – Securitatea megadatelor

Termenul megadate (Big Data, date masive) este adesea folosit în mod vag pentru a desemna paleta de algoritmi, tehnologii și sisteme utilizate pentru colectarea datelor de volum și varietate fără precedent și extragerea de valoare din acestea prin calculul masiv … Citeşte mai mult

Nu a fost votat $3.99$5.99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *