Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Tableau: Curățarea datelor

Tableau: Curățarea datelor

Setul de date folosit pentru aceste exemple este un subset al unui set de date de la Banca Mondială (http://data.worldbank.org/data-catalog/crowd-sourced-price-collection). Datele au fost colectate ca parte a unui studiu pilot care examinează fezabilitatea colectării de date despre prețurile alimentelor. Datele privind prețurile au fost colectate de persoane neprofesioniste pentru treizeci de produse alimentare specifice pe parcursul mai multor luni în opt țări. Fișierul setului de date conține date geografice (oraș și țară), date de timp (săptămâna de observare), informații despre produs (nume, cantitate) și preț (în dolari SUA).

1) Deschideți Tableau Desktop.

2) Faceți clic pe pictograma din stânga sus, examinați opțiunile oferite pe acest ecran.

3) În Connect Pane, faceți clic pe Excel.

4) Navigați la fișierul Foodstuff Dataset de pe computer și deschideți-l.

5) Vizualizați datele în panoul de previzualizare de mai jos.

6) Găsiți câmpul de date numit Location. Divizați acest câmp în oraș și țară.

  1. Faceți clic pe triunghiul meniului derulant pentru coloana Location ( ▼ ) și selectați Split.
  2. Spuneți lui Tableau că Location 1 este un oraș dând clic pe pictograma =Abc și alegând Geographic Role => City.
  3. Spuneți lui Tableau că Location 2 este o țară dând clic pe pictograma =Abc și alegând Geographic Role => Country/Region.
  4. Redenumiți „Location – Split 1” în City
  5. Redenumiți „Location – Split 2” în Country.

7) Putem vedea din acest ecran că ceea ce avem acum este un rând pentru fiecare locație care oferă prețuri observate în mai multe săptămâni de observare. Acesta poate fi un format bun pentru a afișa vizual datele, dar este o modalitate slabă de a permite analizarea datelor. Trebuie să punem datele „în ordine”. Pentru a ne ordona datele, vrem să facem ceea ce Tableau numește „pivotare”.

  1. Folosiți tasta Shift pentru a evidenția toate coloanele Week (1 ianuarie 2012 până la 29 aprilie 2012).
  2. Faceți clic dreapta pe coloanele selectate și alegeți Pivot.
  3. Redenumiți coloana „Pivot Field Names” în „Date”, iar coloana „Pivot Field Values” în „Nominal Price”.
  4. Spuneți lui Tableau să trateze câmpul Date ca o dată făcând clic pe pictograma  =Abc  și alegând Date.

Pentru a examina, ne-am curățat datele pentru analiză: 1) luând un nume de locație care a fost formatat „oraș, țară” și împărțindu-l în două câmpuri etichetate corespunzător și 2) ordonând datele noastre prin pivotarea acestora astfel încât fiecare rând să conţină doar o singură observaţie. Foarte bine!

Tableau - Data Interpreter Figura 1. Vedere Data Interpreter după curățarea datelor

8) Acum, faceți clic pe „Sheet 1” din partea de jos pentru a începe!

Suplimentar:

  • Accesați Tableau Online Help selectând Open Help din opțiunea Help din Bara de instrumente. Căutați termenul „Excel” folosind câmpul de căutare din dreapta sus. Examinați diferitele pagini de ajutor. Căutați „data interpreter” și examinați diferitele pagini de ajutor.
  • Opriți computerul și faceți clic pe pictograma din stânga sus, apoi, în panoul Discover din dreapta, faceți clic pe subiectul „Connecting to Data”. Rețineți această opțiune când puteți reda videoclipuri cu audio.
  • Efectuați o căutare pe Google cu „Tidy Data” și examinați PDF-ul Wickham care va fi în partea de sus.

Sursa: Paul Albert, Tableau: Power Start Workbook, licența CC BY-NC-SA 4.0. Traducere Nicolae Sfetcu

Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Rețele de comunicații 5G
Rețele de comunicații 5G

Datorită impactului său așteptat în economie și societate, a cincea generație de telecomunicații mobile (5G) este una dintre cele mai importante inovații ale timpului nostru. Așteptările cresc cu capacitățile de bandă largă ale 5G, accesibile tuturor și peste tot, la … Citeşte mai mult

Nu a fost votat $2,99$6,88 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.