Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Spyder: un mediu de analiză a datelor cu Python

Spyder: un mediu de analiză a datelor cu Python

Spyder este un mediu de analiză a datelor bazat pe Python, scris special pentru știința datelor și programare științifică.

Vine cu distribuția Anaconda, la fel ca aproape orice altceva pe care îl vom folosi în acest volum (scikit-learn, NumPy, SciPy, Pandas, Matplotlib etc.) Descărcați-l de aici: https://www.anaconda.com/produse/distributie.

Notă: asigurați-vă că obțineți Python 3.x, nu 2.x!!

(Nu sunt compatibile reciproc.) Numerele de după punct nu contează atât de mult. Dar înainte de punctul trebuie să fie un „3”.

Și nu vă faceți griji: toate lucrurile pe care le-ați învățat volumul unu folosind Python Jupyter Notebooks încă se aplică! Singura diferență este că folosirea unui IDE (Integrated Development Environment) precum Spyder nu este bazată pe web: este complet offline, receptiv și mai bogat în funcții. În loc de un blocnotes într-un browser, veți crea propriile fișiere de cod sursă Python (fiecare dintre ele având o extensie .py) și le veți executa direct.

Ca și în cazul unui blocnotes, un fișier cu cod sursă Python (.py) poate avea text în clar, precum și cod Python. Cu toate acestea, textul în clar trebuie să fie „comentat” prin prefixarea fiecărei linii non-cod cu un hashtag („#”). Acest lucru îi spune lui Spyder că linia în cauză nu este destinată să fie analizată și executată atunci când programul este rulat.

Spyder
Credit https://www.spyder-ide.org/

Tutorialul Spyder

Mai întâi, descărcați cea mai recentă versiune de Anaconda pentru platforma dvs. de pe https://www.anaconda.com/products/distribution. Va dura ceva timp, după care ar trebui să puteți porni IDE-ul Spyder (detaliile depind de sistemul dvs. de operare) .

Spyder vine cu un tutorial frumos, așa că aș duplica dacă așreitera aceste instrucțiuni aici. În momentul în care scriu acest articol, îl puteți accesa alegând „Tutorial Spyder” din meniul „Help” odată ce porniți Spyder. Asigurați-vă că dați clic pe fiecare săgeată verde pentru a o extinde pe măsură ce mergeți. (BTW, nu vă recomand să faceți clic pe linkuri din acest tutorial, deoarece vă aduce la secțiunea legată, dar apoi nu vă oferă nicio modalitate evidentă de a vă întoarce unde ați fost. Poate că nu știu eu cum.)

Parcurgeți întregul tutorial acum. Cu toate acestea, puteți sări peste următoarele secțiuni:

  • „Încercarea pentru conformitatea PEP 8”
  • „Python simbolic automat”
  • „Alte observații”
  • „Formatarea șirului de documentație”

Nu vom folosi niciuna dintre aceste funcții în acest curs sau în această carte.

Există câteva concepte pe care le veți întâlni în acest tutorial, care nu au fost tratate în cartea anterioară. Ele includ:

  • Conceptul „consolei IPython”, panoul din colțul din dreapta jos al ecranului Spyder cu care puteți interacționa și vedea ieșirea. Acesta este oarecum diferit (dar mai bun) decât modul în care Jupyter Notebook acționează cu celulele sale și cu rezultatele tipărite ale fiecărei celule. Fiți foarte confortabil cu utilizarea consolei.
  • Conceptul de „docstring”, care este text inclus între ghilimele triple duble (“”) imediat după definiția unei funcții și care apare apoi în consolă dacă tastați help(function_name). Acest lucru este relativ util.
  • Conceptul unui depanator interactiv, care poate fi o caracteristică IDE foarte utilă.

Configurare

În cele din urmă, câteva setări pe care ar trebui să le schimbi înainte de a începe treaba. Acestea se află pe pagina „Preferences”, pe care le puteți accesa prin „Tools > Preferences” în Linux sau Windows sau prin „Python/Spyder > Preferences” pe MacOS:

  1. În „Editor”, găsiți fila „Source Code” și asigurați-vă că „Indentation characters” este setat la „4 spaces”.
  2. În „IPython console”, găsiți fila „Graphics” și setați „Graphics backend” la „Inline”. Asigurați-vă că, după ce faceți acest lucru, puteți introduce o comandă grafică la fel ca aceasta în consolă:

import pandas as pd
silly = pd.Series([4,9,8],index=['bill','kevin','jane'])
print(silly)
silly.plot(kind='bar')

și vedeți graficul rezultat în panoul „Plots” al ferestrei din dreapta sus. (Poate fi necesar să faceți clic pe cuvântul „Plots” pentru a arăta acest lucru.)

O notă despre foldere/directoare

O problemă obișnuită, o să menționez că problema cu mulți noi utilizatori ai Spyder are de-a face cu locul în care sunt stocate fișierele pe computer. Probabil știți că computerul dvs. stochează informațiile într-o ierarhie în cascadă de fișiere și dosare (dosarele sunt numite și directoare). Un fișier este o singură unitate de informații, care poate fi deschisă de o aplicație; poate conține text, o melodie, o imagine sau chiar un videoclip.

Un folder/director, pe de altă parte, este un container de fișiere (și adesea, alte directoare).

Poate că ești genul de persoană căreia îi place să-și aranjeze informațiile într-un mod sensibil, folosind directoare ca mecanism organizațional expresiv. Sau poate ești genul care aruncă totul în jos oriunde, știind că îl poate căuta mai târziu. Oricum, ceea ce este important de știut este că Python, atunci când încearcă să citească un fișier (de exemplu, cu pd.read_csv()) va căuta într-un anumit folder/director pentru a-l găsi. Dacă nu îl găsește acolo, renunță.

Acest lucru este frustrant pentru cei care descarcă date (poate un fișier .csv) de pe un site web, dar nu înțeleg cu adevărat unde a plasat browser-ul lor acest fișier pe hard disk. Apoi scriu un program Python – salvează fără îndoială acel fișier .py într-un folder diferit de cel în care se află fișierul .csv – pe care încearcă să-l deschidă – și apare gol.

Soluția este de fapt foarte simplă: stocați fișierele de date în același folder cu fișierele dvs. Python.

În acest moment, ar trebui să creați un folder în care să păstrați toate codurile și datele pentru acest curs. Numiți-l astfel încât să vi-l amintiți cțnd vreți să navigați el. Apoi:

  • Ori de câte ori creați un nou program Python, „Save as…” fișier .py în acest folder.
  • Ori de câte ori descărcați un fișier de date, stocați-l în acest folder. (Dacă browserul dvs. stochează automat descărcările într-un folder „Downloads”, fie reconfigurați browserul pentru a vă solicita o locație când descarcă, fie copiați manual fișierele pe care le descărcați în noul folder.)

Sursa: Stephen Davies, The Crystal Ball – Instruction Manual, Vol. 2: Introduction to Data Science, v. 1.1. Copyright © 2020 Stephen Davies. Licența CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu. © 2021 MultiMedia Publishing, Introducere în Știința Datelor, Volumul 2

Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile
Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor

Informația, ca și concept, include o mare diversitate de sensuri în contexte diferite, de la cele zilnice până la cele tehnice. Conceptul de informație este strâns legat de noțiunile de restricție, comunicare, control, date, forme, educație, cunoaștere, înțelegere, stimul mental, … Citeşte mai mult

Nu a fost votat $3.99$9.61 Selectează opțiunile
Rețele de comunicații 5G
Rețele de comunicații 5G

Datorită impactului său așteptat în economie și societate, a cincea generație de telecomunicații mobile (5G) este una dintre cele mai importante inovații ale timpului nostru. Așteptările cresc cu capacitățile de bandă largă ale 5G, accesibile tuturor și peste tot, la … Citeşte mai mult

Nu a fost votat $2.99$6.88 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *