Python este un limbaj extrem de popular pentru programare și știința datelor (în prezent al treilea cel mai utilizat pe scară largă în lume (1). Limbajul în sine este diferit de mediul de programare folosit pentru a scrie cod în acesta, la fel cum „Engleza” este diferită de „Microsoft Word” și „Google Docs”. Un mediu de programare este doar un nume de lux pentru un instrument sau o aplicație utilizată pentru a scrie programe. Cel puțin, trebuie să includă o modalitate de a edita (scrie și revizui) cod și o modalitate de a-l executa (rula).
Există multe medii de programare diferite pe care oamenii de știință le folosesc pentru a scrie codul Python, la fel cum există multe aplicații diferite de procesare a textelor pe care oamenii le folosesc pentru a scrie în engleză. Alegerea se reduce în mare măsură la preferința personală. Unii folosesc IDE-uri complete (“integrated development environments” – „medii integrate de dezvoltare”) precum Spyder sau Atom; unii folosesc instrumente bazate pe text precum Notepad++ sau vim. Aici, vom folosi mediul „Jupyter Notebooks” prietenos și minimalist, deoarece este potrivit pentru o experiență introductivă.
Jupyter Notebook
Conceptul de Jupyter Notebook este simplu: este o pagină web cu „celule” editabile. Fiecare celulă este o mică fereastră de text pe care o puteți introduce.
Există trei tipuri de celule în Jupyter Notebooks:
Brut (Raw). „Raw” este prost. Nu-l folosiți niciodată.
Notificare (Markdown). Celulele „Markdown” sunt pentru text în limba engleză, nu pentru cod Python. Acestea sunt utilizate în principal pentru a descrie și a adnota ceea ce faceți în celulele de cod, cum ar fi un comentariu care rulează. Puteți tasta un text simplu într-o celulă Markdown, plus diverse ornamente de formatare simplă, cum ar fi boldface (punerea dublurilor (**) în jurul unui cuvânt sau a unei expresii), cursivelor (single splats), anteturile (prefațând o linie cu una sau mai multe hashtag-uri (cum ar fi # sau ###) și așa mai departe. (2) Când tastați într-o celulă Markdown, vedeți textul brut și formatarea; pentru a face de fapt pe Jupyter să redea celulele dvs. și să le facă frumoase, alegeți „Rulați Toate” “Run All” din meniul „Celulă” “Cell”.
Cod (Code). Cele mai importante celule sunt celulele „Code” care conțin cod. Când sunt executate (din nou, alegând „Run All” din meniul „Cell”), ele efectuează de fapt instrucțiunile Python pe care le-ați introdus în acea celulă și afișează rezultatele.
Apropo, o eroare obișnuită este când faceți clic într-un fel accidental într-un mod care schimbă tipul unei celule de la „Code” la unul dintre celelalte tipuri. Dacă faceți acest lucru, codul Python din acea celulă nu se va executa până când nu schimbați tipul înapoi la „Code” (mai multe despre acest lucru mai jos).
Figura prezintă un Jupyter Notebook găzduit de platforma de calcul cloud CoCalc, pe care îl vom folosi în acest ghid. Are două celule, una Markdown și una Code. Rețineți cu atenție meniul derulant de tip celulă care este cam ascuns în mijlocul paginii: în prezent citește „Code” deoarece a doua celulă este cea evidențiată. (Dacă am face clic pentru a evidenția și edita celula de sus, meniul respectiv se va schimba în „Markdown”).
Figura din partea de sus arată cele două celule înainte ca utilizatorul să efectueze un „Run All” din meniul „Cell”: tot Markdown-ul nu este redat (a se vedea hashtag-urile și splats-urile literal), iar codul este așezat acolo. După „Run All”, imaginea se schimbă: vedeți mesajul formatat în celula de sus și ieșirea fragmentului de cod Python după ce acesta rulează. (Acesta din urmă este ușor de ratat; priviți la imaginea de jos și vedeți mesajul „Our country is 245 years old!”. Acesta este „rezultatul”.)
(Un Jupyter Notebook cu o celulă Markdown și o celulă Code. În imaginea de sus, cele două celule au fost editate, dar nu au fost încă „rulate” – de aceea formatarea Markdown nu este redată și codul nu a fost executat. Panoul de jos afișează ambele celule după ce utilizarea a ales „Run All” din meniul „Cell”.)
Cod și ieșire
De acum înainte, ori de câte ori dau un exemplu de cod Python în acest ghid, îl voi scrie într-o cutie ca aceasta:
founding = 1776 usa_age = 2021 – founding
print(„Our country is {} years old!”.format(usa_age))
Această casetă înseamnă „aceste lucruri intră într-o celulă Code a unui Notebook”.
Când scriu rezultatul corespunzător (adică ce se tipărește pe pagina imediat sub celula de cod atunci când este selectat „Run All” din meniul „Cell”), îl voi scrie astfel:
I Our country is 245 years old!
Bara verticală înseamnă „aceste lucruri sunt rezultatul tipărit al executării celulei de cod”.
Destul de usor.
Note
(1) A se vedea https://www.tiobe.com/tiobe-index/.
(2) Pentru o listă completă a opțiunilor de formatare, consultați https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet
Sursa: Stephen Davies, The Crystal Ball – Instruction Manual, Vol. 1: Introduction to Data Science, v. 1.1. Copyright © 2021 Stephen Davies. Licența CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu
© 2021 MultiMedia Publishing, Introducere în Știința Datelor, Volumul 1
Lasă un răspuns