O abilitate foarte utilă este cea de a crea rapid seturi de date sintetice (artificiale; generate de propriul cod, și generatoare de numere aleatoare) care au anumite proprietăți. Uneori, folosim astfel de date pentru a verifica corect rezultatele codului nostru cu intrări „idealiste” (simplificate și cunoscute). Alteori, folosim date sintetice ca bază cu care să comparăm seturi de date din lumea reală despre care bănuim că au caracteristici similare. Și alteori pur și simplu nu avem acces la date relevante din lumea reală, dar avem nevoie de intrări într-un anumit proces de simulare.
Acest capitol și următorul vă vor învăța elementele esențiale ale acestui proces.
Generarea de numere aleatorii (și alte valori aleatorii) este o activitate pe care o desfășurăm surprinzător de des în știința datelor. „Numerele aleatorii”, după cum se dovedește, nu sunt cu adevărat aleatorii, deoarece limbajul de programare folosește un algoritm bizar, dar determinist și repetabil, pentru a le găsi. Acest lucru este frumos, deoarece putem garanta că de fiecare dată când rulăm un program vom obține aceeași secvență de numere aleatorii. Facem acest lucru setând generatorul de numere aleatorii la o anumită valoare. Ne ajută să ne depanăm codul, deoarece, altfel, o secvență de numere care se schimbă ar fi o țintă în mișcare frustrantă.
NumPy oferă o bibliotecă foarte frumoasă pentru toate acestea, toate fiind în spațiul de nume np.random. Pentru a seta sămânța generatorului de numere aleatorii, tot cetrebuie să faceți este să apelați funcția seed() și să îi transmiteți numărul dvs. favorit:
np.random.seed(13)
(Am ales 13 pentru că acesta era numărul tricoului meu de baseball din liga mica în copilărie.) Vă recomand să puneți această linie de cod (cu orice număr întreg pozitiv dorit) în partea de sus a oricărui fișier .py în care generați aleatoriu valori. Dacă doriți o secvență diferită de valori aleatorii mai târziu, puteți fie să schimbați numărul întreg cu ceva diferit, fie să comentați complet linia adăugând un caracter „#”.
Sursa: Stephen Davies, The Crystal Ball – Instruction Manual, Vol. 2: Introduction to Data Science, v. 1.1. Copyright © 2020 Stephen Davies. Licența CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu. © 2021 MultiMedia Publishing, Introducere în Știința Datelor, Volumul 2
Lasă un răspuns