Home » Articole » Articole » Calculatoare » Programare » Python » Știința datelor: Generarea aleatorie de valori pentru date sintetice

Știința datelor: Generarea aleatorie de valori pentru date sintetice

postat în: Python 0

O abilitate foarte utilă este cea de a crea rapid seturi de date sintetice (artificiale; generate de propriul cod, și generatoare de numere aleatoare) care au anumite proprietăți. Uneori, folosim astfel de date pentru a verifica corect rezultatele codului nostru cu intrări „idealiste” (simplificate și cunoscute). Alteori, folosim date sintetice ca bază cu care să comparăm seturi de date din lumea reală despre care bănuim că au caracteristici similare. Și alteori pur și simplu nu avem acces la date relevante din lumea reală, dar avem nevoie de intrări într-un anumit proces de simulare.

Acest capitol și următorul vă vor învăța elementele esențiale ale acestui proces.

Generarea de numere aleatorii (și alte valori aleatorii) este o activitate pe care o desfășurăm surprinzător de des în știința datelor. „Numerele aleatorii”, după cum se dovedește, nu sunt cu adevărat aleatorii, deoarece limbajul de programare folosește un algoritm bizar, dar determinist și repetabil, pentru a le găsi. Acest lucru este frumos, deoarece putem garanta că de fiecare dată când rulăm un program vom obține aceeași secvență de numere aleatorii. Facem acest lucru setând generatorul de numere aleatorii la o anumită valoare. Ne ajută să ne depanăm codul, deoarece, altfel, o secvență de numere care se schimbă ar fi o țintă în mișcare frustrantă.

NumPy oferă o bibliotecă foarte frumoasă pentru toate acestea, toate fiind în spațiul de nume np.random. Pentru a seta sămânța generatorului de numere aleatorii, tot cetrebuie să faceți este să apelați funcția seed() și să îi transmiteți numărul dvs. favorit:

np.random.seed(13)

(Am ales 13 pentru că acesta era numărul tricoului meu de baseball din liga mica în copilărie.) Vă recomand să puneți această linie de cod (cu orice număr întreg pozitiv dorit) în partea de sus a oricărui fișier .py în care generați aleatoriu valori. Dacă doriți o secvență diferită de valori aleatorii mai târziu, puteți fie să schimbați numărul întreg cu ceva diferit, fie să comentați complet linia adăugând un caracter „#”.

Sursa: Stephen Davies, The Crystal Ball – Instruction Manual, Vol. 2: Introduction to Data Science, v. 1.1. Copyright © 2020 Stephen Davies. Licența CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu. © 2021 MultiMedia Publishing, Introducere în Știința Datelor, Volumul 2

Business intelligence și analitica în afaceri
Business intelligence și analitica în afaceri

Datele sunt fapte și cifre brute, iar informațiile sunt date semnificative care ar fi utile pentru o persoană sau companie. Business intelligence extrage informații din datele brute prin instrumente precum mineritul datelor, analiza perspectivală, procesarea analitică online etc. Cartea va oferi … Citeşte mai mult

Nu a fost votat 23.85 lei52.53 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Analitica rețelelor sociale
Analitica rețelelor sociale

Analitica rețelelor sociale este un domeniu nou și emergent, pregătit pentru a permite companiilor să își îmbunătățească inițiativele de gestionare a performanței în diferite funcții de afaceri. Indiferent dacă este vorba de măsurarea eficienței campaniilor promoționale, colectarea de informații despre … Citeşte mai mult

Nu a fost votat 19.07 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Rețele de comunicații 5G
Rețele de comunicații 5G

Datorită impactului său așteptat în economie și societate, a cincea generație de telecomunicații mobile (5G) este una dintre cele mai importante inovații ale timpului nostru. Așteptările cresc cu capacitățile de bandă largă ale 5G, accesibile tuturor și peste tot, la … Citeşte mai mult

Nu a fost votat 14.29 lei32.88 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *