Interpretarea datelor în știința datelor: Asociere și cauzalitate

|

O asociere între variabile înseamnă doar că acestea sunt corelate într-un fel statistic. (1) Dacă A = FUMĂTOR merge cu C = CANCER mai des decât N = NEFUMĂTOR, atunci există o asociere între cele două, punct. Dacă venitul anual … Citeşte mai mult

Grafice de date: Histograme

|

După cum spune o vorbă mai veche, o imagine valorează cât o mie de cuvinte. Rezumatele datelor pot veni în imagini sau grafice. Iată câteva dintre tipurile tipice de grafice pentru afișarea distribuțiilor.Ele ne pot oferi o privire de ansamblu … Citeşte mai mult

Variabile independente și variabile dependente în știința datelor

|

Să vedem cum să interpretăm corect datele cu care lucrăm; în special, cum să tragem concluzii corecte din ceea ce am colectat. Fără îndoială, ați văzut nenumărate studii care pretind că dezvăluie adevăruri importante despre lume, cum ar fi că … Citeşte mai mult

Operații cu șiruri în știința datelor prin limbajul de programare Python

|

Pentru datele text, de asemenea, există multe posibilități de a se acționa asupra lor. Deocamdată, să învățăm doar câteva tehnici de concatenare a șirurilor (lipirea unul de capătul altuia), tăierea șirurilor (eliminarea spațiului alb (1) de la capete) și schimbarea majusculelor … Citeşte mai mult

A apărut ediția tipărită a cărții ”Căutarea, extragerea, organizarea și evaluarea informațiilor”

|

A apărut ediția tipărită a cărții ”Căutarea, extragerea, organizarea și evaluarea informațiilor” Format B5, 250 x 176 x 8 mm, 319 g, 165 pagini. Preț: 44,99 lei https://www.telework.ro/…/cautarea-extragerea…/ Informația, ca și concept, include o mare diversitate de sensuri în contexte … Citeşte mai mult

Covarianță, corelație și regresie în statistică

|

Acum este timpul să ne gândim la modul în care toate acestea se potrivesc împreună și să vedem cum sunt legate cele două abordări ale corelației. Începeți prin a presupune că aveți o populație de (x, y) care acoperă o … Citeşte mai mult

Coeficientul de determinare în analiza regresiei în statistică

|

Dacă utilizați media eșantionului pentru a estima valoarea prețului fiecărui apartament, greșeala dvs. este (y – y) pentru fiecare apartament. Punerea la pătrat a fiecărei erori astfel încât grijile legate de semne să fie depășite și apoi adăugarea erorilor la … Citeşte mai mult

Analiza de regresie în statistică

|

Analiza de regresie, ca majoritatea statisticilor multivariate, vă permite să deduceți că există o relație între două sau mai multe variabile. Aceste relații sunt rareori exacte, deoarece există variații cauzate de multe variabile, nu doar de variabilele studiate. Dacă spuneți … Citeşte mai mult

Testarea ipotezelor în statistică

|

Testarea ipotezelor este cealaltă formă utilizată pe scară largă de statisticile inferenţiale. Este diferită de estimare deoarece începeți un test de ipoteză, cu o idee despre cum este populația, și apoi testați pentru a vedea dacă eșantionul vă susține ideea. … Citeşte mai mult

Mineritul datelor (Data Mining): Coeficientul de corelație Pearson

|

Mineritul datelor (Big Data): Coeficientul de corelație Pearson Să aruncăm o privire mai detaliată asupra evaluărilor utilizatorilor. Vedem că utilizatorii au comportamente foarte diferite atunci când vine vorba de evaluarea trupelor: Angelica Bill Chan Dan Hailey Jordyn Sam Veronica Blues … Citeşte mai mult

Teoria învățării statistice

|

Teoria învățării statistice presupune aproximativ evaluarea cantității de date necesare pentru a obține o anumită precizie de predicție. Există diferențe între statistică și învățare automată, chiar dacă cele două domenii împărtășesc obiective comune. Într-adevăr, ambele par să încerce să folosească … Citeşte mai mult