Home » Articole » Articole » Știință » Matematica » Știința datelor (Data science » Interpretarea datelor în știința datelor: Asociere și cauzalitate

Interpretarea datelor în știința datelor: Asociere și cauzalitate

O asociere între variabile înseamnă doar că acestea sunt corelate într-un fel statistic. (1) Dacă A = FUMĂTOR merge cu C = CANCER mai des decât N = NEFUMĂTOR, atunci există o asociere între cele două, punct. Dacă venitul anual V este în medie mai mare pentru R = REPUBLICAN decât pentru D = DEMOCRAT, atunci există o asociere între cele două, punct.

(Apropo, o nuanță cheie se va dovedi a fi: cât de des trebuie ca A = FUMĂTOR să meargă cu C = CANCER pentru a fi încrezători că există o asociere adevărată? Sau cu cât să fie mai bogați R = REPUBLICANII în medie pentru ca noi să avem încredere că am identificat o legătură reală cu un partid politic – aceasta este puțin complicat și vom amâna abordarea ei pentru moment.)

Deci, oricum, întrebarea asocierii se dovedește a fi destul de simplu de răspuns. Python ne va spune pur și simplu dacă variabilele sunt asociate sau nu. Cu toate acestea, mai dificilă este determinarea cauzalității (a.k.a. cauzarea). Afilierea politică a unei persoane influențează cât de multă averea sa? Sau este invers: averea unei persoane o face să voteze într-un anumit fel? Sau nu este niciuna dintre acestea, cu un al treilea factor (poate valorile sau filozofia de viață) care ajută la determinarea ambelor variabile?

Dacă este cazul primei dintre aceste trei situații, am scrie „R → V”, pronunțat „R cauzează V”. Dacă este a doua, am scrie „V → R”, iar pentru a treia, am scrie „C → A, B” pentru o altă variabilă C (posibil încă de determinată). Determinarea  (dacă există) a care dintre acestea este adevărată, necesită o gândire atentă, intuiție și alte tipuri de teste statistice.

De fapt, doar pentru a vă pune mintea la treabă, Figura 10.1 oferă o listă parțială a diferitelor tipuri de cauzalitate care ar putea fi adevărata explicație, odată ce aflăm că A și B au o asociere. După cum puteți vedea, există o mulțime de modalități de a greși. Doar una dintre posibilități este că „A cauzează de fapt B”, ceea ce am bănuit de la început. Celelalte sunt toate modalități de a produce aceeași asociere pe care am preluat-o în date.

Simbol Nume Exemplu
A → B cauzalitate Exercițiile fizice regulate duc, în mod normal, la o frecvență cardiacă mai scăzută în repaus.
B → A cauzalitate inversă Fumatul nu provoacă depresie; depresia determină fumatul.
C → A, B cauzalitate externă (factor de confuzie) Vânzările de înghețată nu provoacă atacuri de rechin; temperaturile ridicate stimulează atât vânzările de înghețată, cât și înotul în ocean.
A → B & C → B cauzalitate multiplă O educație de arte liberale îmbunătățește abilitățile de gândire critică, dar multe alte lucruri o fac și ele.
A, C → B cauzalitate comună Doar a fi înalt nu te face neapărat un bun jucător de baschet, dar dacă înălțimea ta este însoțită și de un alt factor (atletism), atunci vei fi un bun jucător.
A → C → B cauzalitate indirectă Oamenii care folosesc antiperspirant tind să primească mai multe întâlniri, dar nu din cauza antiperspirantului în sine;ci pentru că nu au un miros neplăcut.
A non→ B asociere falsă Deși timp de mulți ani rezultatul meciului de fotbal de la Washington, imediat premergător alegerilor prezidențiale, a prezis rezultatul alegerilor, aceasta a fost o coincidență.

Figura 10.1: Diferite tipuri de cauzalitate care ar putea fi motivul de bază pentru care există o asociere între A și B.

(1) Un alt mod de a spune acest lucru este să spunem că variabilele sunt dependente una de cealaltă, deși acest lucru este confuz, deoarece folosim deja cuvântul „dependent” pentru a ne referi la una dintre variabile.

Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat 13.67 lei23.95 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor

Transformă informația în putere cu ajutorul acestei cărți indispensabile!

Nu a fost votat 18.24 lei43.92 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat 0.00 lei10.74 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *