Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Teste non-parametrice în statistici

Teste non-parametrice în statistici

Amintiți-vă că utilizați statisticile pentru a face inferențe despre populații din eșantioane. Majoritatea tehnicilor folosite de statisticieni necesită îndeplinirea a două ipoteze. În primul rând, populația din care provine eșantionul este normală. În al doilea rând, ori de câte ori au fost calculate mediile și varianțele, numerele din date sunt cardinale sau interval, ceea ce înseamnă că valoarea dată unei observații nu numai că vă spune care observație este mai mare sau mai mică, ci și cât de mai mare sau mai mică. Există multe situații în care aceste ipoteze nu sunt îndeplinite, iar utilizarea tehnicilor dezvoltate până acum nu va fi adecvată. Din fericire, statisticienii au dezvoltat un alt set de tehnici statistice, statistica neparametrică, pentru aceste situații. Trei dintre aceste teste sunt: testul U Mann-Whitney, care testează pentru a vedea dacă două eșantioane alese independent provin din populații cu aceeași locație; testul Wilcoxon de suma rangurilor, care testează pentru a vedea dacă două eșantioane pereche provin din populații cu aceeași locație; și corelația de rang a lui Spearman, care testează pentru a vedea dacă două variabile sunt legate.

Pentru un statistician, un parametru este o caracteristică măsurabilă a unei populații. Caracteristicile populației care îi interesează de obicei pe statisticieni sunt locația și forma. Statisticile non-parametrice sunt utilizate atunci când parametrii populației nu sunt măsurabili sau nu îndeplinesc anumite standarde. În cazurile în care datele ordonează doar observațiile, astfel încât intervalul dintre observații este necunoscut, nicio medie, nicio varianță nu pot fi calculate în mod semnificativ. În astfel de cazuri, trebuie să utilizați teste non-parametrice. Deoarece eșantionul dvs. nu are date cardinale sau de interval, nu le puteți utiliza pentru a estima media sau varianța populației, deși puteți face alte inferențe. Chiar dacă datele dumneavoastră sunt cardinale, populația trebuie să fie normală înainte de a fi cunoscută forma numeroaselor distribuții de eșantionare. Din fericire, chiar dacă populația nu este normală, astfel de distribuții de eșantionare sunt de obicei apropiate de forma cunoscută dacă sunt utilizate eșantioane mari. În acest caz, utilizarea tehnicilor obișnuite este acceptabilă. Cu toate acestea, dacă eșantioanele sunt mici și populația nu este normală, trebuie să utilizați statistici non-parametrice. După cum știți, „nu există niciun prânz gratuit”. Dacă vreți să faceți o inferență despre o populație fără a avea date cardinale, sau fără să știți că populația este normală, sau cu eșantioane foarte mici, va trebui să renunțați la ceva. În general, statisticile non-parametrice sunt mai puțin precise decât statisticile parametrice. Pentru că știți mai puțin despre populația despre care încercați să învățați, deducerile pe care le faceți sunt mai puțin exacte.

Când fie (1) populația nu este normală și eșantioanele sunt mici, fie (2) când datele nu sunt cardinale, se folosesc aceleași statistici non-parametrice. Cele mai multe dintre aceste teste implică clasarea membrilor eșantionului și majoritatea implică compararea clasamentului a două sau mai multe eșantioane. Deoarece nu putem calcula statistici semnificative ale eșantioanelor pentru a le compara cu un standard ipotetizat, ajungem să comparăm două eșantioane.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Introducere în Business Intelligence
Introducere în Business Intelligence

Colecția ȘTIINȚA INFORMAȚIEI ”Introducere în Business Intelligence” oferă cititorilor informații cuprinzătoare despre business intelligence, explorând toate aspectele importante ale inteligenței de afaceri în scenariul actual. Subiectele tratate se referă la abordările de bază ale business intelligence. Cartea își propune să … Citeşte mai mult

Nu a fost votat $2,99$4,80 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Rețele de comunicații 5G
Rețele de comunicații 5G

Datorită impactului său așteptat în economie și societate, a cincea generație de telecomunicații mobile (5G) este una dintre cele mai importante inovații ale timpului nostru. Așteptările cresc cu capacitățile de bandă largă ale 5G, accesibile tuturor și peste tot, la … Citeşte mai mult

Nu a fost votat $2,99$6,88 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.