Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Testul t în statistică

Testul t în statistică

Anterior a fost introdusă o distribuție de eșantionare, distribuția t, și ați învățat cum să utilizați distribuția t pentru a face o inferență importantă, o estimare pe intervale a mediei populației. Aici veți învăța cum să utilizați aceeași distribuție-t pentru a face mai multe inferențe, de data aceasta sub formă de testare a ipotezelor. Veți învăța cum să utilizați testul t în trei tipuri diferite de ipoteze. Veți avea, de asemenea, șansa de a utiliza șabloanele interactive Excel pentru a aplica testul-t în situații alternative. Înainte de a începe să învățăm despre aceste teste, este necesară o revizuire rapidă a distribuției t.

Distribuția t

Distribuția t este o distribuție de eșantionare. Puteți genera propria distribuție t cu n-1 grade de libertate pornind de la o populație normală, alegând toate eșantioanele posibile de o dimensiune, n, calculând un scor t pentru fiecare eșantion, unde:

t = (x – μ)/(s/√n)

x = media eșantionului
μ = media populației
s = abaterea standard a eșantionului
n = dimensiunea eșantionului

Când aveți toate scorurile t ale eșantioanelor, formați o distribuție relativă a frecvenței și veți avea distribuția dvs. t. Din fericire, nu trebuie să generați propriile distribuții t, deoarece orice carte de statistici are un tabel care arată forma distribuției t pentru multe grade diferite de libertate. Figura reproduce o porțiune a unui tabel t tipic într-un șablon Excel interactiv.

Un element interactiv sau media a fost exclus din această versiune a textului. Il puteti vizualiza online aici: https://www.telework.ro/wp-content/uploads/2022/01/Chapter-5_Fig-5.1_Tabel_t.xlsx

Tabel t (Șablon Excel interactiv pentru determinarea punctului de decuplare al unui tabel t – vezi Anexa 5.)

Când te uiți la formula pentru scorul t, ar trebui să poți vedea că scorul t mediu este zero, deoarece media lui x este egală cu μ. Deoarece majoritatea eșantioanelor au x care sunt aproape de μ, majoritatea vor avea scoruri t care sunt aproape de zero. Distribuția t este simetrică, deoarece jumătate dintre eșantioane vor avea x mai mari decât μ și jumătate mai mici. După cum puteți vedea din tabel, dacă există 10 df, doar 0,005 dintre eșantioanele prelevate dintr-o populație normală vor avea un scor t mai mare de +3,17. Deoarece distribuția este simetrică, 0,005 are, de asemenea, un scor t mai mic decât -3,17. Nouăzeci și nouă la sută din probe vor avea un scor t între ±3,17. Ca și exemplul din Figura 5.1, majoritatea tabelelor t au o imagine care arată ceea ce este în corpul tabelului. În Figura 5.1, zona umbrită este în coada dreaptă, corpul tabelului arată scorul t care lasă α în coada dreaptă. Acest tabel t listează, de asemenea, α cu două cozi deasupra celei cu o singură coadă, unde p = 0,xx. Pentru 5 df, există o probabilitate de 0,05 ca un eșantion să aibă un scor t mai mare de 2,02 și o probabilitate de 0,10 ca un eșantion să aibă un scor t > +2,02 sau < -2,02.

Există și alte statistici eșantion care urmează aceeași formă și pot fi folosite ca bază pentru diferite teste de ipoteză. Veți vedea distribuția t folosită pentru a testa trei tipuri diferite de ipoteze, și veți vedea că distribuția t poate fi folosită pentru a testa alte ipoteze.

Deși tabelele t arată modul în care distribuția de eșantionare a scorurilor t este modelată dacă populația inițială este normală, se dovedește că distribuția de eșantionare a scorurilor t este foarte apropiată de cea din tabel, chiar dacă populația inițială nu este chiar normală, iar majoritatea cercetătorilor nu se îngrijorează prea mult cu privire la normalitatea populației inițiale. Un fapt și mai important este că distribuția de eșantionare a scorurilor t este foarte apropiată de cea din tabel, chiar dacă populația inițială nu este foarte aproape de a fi normală atâta timp cât eșantioanele sunt mari. Aceasta înseamnă că puteți utiliza în siguranță distribuția t pentru a face inferențe atunci când nu sunteți sigur că populația este normală, atâta timp cât sunteți sigur că este în formă de clopot. De asemenea, puteți face inferențe bazate pe eșantioane de aproximativ 30 sau mai multe folosind distribuția t atunci când nu sunteți sigur dacă populația este normală. Nu numai că distribuția t descrie forma distribuțiilor unui număr de statistici eșantion, ci face o treabă bună în a descrie acele forme atunci când eșantioanele sunt extrase dintr-o gamă largă de populații, normale sau nu.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Introducere în Business Intelligence
Introducere în Business Intelligence

Colecția ȘTIINȚA INFORMAȚIEI ”Introducere în Business Intelligence” oferă cititorilor informații cuprinzătoare despre business intelligence, explorând toate aspectele importante ale inteligenței de afaceri în scenariul actual. Subiectele tratate se referă la abordările de bază ale business intelligence. Cartea își propune să … Citeşte mai mult

Nu a fost votat 13.99 lei22.45 lei Selectează opțiunile
Introducere în inteligența artificială
Introducere în inteligența artificială

Inteligența artificială s-a dezvoltat exploziv în ultimii ani, facilitând luarea deciziilor inteligente și automate în cadrul scenariilor de implementare. Inteligența artificială se referă la un ecosistem de modele și tehnologii pentru percepție, raționament, interacțiune și învățare.  Asistăm la o convergență … Citeşte mai mult

Nu a fost votat 13.99 lei23.72 lei Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat 18.66 lei37.38 lei Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.