Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Testele t în statistică – Concluzii

Testele t în statistică – Concluzii

Un al treilea test t: aceste eșantioane (pereche) provin din populația eșantionului?

Managerii sunt adesea interesați de înainte și după întrebări. În calitate de manager sau cercetător, veți dori adesea să vă uitați la studii longitudinale, studii care întreabă despre ce s-a întâmplat cu o persoană ca urmare a unui tratament sau de-a lungul timpului. Sunt diferite după aceea decât au fost înainte? De exemplu, dacă firma dumneavoastră a desfășurat un program de formare, veți dori să știți dacă lucrătorii care au participat au devenit mai productivi. Dacă zona de lucru a fost reamenajată, lucrătorii produc mai mult decât înainte? Deși puteți utiliza testul de diferență de mijloace dezvoltat mai devreme, aceasta este o situație diferită. Mai devreme, ați avut două mostre care au fost alese independent una de cealaltă; este posibil să aveți un eșantion de lucrători care au primit instruire și un eșantion de lucrători care nu au primit-o. Situația pentru acest test este diferită; acum aveți un eșantion de muncitori, iar pentru fiecare muncitor, le-ați măsurat productivitatea înainte de pregătirea sau reamenajarea spațiului de lucru și ați măsurat productivitatea după. Pentru fiecare muncitor aveți o pereche de măsuri, înainte și după. Un alt mod de a privi acest lucru este că pentru fiecare membru al eșantionului aveți o diferență între înainte și după.

Puteți testa pentru a vedea dacă aceste diferențe sunt egale cu zero sau orice altă valoare, deoarece o statistică bazată pe aceste diferențe urmează distribuția t pentru n-1 df atunci când aveți n perechi potrivite. Acea statistică este:

t = (D – δ)/sD/√n

unde

D = media diferenţelor dintre perechile din eşantion
δ = media diferențelor perechilor din populație
sD = abaterea standard a diferențelor din eșantion
n = numărul de perechi din eșantion

Este o idee bună să vă faceți timp un minut ca să înțelegeți această formulă. Există eșantioane perechi, iar diferențele dintre acele perechi, D-urile, sunt de fapt o populație. Media acelor D este δ. Orice probă de perechi va produce, de asemenea, un eșantion de D. Dacă acele D sunt distribuite în mod normal, atunci statistica t din formula de mai sus va urma distribuția t. Dacă vă gândiți la D ca fiind aceleași cu x din formula t de la începutul capitolului și vă gândiți la δ ca medie a populației, ar trebui să realizați că această formulă este de fapt doar acea formulă t de bază.

Lew Podolsky este manager de divizie pentru Dairyland Lighting, un producător de lumini de exterior pentru parcări, curți și terenuri de joacă. Dairyland Lighting își organizează activitatea de producție pe echipe. Mărimea echipei variază oarecum în funcție de produsul care este asamblat, dar de obicei sunt trei până la șase într-o echipă, iar o echipă stă de obicei împreună câteva săptămâni pentru a asambla același produs. Dairyland Lighting are două fabrici noi: una în Oshawa, Ontario și alta în Osoyoos, Columbia Britanică, care deservește clienții lor de pe coasta de vest a Canadei. Lew a observat că productivitatea pare să fie mai mică în Osoyoos în timpul verii, o problemă care nu apare la fabrica lor din Oshawa. După ce a vizitat uzina Osoyoos în iulie, august și noiembrie și a vorbit cu muncitorii în timpul fiecărei vizite, Lew bănuiește că uzina fără aer condiționat devine prea fierbinte pentru o productivitate bună. Din păcate, este dificil să compari direct productivitatea la nivel de fabrică în diferite perioade ale anului, deoarece există o variație destul de mare în numărul de angajați și mixul de produse de-a lungul anului. Lew decide să vadă dacă aceiași muncitori care lucrează la aceleași produse sunt mai productivi în zilele răcoroase decât în ​​zilele caniculare, cerându-i managerului local, Dave Mueller, să găsească o zi răcoroasă și o zi fierbinte din toamna precedentă și să aleagă zece echipe de lucru care au asamblat aceleași produse în cele două zile. Dave îi trimite lui Lew datele găsite în Tabelul 5.4.

Tabelul 5.4 Datele lui Lew Podolsky pentru decizia privind aerul condiționat

Lider de echipă Rezultat – zi rece Rezultat – zi fierbinte Diferența (rece-fierbinte)
14 noiembrie 20 iulie
Martinez 153 149 4
McAlan 167 170 -3
Wilson 164 155 9
Burningtree 183 179 4
Sanchez 177 167 10
Lilly 162 150 12
Cantu 165 158 7

Lew decide că, dacă datele susțin productivitatea fiind mai mare în zilele răcoroase, va apela la un antreprenor de încălzire/aer condiționat pentru a obține niște estimări de costuri, astfel încât să poată decide dacă instalarea aerului condiționat în uzina Osoyoos este rentabilă. Observați că are date de perechi potrivite – pentru fiecare echipă are producție pe 14 noiembrie, o zi rece și pe 20 iulie, o zi fierbinte. Ipotezele lui sunt:

H0: δ ≤ 0 și Ha:  δ > 0

Folosind α = 0,05 în acest test cu o singură coadă, Lew va decide să cheme inginerul dacă scorul t al eșantionului este mai mare de 1,943, deoarece există 6 df. Folosind șablonul interactiv Excel din Figura 5.2, Lew găsește:

D = 6,1428

sD = 5,0142

și scorul t al eșantionul său este

t = (D – δ)/sD/√n = (6,14 – 0)/5,01/√7

și

t = 6,14/1,89 = 3,24

Un element interactiv sau media a fost exclus din această versiune a textului. Îl puteți vizualiza online aici: https://www.telework.ro/wp-content/uploads/2022/01/Chapter-5_Fig-5.2_Esantion_pereche.xlsx

Șablon Excel interactiv pentru testul t pereche(Șablon Excel interactiv pentru testul t pereche – vezi Anexa 5.)

Toate aceste calcule pot fi făcute și în șablonul interactiv Excel din Figura 5.2. Puteți adăuga cele două coloane de date pentru zilele reci și călduroase și puteți seta nivelul α. Distribuția t asociată se va ajusta automat în funcție de datele dvs. și de nivelul selectat de α. De asemenea, puteți vedea valoarea p în albastru închis și α selectat în zonele umbrite în roșu de pe acest grafic. Deoarece scorul său t al eșantionului este mai mare de 1,943 sau valoarea p este mai mică decât alfa, Lew scoate agenda telefonică și caută sub contractori de aer condiționat pentru a cere niște estimări.

Concluzii

Testele t sunt teste de ipoteză utilizate în mod obișnuit. Cercetătorii se găsesc adesea în situații în care trebuie să testeze pentru a vedea dacă un eșantion provine dintr-o anumită populație și, prin urmare, testează pentru a vedea dacă eșantionul provine probabil dintr-o populație cu acea anumită medie. Chiar mai des, cercetătorii se vor găsi cu două eșantioane și vor să știe dacă eșantioanele provin din aceeași populație și vor testa pentru a vedea dacă eșantioanele provin probabil de la populații cu aceeași medie. De asemenea, cercetătorii se trezesc frecvent întrebându-se dacă două seturi de eșantioane pereche au medii egale. În orice caz, strategia de bază este aceeași ca pentru orice test de ipoteză. Mai întâi, traduceți întrebarea în ipoteze nule și alternative, asigurându-vă că ipoteza nulă include un semn egal. În al doilea rând, alegeți α. În al treilea rând, calculați statisticile relevante, aici scorul t, din eșantion sau mostre. În al patrulea rând, folosind tabelele, decideți dacă statistica eșantionului vă conduce la concluzia că eșantionul provine dintr-o populație în care ipoteza nulă este adevărată sau dintr-o populație în care alternativa este adevărată.

Distribuția t este folosită și în testarea ipotezelor în alte situații, deoarece există alte distribuții de eșantionare cu aceeași formă a distribuției t. Deci, amintiți-vă cum să utilizați tabelele t pentru alte situații.

Statisticienii au descoperit, de asemenea, cum să testeze pentru a vedea dacă trei sau mai multe eșantioane provin din populații cu aceeași medie. Această tehnică este cunoscută ca analiză unidirecțională a varianței. Abordarea utilizată în analiza varianței este destul de diferită de cea utilizată în testul t.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor

Informația, ca și concept, include o mare diversitate de sensuri în contexte diferite, de la cele zilnice până la cele tehnice. Conceptul de informație este strâns legat de noțiunile de restricție, comunicare, control, date, forme, educație, cunoaștere, înțelegere, stimul mental, … Citeşte mai mult

Nu a fost votat $3,99$9,61 Selectează opțiunile
Inteligența competitivă - Concept - Studii
Inteligența competitivă – Concept – Studii

Trăim într-o lume condusă de hiper-concurență, în care oferta de afaceri depășește cererea. Pentru ca o organizație să supraviețuiască într-un mediu atât de agresiv competitiv, este necesară o mai bună înțelegere a concurenței și a forțelor concurente care îi afectează … Citeşte mai mult

Nu a fost votat $1,99 Selectează opțiunile
Ghidul Google SEO
Ghidul Google SEO

Ghidul de iniţiere Google privind optimizarea pentru motoarele de căutare, Versiunea 1.1, 13 noiembrie 2008 Acest document a fost lansat iniţial ca un efort pentru a ajuta echipele Google, însă este la fel de util şi pentru webmasterii începători în … Citeşte mai mult

Nu a fost votat $0,00 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *