Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Testarea proporțiilor populației în statistică

Testarea proporțiilor populației în statistică

Testarea proporțiilor populației poate fi folosită pentru a calcula o statistică la care există o distribuție de eșantionare cunoscută. Analizând, statistica z este:

z = (p – π)/√(π(1 – π)/n)

unde

p = proporția probei cu o anumită caracteristică

π = proporția populației cu acea caracteristică

√(π(1 – π)/n) = abaterea standard (eroarea) proporției populației cu acea caracteristică

Atâta timp cât cele două condiții tehnice ale π*n și (1-π)*n sunt menținute, aceste statistici-z ale eșantionului sunt distribuite normal, astfel încât, folosind linia de jos a tabelului-t, puteți găsi ce parte din toate eșantioanele dintr-o populație cu o anumită proporție a populației, π, au statistici-z în diferite intervale. Dacă te uiți la tabelul-z, poți vedea că 0,95 din toate eșantioanele din orice populație au statistici z între ±1,96, de exemplu.

Dacă aveți un eșantion despre care credeți că provine dintr-o populație care conține o anumită proporție, π, de membri cu o anumită caracteristică, puteți testa pentru a vedea dacă datele din eșantion susțin ceea ce credeți. Strategia de bază este aceeași cu cea explicată mai devreme în acest capitol: (a) scrieți două ipoteze, (b) găsiți o statistică eșantion și o distribuție de eșantionare care vă va permite să dezvoltați o regulă de decizie pentru a alege dintre cele două ipoteze și (c) calculați statistica eșantionului și alegeți ipoteza susținută de date.

Foothill Hosiery a primit recent o comandă de șosete pentru copii decorate cu petice brodate cu personaje din desene animate. Foothill nu avea mașinile potrivite pentru a coase peticele brodate și a contractat serviciile de cusut. Cât timp comanda a fost completată și Foothill a obținut profit din ea, prețul antreprenorului de cusut părea ridicat, iar Foothill a trebuit să mențină presiune asupra antreprenorului pentru a livra șosetele până la data convenită. CEO-ul Foothill, John McGrath, a explorat cumpărarea mașinilor necesare pentru a permite lui Foothill să coasă ei înșiși petice pe șosete. El a descoperit că, dacă mai mult de un sfert din șosetele pentru copii pe care le fac sunt comandate cu petice, mașina va fi o investiție solidă. John îi cere lui Kevin să afle dacă mai mult de 35% dintre șosetele pentru copii sunt vândute cu petice.

Kevin sună la marile organizații comerciale pentru industria de ciorapi, broderii și haine pentru copii și nimeni nu poate răspunde la întrebarea lui. Kevin decide că a venit timpul să ia o probă și să testeze pentru a vedea dacă mai mult de 35% dintre șosetele copiilor sunt decorate cu petice. El îl sună pe directorul de vânzări de la Foothill, iar ea acceptă să-și roage vânzătorii să se uite la vitrinele din magazine cu șosete pentru copii, numărând câte perechi sunt afișate și câte dintre acestea sunt decorate cu petice. Două săptămâni mai târziu, Kevin primește un memoriu de la directorul de vânzări, în care îi spune că din cele 2.483 de perechi de șosete pentru copii expuse în magazinele unde vânzătorii au numărat, 826 de perechi aveau petice brodate.

Kevin își scrie ipotezele, amintindu-și că Foothill va lua o decizie privind cheltuirea unei sume corespunzătoare de bani pe baza a ceea ce va găsi. Pentru a fi mai sigur că are dreptate dacă recomandă ca banii să fie cheltuiți, Kevin își scrie ipotezele astfel încât lumea neobișnuită să fie cea în care sunt împodobite peste 35 la sută din șosetele copiilor:

Ho: π sosete decorate < 0,35

Ha: π sosete decorate > 0,35

Când își scrie ipotezele, Kevin știe că, dacă eșantionul său are o proporție de șosete decorate cu mult sub 0,35, va dori să nu recomande cumpărarea utilajului. El vrea să spună doar că datele susțin alternativa dacă proporția eșantionului este mult peste 0,35. Pentru a include valorile scăzute în ipoteza nulă și doar valorile mari în alternativă, el folosește un test cu o singură coadă, judecând că datele susțin alternativa doar dacă scorul-z este în coada superioară. El va concluziona că utilajul ar trebui cumpărat numai dacă statistica lui z este prea mare pentru a fi provenit cu ușurință din distribuția de eșantionare extrasă dintr-o populație cu o proporție de 0,35. Kevin va accepta Ha numai dacă z-ul lui este mare și pozitiv.

Verificând linia de jos a tabelului-t, Kevin vede că 0,95 din toate scorurile-z asociate cu proporția sunt mai mici de -1,645. Prin urmare, regula sa este de a concluziona că datele eșantionului susțin ipoteza nulă conform căreia 35% sau mai puțin din șosetele pentru copii sunt decorate dacă eșantionul său (calculat) z este mai mic de -1,645. Dacă eșantionul său z este mai mare de -1,645, el va concluziona că mai mult de 35% dintre șosetele pentru copii sunt decorate și că Foothill Hosiery ar trebui să investească în mașinile necesare pentru a coase petice brodate pe șosete.

Folosind datele colectate de agenții de vânzări, Kevin găsește proporția din eșantion care este decorată:

π = 826/2483 = 0,333

Folosind această valoare, el calculează eșantionul său statistic-z:

z = (p – π)/√(π(1 – π)/n) = (0,333 – 0,35)/√(0,35(1 – 0,35)/2483) = -0,0173/0,0096 = -1,0811

Toate aceste calcule, împreună cu diagramele atât ale distribuției de eșantionare a lui π, cât și ale distribuțiilor normale standard asociate, sunt calculate de șablonul interactiv Excel din Figura 4.1.

Un element interactiv sau media a fost exclus din această versiune a textului. Îl puteți vizualiza online aici: https://www.telework.ro/wp-content/uploads/2021/12/Chapter-4_Fig-4.1_Testarea_ipotezelor.xlsx

Șablon Excel interactiv pentru testarea ipotezei Șablon Excel interactiv pentru testarea ipotezei – vezi Anexa 4.

Numerele colectate de Kevin, prezentate în celulele galbene din Figura 4.1., pot fi schimbate cu alte numere la alegere pentru a vedea cum decizia de afaceri poate fi schimbată în circumstanțe alternative.

Deoarece scorul-z ale eșantionului său (calculat)  este mai mare de -1,645, este puțin probabil ca a al eșantionului său să provină din distribuția de eșantionare a z-urilor extrase dintr-o populație în care π < 0,35, deci este puțin probabil ca eșantionul său să provină dintr-o populație cu π < 0,35. Kevin îi poate spune lui John McGrath că eșantionul colectat de agenții de vânzări susține concluzia că peste 35% dintre șosetele pentru copii sunt decorate cu petice brodate. John se poate simți confortabil luând decizia de a cumpăra mașini de broderie și de cusut.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Transformă-ți perspectiva asupra tehnologiei blockchain și începe să descoperi oportunitățile digitale de mâine!

Nu a fost votat $4.99$11.99 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Introducere în Business Intelligence
Introducere în Business Intelligence

O resursă esențială pentru toți cei interesați de analiza datelor și de optimizarea proceselor de afaceri.

Nu a fost votat $2.99$5.37 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Lucrul cu baze de date
Lucrul cu baze de date

Descoperă puterea bazelor de date cu acest ghid complet.

Nu a fost votat $3.99$7.99 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *