Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Statistica: Estimarea proporției populației

Statistica: Estimarea proporției populației

Sunt multe situații când tu sau șeful tău veți dori să estimați proporția unei populații care are o anumită caracteristică. Cele mai cunoscute exemple sunt sondajele politice când se estimează proporția alegătorilor care ar vota pentru un anumit candidat. Acest lucru este puțin mai complicat decât estimarea unei medii a populației. Ar trebui să se facă numai cu mostre mari, iar ajustările ar trebui făcute în condiții diferite. Vom acoperi aici cel mai simplu caz, presupunând că populația este foarte mare, eșantionul este mare și că odată ce un membru al populației este ales să fie în eșantion, acesta este înlocuit astfel încât să poată fi ales din nou. Statisticienii au descoperit că, atunci când toate ipotezele sunt îndeplinite, există o statistică a eșantionului care urmează distribuția normală standard. Dacă sunt alese toate eșantioanele posibile de o anumită dimensiune și pentru fiecare eșantion se găsește proporția eșantionului cu o anumită caracteristică, p, atunci o statistică z poate fi calculată folosind formula:

z = (p – π)/√(p(1 – p)/n)

unde π = proporția populației cu caracteristica și va fi distribuită normal. Privind la linia de jos a tabelului-t, 0,90 dintre aceste z-uri vor fi între ±1,645, 0,99 vor fi între ±2,326, etc.

Deoarece statisticienii știu că scorurile-z găsite din eșantioane vor fi distribuite normal, puteți face o estimare pe intervale a proporției populației cu caracteristica. Acest lucru este simplu de făcut, iar metoda este paralelă cu cea folosită pentru a face o estimare pe intervale a mediei populației:

  1. alegeți eșantionul,
  2. găsiți eșantionul p,
  3. presupuneți că eșantionul dvs. are un scor-z care nu se află în cozile distribuției de eșantionare,
  4. folosind eșantionul p ca estimare a populației π în numitor și valori tabelului-z pentru nivelul de încredere dorit, rezolvați de două ori pentru a găsi limitele intervalului care credeți că conține proporția populației p.

La Delta Beer Company, directorul de resurse umane i-a cerut și lui Ann Howard să se uite la vârsta angajării la fabrică. Ann adoptă o abordare diferită de Kevin și decide să investigheze ce proporție de angajați noi aveau cel puțin 35 ani la angajare. Ea se uită la evidențele de personal și, la fel ca și Kevin, decide să facă o inferență dintr-un eșantion după ce a descoperit că peste 2.500 de oameni diferiți au lucrat la această companie la un moment dat în ultimii 15 ani. Ea alege 100 de dosare de personal, înlocuind fiecare dosar după ce a înregistrat vârsta persoanei la angajare. Ea găsește 17 care aveau 35 de ani sau mai mult de când au lucrat pentru prima dată la Delta Beer Company. Ea decide să facă inferența cu încredere de 0,95, iar din ultima linie a tabelului-t constată că 0,95 din scorurile-z se află între ±1,96. Ea găsește limitele superioare și inferioare:

+1,96 = (0,17 – π)/√(0,17(1 – 0,17)/100)

π = 0,17 – (0,038)(1,96) = 0,095

și găsește cealaltă limită:

-1,96 = (0,17 – π)/√(0,17(1 – 0,17)/100)

π = 0,17 – (0,038)(-1,96) = 0,245

Ea concluzionează că, cu o încredere de 0,95 proporția persoanelor care au lucrat la Delta Beer Company și care aveau peste 35 de ani la angajare este între 0,095 și 0,245. Acesta este un interval destul de larg. Privind ecuația pentru construirea intervalului, ar trebui să puteți vedea că o dimensiune mai mare a eșantionului va avea ca rezultat un interval mai restrâns, așa cum am făcut atunci când am estimat media populației.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *