Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Distribuții normale în statistică

Distribuții normale în statistică

Distribuțiile normale sunt în formă de clopot și simetrice. Media, mediana și modul sunt egale. Majoritatea membrilor unei populații distribuite normal au valori apropiate de medie – într-o populație normală 96% dintre membri (mult mai bine decât cei 75% din Chebyshev) se află la 2σ din medie.

Statisticienii au descoperit că multe lucruri sunt distribuite normal. În natură, greutățile, lungimile și grosimile tuturor tipurilor de plante și animale sunt distribuite normal. În fabricație, diametrul, greutatea, rezistența și multe alte caracteristici ale articolelor fabricate de oameni sau de mașini sunt distribuite normal. În performanța umană, scorurile la testele obiective, rezultatele multor exerciții atletice și mediile punctuale ale elevilor sunt distribuite normal. Distribuția normală este într-adevăr un eveniment normal.

Dacă sunteți sceptic, vă întrebați cum pot notele școlare și diametrul exact al găurilor forate de o anumită mașină să aibă aceeași distribuție – nici măcar nu sunt măsurate cu aceleași unități. Pentru a vedea că atâtea lucruri au aceeași formă normală, toate trebuie măsurate în aceleași unități (sau eliminarea unităților) – toate trebuie standardizate. Statisticienii standardizează multe măsuri utilizând abaterea standard. Toate distribuțiile normale au aceeași formă, deoarece toate au aceeași distribuție relativă a frecvenței atunci când valorile pentru membrii lor sunt măsurate în abateri standard peste sau sub medie.

Folosind sistemul obișnuit de măsurare, dacă greutatea câinilor este distribuită în mod normal cu o medie de 10,8 kilograme și o abatere standard de 2,3 kilograme, iar vânzările zilnice la o cafenea sunt distribuite în mod normal cu μ = 341,46 $ și σ = 53,21 USD, atunci aceeași proporție de câini cântărește între 8,5 kilograme (μ – 1σ) și 10,8 kilograme (μ) ca proporția vânzărilor zilnice de la cafenea care se situează între μ – 1σ (288,25 USD) și μ (341,46 USD). Orice populație distribuită normal va avea aceeași proporție a membrilor săi între medie și o abatere standard sub medie. Conversia valorilor membrilor unei populații normale astfel încât fiecare să fie acum exprimată în termeni de abateri standard de la medie face ca populațiile să fie la fel. Acest proces este cunoscut sub numele de standardizare și face ca toate populațiile normale să aibă aceeași locație și formă.

Acest proces de standardizare se realizează calculând un scor z pentru fiecare membru al populației normale. Scorul z este găsit de:

z = (x – μ) / σ

Aceasta convertește valoarea inițială, în unitățile sale originale, într-o valoare standardizată în unități de abateri standard de la medie. Uitați-vă la formulă. Numărătorul este pur și simplu diferența dintre valoarea acestui membru al populației x și media populației μ. Poate fi măsurată în centimetri sau în puncte sau orice altceva. Numitorul este abaterea standard a populației, σ, și este, de asemenea, măsurată în centimetri, sau puncte, sau orice altceva. Dacă numărătorul este de 15 cm și abaterea standard este de 10 cm, atunci z va fi de 1,5. Acest membru special al populației, unul cu un diametru de 15 cm mai mare decât diametrul mediu al populației, are o valoare z de 1,5, deoarece valoarea sa este de 1,5 abateri standard mai mari decât media. Deoarece media lui x este μ, media scorurilor z este zero.

Am putea converti valoarea fiecărui membru al oricărei populații normale într-un scor z. Dacă am face asta pentru orice populație normală și am aranja aceste scoruri z într-o distribuție relativă a frecvenței, toate ar fi la fel. Fiecare dintre aceste distribuții normale standardizate ar avea o medie de zero și aceeași formă. Există multe tabele care arată ce proporție din orice populație normală va avea un scor z mai mic decât o anumită valoare. Deoarece distribuția normală standard este simetrică cu o medie de zero, aceeași proporție a populației care este mai mică decât un z pozitiv este, de asemenea, mai mare decât același z negativ. Unele valori dintr-un tabel normal standard apar în Tabelul 2.1

Tabelul 2.1 Tabelul normal standard

Proporția mai jos .75 .90 .95 .975 .99 .995
Scor z .674 1.282 1.645 1,960 2.326 2,576

De asemenea, puteți utiliza distribuțiile normale standard cumulative interactive ilustrate în șablonul Excel din Figura 2.1. Graficul din partea de sus calculează valoarea z dacă este introdusă orice valoare de probabilitate în celula galbenă. Graficul din partea de jos calculează probabilitatea z pentru orice valoare z dată în celula galbenă. În ambele cazuri, graficul distribuției normale standard corespunzătoare va fi prezentat cu probabilitățile cumulative în galben sau violet.

Un element interactiv sau media a fost exclus din această versiune a textului. O puteți vizualiza online aici: https://1drv.ms/x/s!AvIi7aFiO3JoiEEOrVPBQTSNdhQC?e=FE63jy

Șablon interactiv Excel pentru distribuții normale standard cumulative (Figura 2.1 Șablon interactiv Excel pentru distribuții normale standard cumulative – vezi Anexa 2.)

Directorul de producție al unei companii de bere din Delta, BC, l-a întrebat pe unul dintre tehnicienii săi, Kevin: „Cât cântărește de obicei un pachet de 24 de sticle de bere?” Kevin îi întreabă pe cei aflați ls controlul calității ce știu despre greutatea acestor pachete și i se spune că greutatea medie este de 16,32 kilograme cu o abatere standard de 0,87 kilograme. Kevin decide că managerul de producție își dorește probabil mai mult decât greutatea medie și decide să-i ofere șefului său gama de greutăți în care se încadrează 95% din pachetele de 24 de sticle de bere. Kevin vede că lăsând 2,5% (0,025) în coada stângă și 2,5% (0,025) în coada dreaptă vor 95% (0,95) în mijloc. El presupune că greutățile ambalajelor sunt distribuite în mod normal, o presupunere rezonabilă pentru un produs fabricat de mașini, și consultând un tabel normal standard vede că 0,975 dintre membrii oricărei populații normale au un scor z mai mic de 1,96 și că 0,975 au un scor z mai mare de -1,96, deci 0,95 au un scor z între ±1,96.

Acum, că știe că 95% din cele 24 de pachete de sticle de bere vor avea o greutate cu un scor z între ±1,96, Kevin le poate traduce. Rezolvând ecuația pentru +1.96 și -1.96, el va găsi limitele intervalului în care se încadrează 95% din greutățile pachetelor:

1,96 = (x – 36,32) / 0,87

Rezolvând pentru x, Kevin constată că limita superioară este de 18,03 kilograme. Apoi rezolvă pentru z = -1.96:

-1,96 = (x – 36,32) / 0,87

El constată că limita inferioară este de 14,61 kilograme. Acum poate merge la managerul său și să-i spună: „95% din pachetele de 24 de sticle de bere cântăresc între 14,61 și 18,03 kilograme”.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Ghidul Google SEO
Ghidul Google SEO

Ghidul de iniţiere Google privind optimizarea pentru motoarele de căutare, Versiunea 1.1, 13 noiembrie 2008 Acest document a fost lansat iniţial ca un efort pentru a ajuta echipele Google, însă este la fel de util şi pentru webmasterii începători în … Citeşte mai mult

Nu a fost votat $0,00 Selectează opțiunile
PowerPoint - Ghid pentru începători
PowerPoint – Ghid pentru începători

PowerPoint este un instrument excelent pentru prezentări de orice fel, fie în clasă, fie în cadrul unei conferințe. O prezentare PowerPoint este formată dintr-o serie de diapozitive care pot fi proiectate (afișate electronic) sau tipărite într-o varietate de formate de … Citeşte mai mult

Nu a fost votat $0,00 Selectează opțiunile
Ghid marketing pe Internet
Ghid marketing pe Internet

Autor: Nicolae Sfetcu (Ediţia a doua, Revizia 2) Unul din cele mai vechi ghiduri pentru marketing pe Internet în limba română, dar şi unul din cele mai concise şi mai practice ghiduri. Deşi au trecut mulţi ani de la scrierea … Citeşte mai mult

Nu a fost votat $0,00$1,99 Selectează opțiunile

Faci un comentariu sau dai un răspuns?

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *