Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Distribuția F în statistică

Distribuția F în statistică

Cu ani în urmă, statisticienii au descoperit că atunci când perechi de eșantioane sunt prelevate dintr-o populație normală, rapoartele variațiilor eșantioanelor din fiecare pereche vor urma întotdeauna aceeași distribuție. În mod firesc, de-a lungul anilor care au trecut, statisticienii au descoperit că raportul dintre variațiile eșantionului colectat într-un număr de moduri diferite urmează aceeași distribuție, distribuția F. Deoarece știm că distribuțiile de eșantionare ale raportului de varianțe urmează o distribuție cunoscută, putem efectua teste de ipoteză folosind raportul de varianțe.

Statistica F este pur și simplu:

F = s12/s22

unde s12 este varianța eșantionului 1. Rețineți că varianța eșantionului este:

s2 = Σx – x)2/(n – 1)

Gândiți-vă la forma pe care o va avea distribuția F. Dacă s12 și s22 provin din eșantioane din aceeași populație, atunci dacă s-ar preleva mai multe perechi de eșantioane și s-ar calcula scorurile F, majoritatea acestor scoruri F ar fi aproape de unu. Toate scorurile F vor fi pozitive, deoarece variațiile sunt întotdeauna pozitive – numărătorul din formulă este suma pătratelor, deci va fi pozitiv, numitorul este dimensiunea eșantionului minus unu, care va fi de asemenea pozitiv. Analiza raporturilor necesită o oarecare grijă. Dacă s12 este mult mai mare decât s22, F poate fi destul de mare. Este la fel de posibil ca s22 să fie mult mai mare decât s12, iar atunci F ar fi foarte aproape de zero. Deoarece F trece de la zero la foarte mare, cu cele mai multe dintre valori în jurul valorii de unu, evident că nu este simetric; există o coadă lungă la dreapta și o coborâre abruptă până la zero în stânga.

Există două utilizări ale distribuției F. Prima este un test foarte simplu pentru a vedea dacă două eșantioane provin din populații cu aceeași varianță. A doua este analiza unidirecțională a varianței (ANOVA), care utilizează distribuția F pentru a testa dacă trei sau mai multe eșantioane provin din populații cu aceeași medie.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Transformă-ți perspectiva asupra tehnologiei blockchain și începe să descoperi oportunitățile digitale de mâine!

Nu a fost votat $4.99$11.99 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat $2.99$5.24 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *