Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Distribuția F în statistică

Distribuția F în statistică

Cu ani în urmă, statisticienii au descoperit că atunci când perechi de eșantioane sunt prelevate dintr-o populație normală, rapoartele variațiilor eșantioanelor din fiecare pereche vor urma întotdeauna aceeași distribuție. În mod firesc, de-a lungul anilor care au trecut, statisticienii au descoperit că raportul dintre variațiile eșantionului colectat într-un număr de moduri diferite urmează aceeași distribuție, distribuția F. Deoarece știm că distribuțiile de eșantionare ale raportului de varianțe urmează o distribuție cunoscută, putem efectua teste de ipoteză folosind raportul de varianțe.

Statistica F este pur și simplu:

F = s12/s22

unde s12 este varianța eșantionului 1. Rețineți că varianța eșantionului este:

s2 = Σx – x)2/(n – 1)

Gândiți-vă la forma pe care o va avea distribuția F. Dacă s12 și s22 provin din eșantioane din aceeași populație, atunci dacă s-ar preleva mai multe perechi de eșantioane și s-ar calcula scorurile F, majoritatea acestor scoruri F ar fi aproape de unu. Toate scorurile F vor fi pozitive, deoarece variațiile sunt întotdeauna pozitive – numărătorul din formulă este suma pătratelor, deci va fi pozitiv, numitorul este dimensiunea eșantionului minus unu, care va fi de asemenea pozitiv. Analiza raporturilor necesită o oarecare grijă. Dacă s12 este mult mai mare decât s22, F poate fi destul de mare. Este la fel de posibil ca s22 să fie mult mai mare decât s12, iar atunci F ar fi foarte aproape de zero. Deoarece F trece de la zero la foarte mare, cu cele mai multe dintre valori în jurul valorii de unu, evident că nu este simetric; există o coadă lungă la dreapta și o coborâre abruptă până la zero în stânga.

Există două utilizări ale distribuției F. Prima este un test foarte simplu pentru a vedea dacă două eșantioane provin din populații cu aceeași varianță. A doua este analiza unidirecțională a varianței (ANOVA), care utilizează distribuția F pentru a testa dacă trei sau mai multe eșantioane provin din populații cu aceeași medie.

Sursa: Mohammad Mahbobi and Thomas K. Tiemann, Introductory Business Statistics with Interactive Spreadsheets – 1st Canadian Edition, © 2015 Mohammad Mahbobi, licența CC BY 4.0

© 2021 MultiMedia Publishing, Statistica pentru afaceri. Traducere și adaptare: Nicolae Sfetcu

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat $2,99$11,99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.