Home » Articole » Articole » Societate » Societatea Informaţională » Informaţii » Obținerea de informații din statistici

Obținerea de informații din statistici

Densitatea de probabilitate (Densitatea de probabilitate crește cu cât ne apropiem de valoarea așteptată (medie) într-o distribuție normală. Sunt prezentate statisticile utilizate în evaluarea de testare standardizată. Scalele includ abateri standard, procentajele cumulative, echivalenți percentili, scorurile Z, scorurile T, nouarii standard, și procentaje în nouarii standard.)

Statistica este studiul colectării, analizei, interpretării, prezentării și organizării datelor. În folosirea statisticilor pentru, de exemplu, a rezolva o problemă științifică, industrială sau socială, este convențional să se înceapă cu o populație statistică sau un proces de model statistic care urmează să fie studiat. Populațiile pot fi diverse subiecte, cum ar fi “toți oamenii care trăiesc într-o țară” sau “fiecare atom care compune un cristal”. Statistica se ocupă cu toate aspectele legate de date, inclusiv planificarea colectării de date în ceea ce privește proiectarea de sondaje și experimente.

Câteva definiții populare:

  • Dicționarul Merriam-Webster definește statisticile drept “fapte clasificate care reprezintă condițiile unei persoane aflată într-o stare – în special faptele care pot fi menționate în numere sau orice alt aranjament de tabele sau clasificat”.
  • Statisticianul Sir Arthur Lyon Bowley definește ca statisticile ca fiind “declarațiile numerice ale faptelor în orice compartiment de investigare puse în relație unul cu altul”.

Atunci când datele recensământului nu pot fi colectate, statisticienii colectează date prin dezvoltarea de modele experimentale și eșantioane de sondaje specifice. Prelevarea de eșantioane reprezentative asigură că deducțiile și concluziile se pot extinde în condiții de siguranță din eșantion la populația în ansamblu. Un studiu experimental presupune efectuarea de măsurători ale sistemului în studiu, manipularea sistemului, și apoi măsurători suplimentare, folosind aceeași procedură pentru a determina dacă manipularea a modificat valorile măsurătorilor. În contrast, un studiu observațional nu implică manipularea experimentală.

Două metodologii statistice principale sunt utilizate în analiza datelor: statistici descriptive, care sintetizează datele dintr-un eșantion folosind indici, cum ar fi media sau abaterea standard, și statistici inferențiale, care trag concluzii din datele care sunt supuse unor variații aleatorii (de exemplu, erori de observație, variație de eșantionare). Statisticile descriptive au în vedere cel mai adesea două seturi de proprietăți ale unei distribuții (eșantion sau populație): tendința centrală (sau localizare) urmărește să caracterizeze o valoare centrală sau tipică distribuției, în timp ce dispersia (sau variabilitatea) caracterizează măsura în care membrii distribuției se îndepărteze de centrul său și între ei. Statisticile inferențiale sau matematice sunt efectuate în cadrul teoriei probabilității, care se ocupă cu analiza fenomenelor aleatoare.

O procedură standard statistică implică testul relației dintre cele două seturi de date statistice, sau un set de date și o serie de date sintetice extrase din modelul idealizat. O ipoteză este propusă pentru relația statistică între cele două seturi de date, iar acest lucru este comparat ca o alternativă la o ipoteza nulă idealizată a niciunei relații între două seturi de date. Respingerea sau demonstrarea falsității ipotezei nule se face cu ajutorul testelor statistice, care cuantifică sensul în care nulul poate fi dovedit fals, având în vedere datele care sunt utilizate în test. Pornind de la o ipoteză nulă, cele două forme de bază ale erorii sunt recunoscute: Tipul I de erori (ipoteza nulă este fals respinsă rezultând un “fals pozitiv”) și Tipul II de erori (ipoteza nulă nu este respinsă și o diferență reală între populații este omisă rezultând un “fals negativ”). Probleme multiple au ajuns să fie asociate cu acest cadru: variind de la obținerea unei mărimi suficiente a eșantionului la specificarea unei ipoteze nule adecvată.

Procesele de măsurare care generează date statistice sunt, de asemenea, supuse erorii. Multe dintre aceste erori sunt clasificate ca aleatoare (zgomot) sau sistematice (bias), dar și alte tipuri de erori (de exemplu, gafa, ca de ex. atunci când un analist raportează unități incorecte) pot fi, de asemenea, importante.Lipsa datelor și/sau restricționarea poate avea ca rezultat estimări subiective, astfel încât au fost dezvoltate tehnici specifice pentru a aborda aceste probleme.

Statisticile se poate spune că au început în civilizația antică, mergând înapoi cel puțin până în secolul al 5-lea î.e.n., dar abia în secolul al 18-lea a început să fie folosite mai mult în calcule și teoria probabilității. Statistice este în continuare un domeniu de cercetare activă, de exemplu în problema modului de a analiză a datekor masive (Big Data).

Graficele de dispersiune(Graficele de dispersiune sunt utilizate în statisticile descriptive pentru a arăta relațiile observate între diferitele variabile)

Domeniu

Statistica este un domeniu matematic, care se ocupă cu colectarea, analiza, interpretarea sau explicația și prezentarea datelor, sau considerat o ramură a matematicii. Unii considera statisticile ca fiind o știință matematică distinctă, mai degrabă decât o ramură a matematicii. În timp ce multe investigații științifice utilizează date, statistica este preocupată de utilizarea datelor în contextul incertitudinii și de luare a deciziilor în condiții de incertitudine.

Statistica matematică

Statistica matematică constă în aplicarea matematică a statisticilor, care inițial a fost concepută ca știința statului – colectarea și analizarea datelor cu privire la o țară: economia, terenuri, armata, populație, și așa mai departe. Tehnicile matematice folosite pentru aceasta includ analiza matematica, algebra liniară, analiza stocastică, ecuații diferențiale și teoria probabilității.

Prezentare generală

În aplicarea statisticilor la o problemă, este o practică comună să se înceapă cu o populație sau un proces care urmează să fie studiate. Populațiile pot fi diverse subiecte, cum ar fi “toate persoanele care locuiesc într-o țară” sau “fiecare atom care compune un cristal”.

În mod ideal, statisticienii compilează date despre întreaga populație (o operație numită recensământ). Acest lucru poate fi organizat de către institutele de statistică guvernamentale. Statisticile descriptive pot fi folosite pentru a rezuma datele populației. Descriptori numerici includ deviația medie și standard pentru tipurile de date continui (cum ar fi veniturile), în timp ce frecvența și procentajul sunt mai utile în ceea ce privește descrierea datelor de categorisire (cum ar fi rasa).

Atunci când un recensământ nu este fezabil, este studiat un subset ales din populație numită eșantion. Odată ce este determinat un eșantion al populației care este reprezentativ, datele sunt colectate pentru membrii eșantionului într-un cadru observațional sau experimental. Din nou, statisticile descriptive pot fi folosite pentru a rezuma datele din eșantion. Cu toate acestea, eșantionul a fost supus unui element aleatoriu, prin urmare descriptorii numerici stabiliți din eșantion sunt, de asemenea, determinați de incertitudine. Pentru a trage concluzii în continuare semnificative cu privire la întreaga populație, este nevoie de statistici inferențiale. Acesta folosește modele în datele de probă pentru a trage concluzii cu privire la populația reprezentată, pe baza sistemului aleatoriu. Aceste concluzii pot lua forma de: răspuns da/nu la întrebări cu privire la date (testarea ipotezelor), estimarea caracteristicilor numerice ale datelor (estimare), descrierea asocierilor din cadrul datelor (corelație) și a relațiilor de modelare în cadrul datelor (de exemplu, utilizând analiza de regresie). Inferența se poate extinde la prognoză, predicție și estimarea valorilor neobservabile, fie în sau asociate cu populația studiată; aceasta poate include o extrapolare și interpolare a seriilor de timp sau de date spațiale, și pot include, de asemenea, mineritul datelor.

Save

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *