Statistica este un subiect divers și, prin urmare, matematica necesară depinde de tipul de statistici pe care le studiem. O bază puternică din algebra liniară este necesară pentru majoritatea statisticilor multivariate, dar nu este necesară pentru statisticile introductive. O bază în calcul este utilă indiferent de ramura statisticii care este studiată.
Cel care studiază ar trebui să cunoască minimum conceptele de bază predate în algebră și să se simtă confortabil cu lucrul cu aceste concepte și rezolvarea unei necunoscute. Majoritatea statisticilor de aici vor proveni din câteva noțiuni de bază care ar trebui să se cunoască.
Valoarea absolută
| x | ≡ x , x ≥ 0
| x | ≡ − x , x < 0
Dacă numărul este zero sau pozitiv, atunci valoarea absolută a numărului este pur și simplu același număr. Dacă numărul este negativ, atunci introduceți semnul minus pentru a obține valoarea absolută.
Exemple
- | 42 | = 42
- | -5 | = 5
- | 2,21 | = 2,21
Factoriale
Un factorial este un calcul care se folosește mult în probabilitate. Este definit doar pentru numere întregi mai mari decât sau egale cu zero ca:
Exemple
Pe scurt, aceasta înseamnă că:
0! = | 1 | = 1 |
1! = | 1 · 1 | = 1 |
2! = | 2 · 1 | = 2 |
3! = | 3 · 2 · 1 | = 6 |
4! = | 4 · 3 · 2 · 1 | = 24 |
5! = | 5 · 4 · 3 · 2 · 1 | = 120 |
6! = | 6 · 5 · 4 · 3 · 2 · 1 | = 720 |
Suma
Suma (cunoscută și sub numele de serie) este utilizată mai mult decât aproape orice altă tehnică în statistici. Este o metodă de reprezentare a adunării peste multe valori fără a pune + după +. Reprezentăm însumarea folosind o sigma mare cu majuscule: ∑.
Exemple
Foarte des în statistici vom rezuma o listă de variabile conexe:
∑i=0n xi = x0 + x1 + x2 + ⋯ + xn
Aici adunăm toate variabilele x (sperând că toate vor avea valori când vom calcula acest lucru). Expresia de sub ∑ (i = 0, în acest caz) reprezintă variabila index și care este valoarea ei inițială (i cu o valoare de pornire 0) în timp ce numărul de deasupra lui ∑ reprezintă numărul până la care variabila va crește (pas cu pas de 1, deci i = 0, 1, 2, 3 și apoi 4). Alt exemplu:
∑i=14 2i = 2(1) + 2(2) + 2(3) + 2(4) = 2 + 4 + 6 + 8 = 20
Observați că am obține aceeași valoare mutând cifrele 2 în afara însumării (efectuați suma și apoi înmulțiți cu 2, mai degrabă decât să înmulțiți fiecare componentă a însumării cu 2).
Seria infinită
Desigur, nu există niciun motiv pentru care o serie trebuie să se bazeze pe orice valoare determinată sau chiar finită – poate continua fără sfârșit. Aceste serii sunt numite „serii infinite” și uneori pot converge chiar la o valoare finită, devenind în cele din urmă egale cu acea valoare pe măsură ce numărul de elemente din serie se apropie de infinit (∞).
Exemple
∑k=0∞ rk = 1/(1 – r), | r | < 1
Acest exemplu este celebra serie geometrică. Rețineți că seria merge la ∞ (infinit, ceea ce înseamnă că nu se oprește) și că este valabilă doar pentru anumite valori ale variabilei r. Aceasta înseamnă că, dacă r este între valorile -1 și 1 (-1 < r <1), atunci sumarea se va apropia de (adică va converge către) 1/(1-r) cu cât duceți seria mai departe.
Aproximarea liniară
Distribuția Student-t la diferite valori critice cu diferite grade de libertate. | |||||||
v / α | 0.20 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 | |
40 | 0.85070 | 1.30308 | 1.68385 | 2.02108 | 2.42326 | 2.70446 | |
50 | 0.84887 | 1.29871 | 1.67591 | 2.00856 | 2.40327 | 2.67779 | |
60 | 0.84765 | 1.29582 | 1.67065 | 2.00030 | 2.39012 | 2.66028 | |
70 | 0.84679 | 1.29376 | 1.66691 | 1.99444 | 2.38081 | 2.64790 | |
80 | 0.84614 | 1.29222 | 1.66412 | 1.99006 | 2.37387 | 2.63869 | |
90 | 0.84563 | 1.29103 | 1.66196 | 1.98667 | 2.36850 | 2.63157 | |
100 | 0.84523 | 1.29007 | 1.66023 | 1.98397 | 2.36422 | 2.62589 |
Să spunem că vă uitați la un tabel de valori, cum ar fi cel de mai sus. Doriți să aproximați (obțineți o estimare bună) a valorilor la 63, dar nu aveți aceste valori pe tabel. O soluție bună aici este să folosiți o aproximare liniară pentru a obține o valoare care este probabil apropiată de cea pe care o doriți cu adevărat, fără a fi nevoie să treceți peste toate problemele de calcul ale pasului suplimentar din tabel.
f(xi) ≈ (f(x⌈i⌉) − f(x⌊i⌋))/(x⌈i⌉ − x⌊i⌋) ⋅ (xi − x⌊i⌋) + f(x⌊i⌋)
Aceasta este doar ecuația pentru o linie aplicată tabelului de date. xi reprezintă punctul de date despre care doriți să știți, x⌊i⌋ este punctul de date cunoscut sub cel despre care doriți să știți, și x⌈i⌉ este punctul de date cunoscut deasupra celui pe care doriți să îl cunoașteți.
Exemple
Găsiți valoarea 63 pentru coloana 0,05, utilizând valorile din tabelul de mai sus.
Mai întâi confirmăm pe tabelul de mai sus că trebuie să aproximăm valoarea. Dacă o știm exact, atunci nu este nevoie să o aproximăm. În starea actuală, aceasta se va găsi pe tabel undeva între 60 și 70. Orice altceva putem obține de la tabel:
f(63) ≈ (f(70) − f(60))/(70 – 60) ⋅ (63 − 60) + f(60) = (1,66691 – 1,67065)/10 ⋅ 3 + 1,67065 = 1,669528
Folosind software-ul, calculăm valoarea reală a lui f(63) la 1,669402, o diferență de aproximativ 0,00013. Destul de aproape pentru scopurile noastre.
Traducere din Wikibooks
Lasă un răspuns