Analiza exploratorie a datelor: bivariat – Conceptul de semnificație statistică

|

În acest capitol, ne vom extinde repertoriul analizei exploratorii a datelor (EDA) pentru a acoperi datele bivariate, ceea ce înseamnă să studiem relațiile dintre perechile de variabile, mai degrabă decât să ne concentrăm doar pe o singură variabilă la un … Citeşte mai mult

Probabilitatea inversă în învățarea automată pentru deducerea necunoscutelor și realizarea de predicții

|

Probabilitatea inversă permite deducerea necunoscutelor și realizarea de predicții. ML se bazează în principal pe trei piloni ai matematicii: algebra liniară, optimizarea și teoria probabilității, deși sunt implicate multe alte domenii matematice, vezi, de exemplu, [26]. Teoria probabilității [27] oferă … Citeşte mai mult

Detectarea anomaliilor

|

În analiza datelor, detectarea anomaliilor (denumită și detectare anormalităților și, uneori, detectare a noutăților) este în general înțeleasă ca fiind identificarea elementelor, evenimentelor sau observațiilor rare care se abat semnificativ de la majoritatea datelor și nu se conformează unui criteriu … Citeşte mai mult

Diagrame de dispersie

|

O modalitate de a investiga relația dintre două variabile este prin intermediul unui grafic de dispersie. Pentru a crea o diagramă de dispersie, realizăm un grafic de perechi ordonate pentru valorile corespunzătoare ale lui x și y, adică (x,y) în … Citeşte mai mult

KDE și distribuții în știința datelor – Limitările histogramelor

|

Histogramele sunt un instrument excelent pentru a vedea distribuția unui eșantion numeric, univariat. După cum vom vedea în acest capitol, totuși, au unele deficiențe. O problemă este că un set de date nu determină în mod unic o histogramă: în … Citeşte mai mult

Grafice de date: Histograme

|

După cum spune o vorbă mai veche, o imagine valorează cât o mie de cuvinte. Rezumatele datelor pot veni în imagini sau grafice. Iată câteva dintre tipurile tipice de grafice pentru afișarea distribuțiilor.Ele ne pot oferi o privire de ansamblu … Citeşte mai mult

Probabilități: Complementul unui eveniment

|

Complementul unui eveniment A constă din toate rezultatele în care evenimentul A care NU au loc. Există mai multe moduri de a arăta complementul în formă simbolică: A’, A, Ac. În această carte și curs vom folosi Ac. Deoarece fiecare … Citeşte mai mult

Rezumarea datelor în statistica descriptivă – Distribuții

|

După ce datele sunt colectate, este o idee bună să rezumați și să afișați datele în moduri care să arate caracteristicile importante. Una dintre cele mai bune modalități este de a crea o distribuție a fiecărei variabile, care este informații … Citeşte mai mult

Calcularea probabilității

|

Regula #1 pentru calcularea unei probabilități este probabilitatea empirică. Probabilitatea se bazează pe rezultatele reale observate pentru un anumit număr de încercări ale unui experiment. Aceasta este similară cu frecvența relativă. Formula pentru probabilitatea empirică a evenimentului A este P(A) … Citeşte mai mult

Eșantionarea în analiza statistică

|

Există două tipuri principale de variabile. În această carte, ne vom concentra în principal pe datele din variabile numerice, deoarece puteți efectua calcule cu numere mai ușor. Variabilele calitative sunt variabile care au valori care sunt cuvinte, simboluri sau categorii. … Citeşte mai mult

Analiza de regresie

|

În modelarea statistică, analiza de regresie este un proces statistic de estimare a relațiilor dintre variabile. Include multe tehnici pentru modelarea și analiza mai multor variabile, atunci când se pune accentul pe relația dintre o variabilă dependentă și una sau … Citeşte mai mult

Clasificări statistice în mineritul datelor

|

În învățarea automată și statistică, clasificarea statistică este problema identificării căruia dintr-un set de categorii (subpopulații) îi aparține o nouă observație, pe baza unui set de antrenament de date care conține observații (sau instanțe) a căror apartenență la categorie este … Citeşte mai mult

1 2 3 4 6