Home » Articole » Articole » Știință » Matematica » Știința datelor (Data science » Teoria învățării statistice

Teoria învățării statistice

Teoria învățării statistice presupune aproximativ evaluarea cantității de date necesare pentru a obține o anumită precizie de predicție. Există diferențe între statistică și învățare automată, chiar dacă cele două domenii împărtășesc obiective comune.

Într-adevăr, ambele par să încerce să folosească date pentru a îmbunătăți deciziile. În timp ce aceste domenii au evoluat în aceeași direcție și au în prezent o mulțime de aspecte, ele au fost la început destul de diferite. Statistica a existat cu mult înainte de învățarea automată, și statistica era deja o disciplină științifică pe deplin dezvoltată până în 1920, în special datorită contribuțiilor lui R. Fisher, care a popularizat estimarea maximă a probabilității (MLE) ca instrument sistematic pentru inferența statistică. Cu toate acestea, MLE necesită în esență cunoașterea distribuției probabilității din care sunt extrase datele, până la un parametru necunoscut de interes. Adesea, parametrul necunoscut are o semnificație fizică, iar estimarea acestuia este esențială pentru a înțelege mai bine unele fenomene. Activarea MLE necesită, prin urmare, să știți multe despre procesul de generare a datelor: acest lucru este cunoscut sub numele de modelare. Modelarea poate fi condusă de fizică sau de cunoașterea prealabilă a problemei. În orice caz, necesită destul de multe cunoștințe de domeniu.

Mai recent (exemplele datează din anii 1960) au devenit disponibile noi tipuri de seturi de date (date demografice, sociale, medicale …). Cu toate acestea, modelarea datelor conținute este mult mai periculoasă, deoarece nu înțelegem foarte bine procesul de intrare / ieșire, necesitând astfel o abordare fără distribuție. Un exemplu tipic este clasificarea imaginilor în care scopul este de a eticheta o imagine pur și simplu dintr-o digitalizare a acestei imagini. Înțelegerea a ceea ce face o imagine o pisică sau un câine, de exemplu, este un proces foarte complicat. Cu toate acestea, pentru sarcina de clasificare, nu este nevoie să înțelegem procesul de etichetare, ci mai degrabă să îl reproducem. În acest sens, învățarea automată favorizează o abordare blackbox (caseta neagră) (vezi Figura 1).

Blackbox pentru învățare automată (Blackbox pentru învățare automată (stânga) unde scopul este de a reproduce perechile de intrare / ieșire din observațiile anterioare, comparativ cu abordarea statistică care deschide caseta neagră și modelează relația.)

Aceste diferențe între statistici și învățarea automată au scăzut în ultimele decenii. Într-adevăr, pe de o parte, statisticile sunt din ce în ce mai preocupate de analiza eșantionului finit, de specificația greșită a modelului și de considerațiile de calcul. Pe de altă parte, modelarea probabilistică este acum inerentă învățării automate. La intersecția celor două câmpuri, se află teoria învățării statistice, un domeniu care se ocupă în primul rând de întrebări privind complexitatea eșantionului.

Sursa: Massachusetts Institute of Technology, CC Attribution-NonCommercial-ShareAlike 4.0 International, Traducere și adaptare de Nicolae Sfetcu

Acest articol este oferit sub licență CC Attribution-NonCommercial-ShareAlike 4.0 International

Ghid marketing pe Internet
Ghid marketing pe Internet

Autor: Nicolae Sfetcu (Ediţia a doua, Revizia 2) Unul din cele mai vechi ghiduri pentru marketing pe Internet în limba română, dar şi unul din cele mai concise şi mai practice ghiduri. Deşi au trecut mulţi ani de la scrierea … Citeşte mai mult

Nu a fost votat 0.00 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Inteligența competitivă - Concept - Studii
Inteligența competitivă – Concept – Studii

Inteligența competitivă: instrumentul esențial pentru succesul în afaceri

Nu a fost votat 9.53 lei15.08 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Promovarea afacerilor prin campanii de marketing online
Promovarea afacerilor prin campanii de marketing online

Descoperă cum să-ți promovezi afacerea eficient în era digitală!

Nu a fost votat 23.89 lei47.45 lei Citește mai mult

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *