Home » Articole » RO » Știință » Matematica » Știința datelor (Data science » Teoria învățării statistice

Teoria învățării statistice

Teoria învățării statistice presupune aproximativ evaluarea cantității de date necesare pentru a obține o anumită precizie de predicție. Există diferențe între statistică și învățare automată, chiar dacă cele două domenii împărtășesc obiective comune.

Într-adevăr, ambele par să încerce să folosească date pentru a îmbunătăți deciziile. În timp ce aceste domenii au evoluat în aceeași direcție și au în prezent o mulțime de aspecte, ele au fost la început destul de diferite. Statistica a existat cu mult înainte de învățarea automată, și statistica era deja o disciplină științifică pe deplin dezvoltată până în 1920, în special datorită contribuțiilor lui R. Fisher, care a popularizat estimarea maximă a probabilității (MLE) ca instrument sistematic pentru inferența statistică. Cu toate acestea, MLE necesită în esență cunoașterea distribuției probabilității din care sunt extrase datele, până la un parametru necunoscut de interes. Adesea, parametrul necunoscut are o semnificație fizică, iar estimarea acestuia este esențială pentru a înțelege mai bine unele fenomene. Activarea MLE necesită, prin urmare, să știți multe despre procesul de generare a datelor: acest lucru este cunoscut sub numele de modelare. Modelarea poate fi condusă de fizică sau de cunoașterea prealabilă a problemei. În orice caz, necesită destul de multe cunoștințe de domeniu.

Mai recent (exemplele datează din anii 1960) au devenit disponibile noi tipuri de seturi de date (date demografice, sociale, medicale …). Cu toate acestea, modelarea datelor conținute este mult mai periculoasă, deoarece nu înțelegem foarte bine procesul de intrare / ieșire, necesitând astfel o abordare fără distribuție. Un exemplu tipic este clasificarea imaginilor în care scopul este de a eticheta o imagine pur și simplu dintr-o digitalizare a acestei imagini. Înțelegerea a ceea ce face o imagine o pisică sau un câine, de exemplu, este un proces foarte complicat. Cu toate acestea, pentru sarcina de clasificare, nu este nevoie să înțelegem procesul de etichetare, ci mai degrabă să îl reproducem. În acest sens, învățarea automată favorizează o abordare blackbox (caseta neagră) (vezi Figura 1).

Blackbox pentru învățare automată (Blackbox pentru învățare automată (stânga) unde scopul este de a reproduce perechile de intrare / ieșire din observațiile anterioare, comparativ cu abordarea statistică care deschide caseta neagră și modelează relația.)

Aceste diferențe între statistici și învățarea automată au scăzut în ultimele decenii. Într-adevăr, pe de o parte, statisticile sunt din ce în ce mai preocupate de analiza eșantionului finit, de specificația greșită a modelului și de considerațiile de calcul. Pe de altă parte, modelarea probabilistică este acum inerentă învățării automate. La intersecția celor două câmpuri, se află teoria învățării statistice, un domeniu care se ocupă în primul rând de întrebări privind complexitatea eșantionului.

Sursa: Massachusetts Institute of Technology, CC Attribution-NonCommercial-ShareAlike 4.0 International, Traducere și adaptare de Nicolae Sfetcu

Acest articol este oferit sub licență CC Attribution-NonCommercial-ShareAlike 4.0 International

Traducere şi traducători
Traducere şi traducători

Include Ghidul Comisiei Europene pentru traducătorii din Uniunea Europeană Despre traducere şi traducători, teorii ale traducerilor, traducerea asistată pe calculator, şi software utilizat în traduceri. Include Ghidul Comisiei Europene pentru traducătorii din Uniunea Europeană şi legislaţia specifică traducerilor şi traducătorilor. … Citeşte mai mult

Nu a fost votat $2,99 Selectează opțiunile
Ghidul autorului de cărţi electronice
Ghidul autorului de cărţi electronice

Ai scris o carte. Foarte frumos. Dar nu ai scris-o pentru a o ţine pentru tine. Trebuie să o publici. Problema e că editurile percep preţuri foarte mari pentru buzunarele unora dintre autori, şi aceasta în mod obiectiv, datorită costurilor … Citeşte mai mult

Nu a fost votat $4,99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile

Faci un comentariu sau dai un răspuns?

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *