Modelul generic al învățării automate

Învățarea automată (machine learning, ML) este folosită pentru a rezolva diverse probleme care necesită învățare din partea mașinii. O problemă de învățare are trei caracteristici:

  • Clase de sarcini (sarcina de învățat)
  • Măsura de performanță care trebuie îmbunătățită
  • Procesul de acumulare a experienței

De exemplu, într-un joc de dame, problema de învățare poate fi definită astfel:

  • Sarcina T: Jocul
  • Măsura de performanță P: numărul de jocuri câștigate împotriva adversarului.
  • Experiența E: exersarea jucând jocuri împotriva ei înșiși și îmbunătățirea constantă a performanței.

Modelul generic de învățare automată constă din șase componente independente de algoritmul adoptat. Următoarea figură 3 prezintă aceste componente primare.

Model învățarea automată(Componentele unui model ML generic)

Fiecare componentă a modelului are o sarcină specifică de îndeplinit, așa cum este descrisă în continuare.

  1. Colectarea și pregătirea datelor: Sarcina principală a procesului de învățare automată este să colecteze și să pregătească date într-un format care poate fi dat ca intrare la algoritm. O cantitate mare poate fi disponibilă pentru orice problemă. Datele web sunt de obicei nestructurate și conțin mult zgomot, adică date irelevante, precum și date redundante. Prin urmare, datele trebuie curățate și preprocesate într-un format structurat.
  2. Selectarea caracteristicilor: Datele obținute la pasul de mai sus pot conține numeroase caracteristici, care nu ar fi toate relevante pentru procesul de învățare. Aceste caracteristici trebuie eliminate și trebuie obținut un subset al celor mai importante caracteristici.
  3. Alegerea algoritmului: Nu toți algoritmii de învățare automată sunt buni pentru toate problemele. Anumiți algoritmi sunt mai potriviți pentru o anumită problemă de clasă, așa cum a fost explicat în secțiunea anterioară. Selectarea celui mai bun algoritm de învățare automată pentru problema în cauză este esențială pentru a obține cele mai bune rezultate posibile. Diferiții algoritmi ML sunt discutați într-o secțiune ulterioară.
  4. Selectarea modelelor și a parametrilor: Majoritatea algoritmilor de învățare automată necesită o intervenție manuală inițială pentru a seta cele mai adecvate valori ale diferiților parametri.
  5. Instruire: După selectarea algoritmului adecvat și a valorilor parametrilor adecvate, modelul trebuie să fie antrenat utilizând o parte a setului de date ca date de antrenament.
  6. Evaluarea performanței: Înainte de implementarea în timp real a sistemului, modelul trebuie testat cu date nevăzute pentru a evalua cât de mult s-a învățat folosind diferiți parametri de performanță, cum ar fi acuratețea, precizia și reamintirea.

Sursa: Jafar Alzubi et al 2018 J. Phys.: Conf. Ser. 1142 012012, licența CC BY 3.0. Traducere: Nicolae Sfetcu

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat $4.99$11.99 Selectează opțiunile
Introducere în inteligența artificială
Introducere în inteligența artificială

Inteligența artificială s-a dezvoltat exploziv în ultimii ani, facilitând luarea deciziilor inteligente și automate în cadrul scenariilor de implementare. Inteligența artificială se referă la un ecosistem de modele și tehnologii pentru percepție, raționament, interacțiune și învățare.  Asistăm la o convergență … Citeşte mai mult

Nu a fost votat $2.99$5.24 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *