Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Învățarea automată (Machine learning) » Învățarea automata (Machine learning) – Selectarea modelului

Învățarea automata (Machine learning) – Selectarea modelului

Să începem cu un exemplu. Să presupunem că suntem însărcinați cu asigurarea controlului automatizat al accesului la o clădire. Înainte de a intra în clădire, fiecare persoană trebuie să se uite într-o cameră pentru a putea face o imagine statică a feței sale. Pentru scopurile noastre este suficient doar să decidem pe baza imaginii dacă persoana poate intra în clădire. Ar putea fi util (să încercăm) să identificăm și fiecare persoană, dar acest lucru ar putea necesita un tip de informații pe care nu le avem (de exemplu, nume sau dacă există două imagini ale feței care corespund aceleiași persoane). Avem doar imagini de față cu persoane înregistrate în timp ce controlul accesului a fost furnizat în continuare manual. Ca urmare a acestei experiențe, am etichetat imagini. O imagine este etichetată pozitiv dacă persoana în cauză ar trebui să aibă acces și negativ în caz contrar. Pentru a completa setul de imagini etichetate negativ (deoarece ne-am aștepta doar la câteva cazuri de intrări refuzate în circumstanțe normale) putem folosi orice alte imagini faciale ale unor persoane cărora nu ne așteptăm să li se permită să intre în clădire. Ar fi preferate imaginile realizate cu o orientare similară a feței camerei (de exemplu, din sisteme funcționale în alte clădiri). Sarcina noastră este aceea de a veni cu o funcție – un clasificator – care mapează imaginile pixelilor pe etichete binare (± 1). Și avem doar setul mic de imagini etichetate (setul de instruire) pentru a constrânge funcția.

Să facem sarcina puțin mai formală. Presupunem că fiecare imagine (în tonuri de gri) este reprezentată ca un vector coloană x de dimensiunea d. Deci, valorile intensității pixelilor din imagine, coloană cu coloană, sunt concatenate într-un singur vector coloană. Dacă imaginea are 100 pe 100 de pixeli, atunci d = 10000. Presupunem că toate imaginile au aceeași dimensiune. Clasificatorul nostru este o funcție binară de valoare f: Rd → {-1, 1} aleasă numai pe baza setului de instruire. Pentru sarcina noastră de aici, presupunem că clasificatorul nu știe nimic despre imagini (sau fețe de altfel) dincolo de setul de instruire etichetat. Deci, de exemplu, din punctul de vedere al clasificatorului, imaginile ar fi putut fi măsurători ale greutății, înălțimii, mai degrabă decât intensități ale pixelilor. Clasificatorul are doar un set de n vectori de instruire x1, …, xn cu etichete binare ± 1 y1, …, yn. Aceasta este singura informație despre sarcină pe care o putem folosi pentru a constrânge funcția f.

Ce fel de soluție ar fi suficientă?

Să presupunem acum că avem n = 50 de imagini pixelate etichetate, care sunt 128 pe 128, iar intensitățile pixelilor variază de la 0 la 255. Prin urmare, este posibil să putem găsi un singur pixel, să spunem pixel i, astfel încât fiecare dintre n imaginile noastre au o valoare distinctă pentru acel pixel. Am putea construi apoi o funcție binară simplă bazată pe acest pixel unic care mapează perfect imaginile de instruire pe etichetele lor. Cu alte cuvinte, dacă xti se referă la pixelul i în al t-a imagine de instruire, și x’i este pixelul al i-lea din orice imagine x’, atunci

fi(x’) = yt, dacă xti = x’i pentru unele t =1,…,n (în această ordine)

= −1, altfel

ar părea să rezolve sarcina. De fapt, este întotdeauna posibil să veniți cu o astfel de funcție binară „perfectă” dacă imaginile de instruire sunt distincte (nu există două imagini cu intensități de pixeli identice pentru toți pixelii). Dar ne așteptăm ca astfel de reguli să fie utile pentru imagini care nu fac parte din setul de instruire? Chiar și o imagine a aceleiași persoane variază oarecum de fiecare dată când este realizată imaginea (orientarea este ușor diferită, condițiile de iluminare s-au schimbat etc.). Aceste reguli nu oferă previziuni sensibile pentru imagini care nu sunt identice cu cele din setul de instruire. Principalul motiv pentru care astfel de reguli banale nu sunt suficiente este că sarcina noastră nu este să clasificăm corect imaginile de instruire. Sarcina noastră este de a găsi o regulă care să funcționeze bine pentru toate imaginile noi pe care le-am întâlni în setarea controlului accesului; setul de instruire este doar o sursă utilă de informații pentru a găsi o astfel de funcție. Mai formal spus, am dori să găsim clasificatori care să generalizeze bine, respectiv clasificatori a căror performanță pe setul de instruire este reprezentativă pentru cât de bine funcționează pentru imagini încă nevăzute.

Selectarea modelului

Deci, cum putem găsi clasificatori care generalizează bine? Cheia este de a constrânge setul de funcții binare posibile cu care putem lucra. Cu alte cuvinte, am dori să găsim o clasă de funcții binare astfel încât, dacă o funcție din această clasă funcționează bine pe setul de instruire, este probabil să funcționeze bine și asupra imaginilor nevăzute. Clasa „corectă” de funcții de luat în considerare nu poate fi prea mare în sensul că să conțină prea multe funcții clar diferite. În caz contrar, este posibil să găsim reguli similare celor banale care sunt aproape perfecte pe setul de instruire, dar care nu se generalizează bine. Nici clasa de funcții nu ar trebui să fie prea mică sau să riscăm să nu găsim nicio funcție din clasă care să funcționeze bine chiar și pe setul de instruire. Dacă nu funcționează bine pe setul de instruire, cum ne putem aștepta ca ele să funcționeze bine pe noile imagini? Găsirea clasei de funcții este o problemă cheie în învățarea automată, cunoscută și sub numele de problema de selecție a modelului.

Sursa Tommi Jaakkola, course materials for 6.867 Machine Learning, Fall 2006. MIT OpenCourseWare, Massachusetts Institute of Technology, CC Attribution-NonCommercial-ShareAlike 4.0 International, Traducere și adaptare de Nicolae Sfetcu

Acest articol este oferit sub licență CC Attribution-NonCommercial-ShareAlike 4.0 International

Întreţinerea şi repararea calculatoarelor
Întreţinerea şi repararea calculatoarelor

Manual pentru începători pentru întreţinerea şi depanarea calculatoarelor, cu o introducere în noţiuni despre calculatoare, hardware, software (inclusiv sisteme de operare) şi securitatea pe Internet. Un calculator de uz general are patru componente principale: unitatea logică aritmetică (ALU), unitatea de … Citeşte mai mult

Nu a fost votat $0.00 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Telelucru (Telework)
Telelucru (Telework)

Telelucrul, ca un nou mod de a lucra prin efectuarea unei activităţi (forme de muncă) flexibile în timp şi la distanţă, utilizând tehnologia informaţională şi comunicaţiile avansate, se concretizează în teleactivităţi şi teleservicii. În ultimii ani, s-au dezvoltat rapid noi … Citeşte mai mult

Nu a fost votat $0.00 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *