Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Problemele științei datelor și învățarea automată

Problemele științei datelor și învățarea automată

Învățarea automată este necesară pentru a face computerele să-și îndeplinească sarcinile în mod sofisticat, fără nicio intervenție a ființelor umane, pe baza învățării și a experienței în continuă creștere pentru a înțelege complexitatea problemelor și nevoia de adaptabilitate.

  • Sarcinile efectuate de ființe umane: Există o mulțime de sarcini îndeplinite zilnic de ființe umane, dar principala preocupare este aceea de a îndeplini sarcinile perfect și de a lucra sub un program bine definit. Exemple: gătit, șofat, recunoaștere a vorbirii.
  • Sarcini dincolo de capacitățile umane: O altă categorie de sarcini care poate fi realizată prin învățarea automată într-un mod eficient este analiza seturilor de date mari și complexe, cum ar fi teledetecția, prognoza meteo, comerțul electronic, căutarea pe web etc. Cu cantități mari de date, devine cu adevărat complex pentru ființele umane să prezică date semnificative.

Învățarea automată are capacități dovedite de a rezolva în mod inerent problemele științei datelor. Hayashi și Chikio [3] definesc știința datelor ca „un concept pentru a unifica statisticile, analiza datelor, învățarea automată și metodele aferente acestora pentru a înțelege și analiza fenomene reale cu date”. Înainte de a trece la rezolvarea problemelor, problemele trebuie să fie clasificate corespunzător, astfel încât să li se poată aplica cel mai potrivit algoritm de învățare automată. Orice problemă din știința datelor poate fi grupată în una dintre următoarele cinci categorii, așa cum se arată în Figura 2.

Fig 2. Tipuri de probleme

Astfel, în funcție de tipul de problemă, se poate aplica o abordare adecvată a învățării automate. Diferitele categorii sunt explicate mai jos:

  • Problemă de clasificare – O problemă în care rezultatul poate fi doar unul dintr-un număr fix de clase de ieșire cunoscute a priori, cum ar fi Da/Nu, Adevărat/Fals, se numește problemă de clasificare. În funcție de numărul de clase de ieșire, problema poate fi o problemă de clasificare binară sau cu mai multe clase.
  • Problemă de detectare a anomaliilor – Problemele care analizează un anumit model și detectează modificări sau anomalii ale modelului se încadrează în această categorie. De exemplu, companiile de carduri de credit folosesc algoritmi de detectare a anomaliilor pentru a găsi abateri de la comportamentul obișnuit al clientului în tranzacții și lansează alerte ori de câte ori există o tranzacție neobișnuită. Astfel de probleme se referă la descoperirea valorii aberante.
  • Problemă de regresie – Algoritmii de regresie sunt utilizați pentru a rezolva problemele cu rezultate continue și numerice. Acestea sunt de obicei folosite pentru probleme care tratează întrebări precum „cât” sau „câte”.
  • Problemă de grupare – Clustering se încadrează în categoria algoritmilor de învățare nesupravegheată. Acești algoritmi încearcă să învețe structuri în cadrul datelor și încearcă să creeze grupuri bazate pe asemănarea structurii datelor. Diferitele clase sau grupuri sunt apoi etichetate. Algoritmul, când este antrenat, introduce date noi nevăzute într-unul dintre clustere.
  • Problemă de consolidare – Algoritmii de consolidare sunt utilizați atunci când o decizie trebuie luată pe baza experiențelor anterioare de învățare. Agentul mașinii învață comportamentul folosind un fel de interacțiune prin încercare și eroare cu mediul în continuă schimbare. Oferă o modalitate de a programa agenții folosind conceptul de recompense și penalități fără a specifica modul în care trebuie îndeplinită sarcina. Programele de joc și programele pentru controlul temperaturii sunt câteva exemple populare care utilizează învățarea prin consolidare.

Sursa: Jafar Alzubi et al 2018 J. Phys.: Conf. Ser. 1142 012012, licența CC BY 3.0. Traducere: Nicolae Sfetcu

Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Big Data: Modele de afaceri - Securitatea megadatelor
Big Data: Modele de afaceri – Securitatea megadatelor

Termenul megadate (Big Data, date masive) este adesea folosit în mod vag pentru a desemna paleta de algoritmi, tehnologii și sisteme utilizate pentru colectarea datelor de volum și varietate fără precedent și extragerea de valoare din acestea prin calculul masiv … Citeşte mai mult

Nu a fost votat $3,99$5,99 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.