Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Tehnici de învățare automată în analitica predictivă

Tehnici de învățare automată în analitica predictivă

Învățarea automată, o ramură a inteligenței artificiale, a fost folosită inițial pentru a dezvolta tehnici care să permită computerelor să învețe. Astăzi, deoarece include o serie de metode statistice avansate de regresie și clasificare, își găsește aplicație într-o mare varietate de domenii, inclusiv diagnosticarea medicală, detectarea fraudelor cu cardul de credit, recunoașterea feței și a vorbirii și analiza pieței de valori. În anumite aplicații, este suficient să preziceți direct variabila dependentă, fără a vă concentra pe relațiile de bază dintre variabile. În alte cazuri, relațiile de bază pot fi foarte complexe, iar forma matematică a dependențelor necunoscută. În astfel de cazuri, tehnicile de învățare automată emulează cunoașterea umană și învață din exemplele de instruire pentru a prezice evenimente viitoare.

O scurtă discuție despre unele dintre aceste metode utilizate în mod obișnuit pentru analiza predictivă este oferită mai jos. Un studiu detaliat al învățării automate poate fi găsit în Mitchell (1997).

Rețele neuronale

Rețelele neuronale sunt tehnici de modelare sofisticate neliniare care sunt capabile să modeleze funcții complexe. Acestea pot fi aplicate problemelor de predicție, clasificare sau control într-un spectru larg de domenii, cum ar fi finanțe, psihologie cognitivă/neuroștiință, medicină, inginerie și fizică.

Rețelele neuronale sunt utilizate atunci când natura exactă a relației dintre intrări și ieșiri nu este cunoscută. O caracteristică cheie a rețelelor neuronale este că acestea învață relația dintre intrări și ieșiri prin antrenament. Există trei tipuri de antrenament în rețelele neuronale utilizate de diferite rețele, antrenament supravegheat și nesupravegheat, învățare prin întărire, cea mai frecventă fiind cea supravegheată.

Câteva exemple de tehnici de antrenare a rețelelor neuronale sunt propagarea inversă, propagarea rapidă, coborârea gradientului conjugat, operatorul de proiecție, Delta-Bar-Delta etc. Unele arhitecturi de rețea nesupravegheate sunt perceptroni multistrat, rețele Kohonen, rețele Hopfield etc.

Perceptron multistrat (MLP)

Perceptronul multistrat (MLP) constă dintr-un strat de intrare și un strat de ieșire cu unul sau mai multe straturi ascunse de noduri cu activare neliniară sau noduri sigmoide. Aceasta este determinată de vectorul de greutate și este necesar să se ajusteze greutățile rețelei. Propagarea inversă folosește căderea în gradient pentru a minimiza erorii pătrate dintre valorile de ieșire din rețea și valorile dorite pentru acele ieșiri. Ponderile sunt ajustate printr-un proces iterativ de prezentare repetitivă a atributelor. Micile modificări ale greutății pentru a obține valorile dorite sunt efectuate prin procesul numit antrenament net și se realizează prin setul de antrenament (regula de învățare).

Funcții de bază radială

O funcție de bază radială (RBF) este o funcție care are încorporat un criteriu de distanță față de un centru. Astfel de funcții pot fi utilizate foarte eficient pentru interpolare și pentru netezirea datelor. Funcțiile de bază radială au fost aplicate în zona rețelelor neuronale unde sunt folosite ca înlocuitor pentru funcția de transfer sigmoidal. Astfel de rețele au 3 straturi, stratul de intrare, stratul ascuns cu neliniaritatea RBF și un strat de ieșire liniar. Cea mai populară alegere pentru neliniaritate este cea gaussiană. Rețelele RBF au avantajul de a nu fi blocate în minime locale, la fel ca rețelele feed-forward, cum ar fi perceptronul multistrat.

Mașini vectoriale de suport

Mașinile vectoriale de suport (SVM) sunt utilizate pentru a detecta și exploata modele complexe în date prin gruparea, clasificarea și clasarea datelor. Sunt mașini de învățare care sunt folosite pentru a efectua clasificări binare și estimări de regresie. Ele folosesc de obicei metode bazate pe nucleu pentru a aplica tehnici de clasificare liniară problemelor de clasificare neliniară. Există o serie de tipuri de SVM, cum ar fi liniare, polinomiale, sigmoide etc.

Bayesian naiv

Modelul bayesian naiv bazat pe regula probabilității condiționate Bayes este utilizat pentru efectuarea sarcinilor de clasificare. Modelul bayesian naiv presupune că predictorii sunt independenți din punct de vedere statistic, ceea ce îl face un instrument de clasificare eficient, ușor de interpretat. Este cel mai bine folosit atunci când se confruntă cu problema „blestemului dimensionalității”, adică atunci când numărul de predictori este foarte mare.

Vecinii cei mai apropiati fc

Algoritmul cel mai apropiat vecin (KNN) aparține clasei de metode statistice de recunoaștere a modelelor. Metoda nu impune a priori nicio ipoteză cu privire la distribuția din care este extras eșantionul de modelare. Implică un set de antrenament cu valori atât pozitive, cât și negative. Un nou eșantion este clasificat prin calcularea distanței până la cel mai apropiat caz de antrenament învecinat. Semnul acelui punct va determina clasificarea eșantionului. În clasificatorul k-cel mai apropiat vecin, sunt luate în considerare cele mai apropiate k puncte, iar semnul majorității este folosit pentru a clasifica eșantionul. Performanța algoritmului kNN este influențată de trei factori principali: (1) măsura distanței folosită pentru a localiza cei mai apropiați vecini; (2) regula de decizie utilizată pentru a obține o clasificare de la k-mai apropiați vecini; și (3) numărul de vecini utilizat pentru clasificarea noului eșantion. Se poate demonstra că, spre deosebire de alte metode, această metodă este universal asimptotic convergentă, adică: pe măsură ce mărimea setului de antrenament crește, dacă observațiile sunt independente și distribuite identic (i.i.d.), indiferent de distribuția din care este extras eșantionul, clasa estimată va converge către tema de clasă care minimizează eroarea de clasificare greșită.

Modelare predictivă geospațială

Din punct de vedere conceptual, modelarea predictivă geospațială are rădăcinile în principiul că apariția evenimentelor care sunt modelate sunt limitate în distribuție. Aparițiile evenimentelor nu sunt nici uniforme, nici aleatorie în distribuție — există factori de mediu spațial (infrastructură, socioculturale, topografice etc.) care constrâng și influențează locul unde au loc evenimentele. Modelarea predictivă geospațială încearcă să descrie acele constrângeri și influențe prin aparițiile corelate spațial ale locațiilor geospațiale istorice cu factorii de mediu care reprezintă acele constrângeri și influențe. Modelarea predictivă geospațială este un proces de analiză a evenimentelor printr-un filtru geografic pentru a face declarații cu privire la probabilitatea întâmplării sau apariției unui eveniment.

Instrumente

Din punct de vedere istoric, utilizarea instrumentelor de analiză predictivă – precum și înțelegerea rezultatelor pe care le-au oferit – a necesitat abilități avansate. Cu toate acestea, instrumentele moderne de analiză predictivă nu mai sunt limitate la specialiștii IT. Pe măsură ce tot mai multe organizații adoptă analiza predictivă în procesele de luare a deciziilor și le integrează în operațiunile lor, ele creează o schimbare pe piață către utilizatorii de afaceri drept consumatori primari ai informațiilor. Utilizatorii de afaceri apelează la instrumente pe care le pot folosi singuri. Furnizorii răspund creând un software nou care înlătură complexitatea matematică, oferă interfețe grafice ușor de utilizat și/sau creează scurtături care pot, de exemplu, să recunoască tipul de date disponibile și să sugereze un model predictiv adecvat. Instrumentele de analiză predictivă au devenit suficient de sofisticate pentru a prezenta și a diseca în mod adecvat problemele de date, astfel încât orice lucrător în domeniul informației cu cunoștințe de date le poate utiliza pentru a analiza datele și a obține rezultate semnificative și utile. De exemplu, instrumentele moderne prezintă rezultate folosind diagrame, grafice și scoruri simple care indică probabilitatea unor posibile rezultate.

Există numeroase instrumente disponibile pe piață care ajută la execuția analizei predictive. Acestea variază de la cele care necesită foarte puțină sofisticare a utilizatorului până la cele care sunt concepute pentru practicianul expert. Diferența dintre aceste instrumente constă adesea în nivelul de personalizare și ridicarea greutăților permise.

Instrumentele notabile de analiză predictivă open source includ:

  • Apache Mahout
  • GNU Octave
  • KNIME
  • OpenNN
  • Orange
  • R
  • scikit-learn
  • Weka

Instrumentele comerciale de analiză predictivă notabile includ:

  • Alpine Data Labs
  • Alteryx
  • Angoss KnowledgeSTUDIO
  • BIRT Analytics
  • IBM SPSS Statistics și IBM SPSS Modeler
  • KXEN Modeler
  • Mathematica
  • MATLAB
  • Minitab
  • LabVIEW
  • Neural Designer
  • Oracle Advanced Analytics
  • Pervasive
  • Predixion Software
  • RapidMiner
  • RCASE
  • Revolution Analytics
  • SAP HANA și SAP BusinessObjects Predictive Analytics
  • SAS and SAS Enterprise Miner
  • STATA
  • Statgraphics
  • STATISTICA
  • TeleRetail
  • TIBCO

Pe lângă aceste pachete software, au fost dezvoltate și instrumente specifice pentru aplicații industriale. De exemplu, Watchdog Agent Toolbox a fost dezvoltat și optimizat pentru analiza predictivă în aplicațiile de prognoză și management al sănătății și este disponibil pentru MATLAB și LabVIEW.

Cele mai populare pachete software comerciale de analiză predictivă conform Sondajului Rexer Analytics pentru 2013 sunt IBM SPSS Modeler, SAS Enterprise Miner și Dell Statistica.

PMML

În încercarea de a oferi un limbaj standard pentru exprimarea modelelor predictive, a fost propus Limbajul de marcare a modelului predictiv (PMML). Un astfel de limbaj bazat pe XML oferă o modalitate pentru diferitele instrumente de a defini modele predictive și de a le partaja între aplicațiile compatibile PMML. PMML 4.0 a fost lansat în iunie 2009.

Critică

Există o mulțime de sceptici când vine vorba de abilitățile computerelor și algoritmilor de a prezice viitorul, inclusiv Gary King, profesor de la Universitatea Harvard și director al Institutului pentru Științe Sociale Cantitative. Oamenii sunt influențați de mediul lor în nenumărate moduri. Încercarea de a înțelege ce vor face oamenii în continuare presupune că toate variabilele influente pot fi cunoscute și măsurate cu acuratețe. „Mediile oamenilor se schimbă chiar mai repede decât ei înșiși. Totul, de la vreme la relația cu mama lor, poate schimba modul în care oamenii gândesc și acționează. Toate aceste variabile sunt imprevizibile. Modul în care vor afecta o persoană este și mai puțin previzibil. Dacă mâine sunt puse în exact aceeași situație, ei pot lua o decizie complet diferită. Aceasta înseamnă că o predicție statistică este valabilă doar în condiții sterile de laborator, ceea ce dintr-o dată nu este atât de util pe cât părea înainte.”

Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu

Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor

Transformă informația în putere cu ajutorul acestei cărți indispensabile!

Nu a fost votat 18.29 lei44.04 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat 13.70 lei24.01 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Big Data: Modele de afaceri - Securitatea megadatelor
Big Data: Modele de afaceri – Securitatea megadatelor

Nu rata oportunitatea de a rămâne competitiv într-o lume bazată pe date!

Nu a fost votat 18.29 lei27.45 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *