Explorarea datelor în inteligența artificială (AI) este etapa în care informațiile încep să fie preluate din datele ingerate. Deși poate fi omisă în unele aplicații AI unde datele sunt bine înțelese, este de obicei o fază a ciclului de viață AI care necesită foarte mult timp. În această etapă, este important să înțelegeți tipul de date care au fost colectate. Trebuie făcută o distincție cheie între diferitele tipuri posibile de date, datele numerice și cele categoriale fiind cele mai proeminente (40), alături de datele multimedia (de exemplu, imagine, audio, video etc.) (41). Datele numerice se pretează la reprezentare grafică și permit calculul statisticilor descriptive și verificarea dacă datele se potrivesc cu distribuțiile parametrice simple precum cea gaussiană. Valorile datelor lipsă pot fi, de asemenea, detectate și gestionate în etapa de explorare. Variabilele categoriale sunt cele care au două sau mai multe categorii, dar fără o ordine intrinsecă. Dacă variabila are o ordonare clară, atunci este considerată ca o variabilă ordinală.
Validarea/explorarea datelor pe scurt: Verificați dacă datele se potrivesc unei distribuții statistice cunoscute, fie prin componentă (distribuții monovariate), fie ca vectori (distribuții multivariate). Estimați parametrii statistici corespunzători.
Note
(40) Discuția se referă în principal la date nunerice, tabelare. Cu toate acestea, trebuie menționat că sistemele AI pot folosi și alte tipuri de date, de ex. discurs, imagini. Acestea sunt, de asemenea, numerice, dar verificările de corectitudine au un grad avansat de complexitate, pentru care nu se efectuează nicio explorare a datelor așa cum este descrisă aici.
(41) Datele multimedia sunt date complexe care sunt foarte relevante în contextul învățării profunde.
Sursa: ENISA, AI Cybersecurity Challenges – Threat Landscape for Artificial Intelligence, December 2020. Editora: Apostolos Malatras, Georgia Dede – European Union Agency for Cybersecurity. © European Union Agency for Cybersecurity (ENISA), 2020. Traducere și adaptare independentă: Nicolae Sfetcu
© 2021 MultiMedia Publishing, Introducere în inteligența artificială
Lasă un răspuns