Știință și inginerie
În ultimii ani, mineritul datelor a fost utilizat pe scară largă în domeniile științei și ingineriei, cum ar fi bioinformatică, genetică, medicină, educație și inginerie electrică.
- În studiul geneticii umane, extragerea secvenței ajută la abordarea obiectivului important de înțelegere a relației de cartografiere dintre variațiile interindividuale ale secvenței ADN uman și variabilitatea susceptibilității bolii. În termeni simpli, își propune să afle modul în care modificările secvenței ADN a unui individ afectează riscurile de a dezvolta boli comune, cum ar fi cancerul, care este de mare importanță pentru îmbunătățirea metodelor de diagnosticare, prevenire și tratare a acestor boli. O metodă de extragere a datelor care este utilizată pentru a îndeplini această sarcină este cunoscută sub numele de reducerea dimensionalității multifactoriale.
- În domeniul ingineriei energiei electrice, metodele de extragere a datelor au fost utilizate pe scară largă pentru monitorizarea stării echipamentelor electrice de înaltă tensiune. Scopul monitorizării stării este de a obține informații valoroase despre, de exemplu, starea izolației (sau alți parametri importanți legați de siguranță). Tehnicile de grupare a datelor – cum ar fi harta de auto-organizare (SOM), au fost aplicate la monitorizarea vibrațiilor și analizarea comutatoarelor de reglaj sub sarcină cu transformator (OLTCS). Utilizând monitorizarea vibrațiilor, se poate observa că fiecare operațiune de schimbare a poziției comutatorului generează un semnal care conține informații despre starea contactelor comutatorului și mecanismele de acționare. Evident, diferite poziții la care se ajunge vor genera semnale diferite. Cu toate acestea, a existat o variabilitate considerabilă între semnalele de stare normală pentru exact aceeași poziție. SOM a fost aplicat pentru a detecta condiții anormale și pentru a formula ipoteze despre natura anomaliilor.
- Metodele de extragere a datelor au fost aplicate analizei gazelor dizolvate (DGA) în transformatoarele de putere. DGA, ca diagnostic pentru transformatoarele de putere, este disponibil de mulți ani.
Metode precum SOM au fost aplicate pentru a analiza datele generate și pentru a determina tendințe care nu sunt evidente pentru metodele standard ale raportului DGA (cum ar fi Triunghiul Duval).
- În cercetarea educațională, unde extragerea de date a fost folosită pentru a studia factorii care i-au determinat pe studenți să aleagă să se implice în comportamente care le reduc învățarea și pentru a înțelege factorii care influențează reticența studenților. Un exemplu similar de aplicare socială a exploatării datelor este utilizarea acestuia în sistemele de găsire a expertizei, prin care descriptorii expertizei umane sunt extrași, normalizați și clasificați pentru a facilita găsirea de experți, în special în domeniile științifice și tehnice. În acest fel, mineritul datelor poate facilita memoria instituțională.
- Metode de mineritul datelor biomedicale facilitate de ontologiile de domeniu, mineritul datelor din studiile clinice și analiza traficului folosind SOM.
- În supravegherea reacțiilor adverse la medicamente, Centrul de monitorizare Uppsala a folosit, din 1998, metode de mineritul datelor pentru a verifica în mod obișnuit modelele de raportare care indică problemele emergente de siguranță a medicamentelor în baza de date globală a OMS cu 4,6 milioane de incidente suspectate de reacții adverse la medicamente. Recent, a fost dezvoltată o metodologie similară pentru a extrage colecții mari de registre electronice de sănătate pentru modele temporale care asociază prescripțiile de medicamente cu diagnosticele medicale.
- Mineritul datelor a fost aplicat artefactelor software din domeniul ingineriei software: Arhivele de software pentru minerit.
Drepturile omului
Mineritul datelor din înregistrările guvernamentale – în special înregistrările sistemului de justiție (adică, instanțe, închisori) – permite descoperirea încălcărilor sistemice ale drepturilor omului în legătură cu generarea și publicarea de înregistrări juridice invalide sau frauduloase de către diferite agenții guvernamentale.
Mineritul datelor medicale
Unii algoritmi de învățare automată pot fi aplicați în domeniul medical ca instrumente de diagnosticare de a doua opinie și ca instrumente pentru faza de extragere a cunoștințelor în procesul de descoperire a cunoștințelor în baze de date. Unul dintre acești clasificatori (numit Prototype exemplar learning classifier (PEL-C)) este capabil să descopere sindroame, precum și cazuri clinice atipice.
În 2011, cazul Sorrell v. IMS Health, Inc., judecat de Curtea Supremă a Statelor Unite, a decis că farmaciile pot împărtăși informații cu companii externe. Această practică a fost autorizată prin Primul Amendament al Constituției, protejând „libertatea de exprimare”. Cu toate acestea, aprobarea Legii privind tehnologia informației în sănătate pentru sănătate economică și clinică (HITECH Act) a contribuit la inițierea adoptării dosarului medical electronic (EHR) și a tehnologiei de sprijin în Statele Unite. Legea HITECH a fost semnată ca lege la 17 februarie 2009, ca parte a Actului American de Recuperare și Reinvestire (ARRA), și a ajutat la deschiderea ușii către mineritul de date medicale. Înainte de semnarea acestei legi, se estimează că doar 20% dintre medicii din Statele Unite foloseau dosarele electronice ale pacienților. Soren Brunak observă că „dosarul pacientului devine din ce în ce mai bogat în informații” și, prin urmare, „maximizează oportunitățile de minerit a datelor”. Prin urmare, înregistrările electronice ale pacienților extind și mai mult posibilitățile privind mineritul datelor medicale, deschizând astfel ușa unei surse vaste de analiză a datelor medicale.
Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu
Lasă un răspuns