În ultimii ani, mineritul datelor (data mining) a fost utilizată pe scară largă în domeniile științei și ingineriei, cum ar fi bioinformatică, genetică, medicină, educație și ingineria energiei electrice.
În studiul geneticii umane, extragerea secvenței ajută la abordarea obiectivului important de înțelegere a relației de cartografiere dintre variațiile inter-individuale ale secvenței ADN-ului uman și variabilitatea susceptibilității bolii. În termeni simpli, își propune să afle modul în care modificările în secvența ADN-ului unui individ afectează riscurile de a dezvolta boli comune, cum ar fi cancerul, care este de mare importanță pentru îmbunătățirea metodelor de diagnosticare, prevenire și tratare a acestor boli. O metodă de extragere a datelor care este utilizată pentru a îndeplini această sarcină este cunoscută sub numele de reducerea dimensionalității multifactoriale.
În domeniul ingineriei energiei electrice, metodele de extragere a datelor au fost utilizate pe scară largă pentru monitorizarea stării echipamentelor electrice de înaltă tensiune. Scopul monitorizării stării este de a obține informații valoroase despre, de exemplu, starea izolației (sau alți parametri importanți legați de siguranță). Tehnicile de grupare a datelor – cum ar fi harta de auto-organizare (SOM), au fost aplicate pentru monitorizarea vibrațiilor și analiza comutatoarelor de reglaj sub sarcină cu transformator (OLTCS). Folosind monitorizarea vibrațiilor, se poate observa că fiecare operațiune de schimbare a apei generează un semnal care conține informații despre starea contactelor comutatorului și mecanismele de antrenare. Evident, diferite poziții de atingere vor genera semnale diferite. Cu toate acestea, a existat o variabilitate considerabilă între semnalele de stare normală pentru exact aceeași poziție de atingere. SOM a fost aplicat pentru a detecta condiții anormale și pentru a formula ipoteze despre natura anomaliilor.
Metodele de mineritul datelor au fost aplicate analizei gazelor dizolvate (DGA) în transformatoarele de putere. DGA, ca diagnostic pentru transformatoarele de putere, este disponibil de mulți ani. Metode precum SOM au fost aplicate pentru a analiza datele generate și pentru a determina tendințe care nu sunt evidente pentru metodele standard ale raportului DGA (cum ar fi Triunghiul Duval).
În cercetarea educațională, unde extragerea datelor a fost folosită pentru a studia factorii care conduc studenții să aleagă să se angajeze în comportamente care le reduc învățarea și să înțeleagă factorii care influențează reținerea studenților universitari. Un exemplu similar de aplicare socială a exploatării datelor este utilizarea acesteia în sistemele de găsire a expertizei, prin care descriptorii expertizei umane sunt extrași, normalizați și clasificați pentru a facilita găsirea de experți, în special în domeniile științifice și tehnice. În acest fel, extragerea datelor poate facilita memoria instituțională.
Metode de minerit a datelor biomedicale facilitate de ontologii de domeniu, extragerea datelor din studiile clinice și analiza traficului folosind SOM.
În supravegherea reacțiilor adverse la medicamente, Uppsala Centrul de monitorizare a folosit, din 1998, metode de extragere a datelor pentru a verifica în mod obișnuit modelele de raportare care indică problemele emergente privind siguranța medicamentelor în baza de date globală a OMS cu 4,6 milioane de incidente suspectate de reacții adverse la medicamente. Recent, a fost dezvoltată o metodologie similară pentru a extrage colecții mari de dosare electronice de sănătate pentru modele temporale care asociază prescripțiile de medicamente cu diagnosticele medicale.
Mineritul de date a fost aplicat artefactelor software din domeniul ingineriei software: depozite de software miniere.
În domeniul microbiologiei, metodele de extragere a datelor au fost folosite pentru a prezice comportamentul populației bacteriilor din alimente.
(Include texte traduse și adaptate din Wikipedia de Nicolae Sfetcu)
Lasă un răspuns