Mineritul datelor (data mining) în știință și inginerie

|

În ultimii ani, mineritul datelor (data mining) a fost utilizată pe scară largă în domeniile științei și ingineriei, cum ar fi bioinformatică, genetică, medicină, educație și ingineria energiei electrice. În studiul geneticii umane, extragerea secvenței ajută la abordarea obiectivului important … Citeşte mai mult

Învățarea automată a regulilor de asociere în mineritul datelor (data mining)

|

Învățarea regulilor de asociere este o metodă de învățare automată bazată pe reguli pentru a descoperi relații interesante între variabilele din bazele de date mari. Este destinată să identifice reguli puternice descoperite în bazele de date folosind unele măsuri de … Citeşte mai mult

Mineritul datelor în știință, inginerie și medicină

|

Știință și inginerie În ultimii ani, mineritul datelor a fost utilizat pe scară largă în domeniile științei și ingineriei, cum ar fi bioinformatică, genetică, medicină, educație și inginerie electrică. În studiul geneticii umane, extragerea secvenței ajută la abordarea obiectivului important … Citeşte mai mult

Rezumarea automată de multiple documente în mineritul datelor, gen ChatGPT – Tehnici de evaluare

|

Rezumarea din mai multe documente este o procedură automată care vizează extragerea de informații din mai multe texte scrise despre aceeași temă. Raportul de rezumat rezultat permite utilizatorilor individuali, cum ar fi consumatorii profesioniști de informații, să se familiarizeze rapid cu … Citeşte mai mult

Învățarea automată nesupravegheată în mineritul datelor: TextRank

|

Un alt algoritm de extragere a frazelor cheie este TextRank. În timp ce metodele supravegheate au câteva proprietăți frumoase, cum ar fi capacitatea de a produce reguli interpretabile pentru caracteristicile care caracterizează o expresie cheie, ele necesită, de asemenea, o … Citeşte mai mult

Regresia neliniară în mineritul datelor

|

Când funcția modelului nu este liniară în parametri, suma pătratelor trebuie redusă la minimum printr-o procedură iterativă. Acest lucru introduce multe complicații care sunt rezumate în Diferențele între cele mai mici pătrate liniare și neliniare Calcule de putere și dimensiunea eșantionului … Citeşte mai mult

Regresia liniară în mineritul datelor (data mining)

|

În regresia liniară, specificația modelului este aceea că variabila dependentă, y, este o combinație liniară a parametrilor (dar nu trebuie să fie liniară în variabilele independente). De exemplu, în regresia liniară simplă pentru modelarea a n puncte de date există … Citeşte mai mult

Proceduri și algoritmi în clasificarea statistică pentru mineritul datelor

|

Proceduri frecventiste Lucrările timpurii privind clasificarea statistică au fost întreprinse de Fisher, în contextul problemelor cu două grupuri, ceea ce a condus la funcția discriminantă liniară a lui Fisher ca regulă pentru atribuirea unui grup unei noi observații. Această lucrare … Citeşte mai mult

Clasificări statistice în mineritul datelor

|

În învățarea automată și statistică, clasificarea statistică este problema identificării căruia dintr-un set de categorii (subpopulații) îi aparține o nouă observație, pe baza unui set de antrenament de date care conține observații (sau instanțe) a căror apartenență la categorie este … Citeşte mai mult

Analiza datelor prin clustering pe bază de densitate în mineritul datelor

|

În clusteringul bazată pe densitate, clusterele sunt definite ca zone cu o densitate mai mare decât restul setului de date. Obiectele din aceste zone împrăștiate – care sunt necesare pentru a separa clusterele – sunt de obicei considerate a fi … Citeşte mai mult

Analiza clusterelor în mineritul datelor: Clustering bazat pe distribuție

|

Modelul de clustering cel mai strâns legat de statistică se bazează pe modele de distribuție. Clusterele bazate pe distribuție pot fi apoi definite cu ușurință ca obiecte aparținând cel mai probabil aceleiași distribuții. O proprietate convenabilă a acestei abordări este că … Citeşte mai mult

Clustering bazat pe centroid în mineritul datelor (data mining)

|

În clustering bazat pe centroid, clusterele sunt reprezentate de un vector central, care poate să nu fie neapărat membru al setului de date. Când numărul de clustere este fixat la k, clusteringul prin k-medii oferă o definiție formală ca o … Citeşte mai mult

1 2 3 4