Clustering bazat pe centroid în mineritul datelor (data mining)

|

În clustering bazat pe centroid, clusterele sunt reprezentate de un vector central, care poate să nu fie neapărat membru al setului de date. Când numărul de clustere este fixat la k, clusteringul prin k-medii oferă o definiție formală ca o … Citeşte mai mult

Evaluarea și implementarea datelor în procesul de asociere în mineritul datelor (data mining)

|

13) Deci am evaluat prima rulare a modelului nostru. Nu s-au găsit reguli. Nu sunt multe de evaluat acolo, nu? Deci, să revenim la perspectiva designului și să aruncăm o privire asupra acelor parametri pe care i-am evidențiat pe scurt … Citeşte mai mult

Algoritmi în învățarea automată a regulilor de asociere în mineritul datelor (data mining)

|

Proces (Setul de articole frecvente, unde culoarea casetei indică câte tranzacții conțin combinația de articole. Rețineți că nivelurile inferioare ale rețelei pot conține cel mult numărul minim de articole ale părinților lor; de exemplu. {ac} poate avea numai cel mult min(a, c) … Citeşte mai mult

Învățarea regulilor de asociere în mineritul datelor (Data Mining)

|

Învățarea regulilor de asociere este o metodă de învățare automată bazată pe reguli pentru a descoperi relații interesante între variabilele din bazele de date mari. Este destinată să identifice reguli puternice descoperite în bazele de date folosind unele măsuri de … Citeşte mai mult

Descoperirea proceselor de afaceri în mineritul de date (Data Mining)

|

Descoperirea proceselor de afaceri (Business process discovery, BPD) legată de procesele de minerit este un set de tehnici care construiesc automat o reprezentare a proceselor de afaceri curente ale unei organizații și a variațiilor majore ale procesului. Aceste tehnici folosesc … Citeşte mai mult

Manipularea datelor inconsistente în mineritul datelor (Data Mining) cu RapidMiner

|

Datele inconsecvente sunt diferite de datele lipsă. Datele inconsecvente apar atunci când o valoare există, dar acea valoare nu este validă sau semnificativă. Referiți-vă la Figura 3-25; o versiune de aproape a acelei imagini este prezentată aici ca Figura 3-29. … Citeşte mai mult

Reducerea datelor în mineritul datelor (Data Mining) cu RapidMiner

|

Următorul set de pași vă va învăța să reduceți numărul de observații din setul de date prin procesul de filtrare. 1) În caseta de căutare din fila Operators, tastați cuvântul „filter”. Acest lucru vă va ajuta să găsiți operatorul „Filter … Citeşte mai mult

Detectarea anomaliilor în mineritul datelor (Data Mining)

|

În data mining, detectarea anomaliilor (de asemenea, detectarea valorilor aberante) este identificarea elementelor, evenimentelor sau observațiilor care nu sunt conforme cu un model așteptat sau cu alte elemente dintr-un set de date. De obicei, elementele anormale se vor traduce într-un … Citeşte mai mult

RapidMiner pentru mineritul datelor (Data Mining): Importarea datelor și gestionarea datelor lipsă

|

Prima noastră sarcină în pregătirea datelor este să gestionăm datele lipsă; totuși, deoarece aceasta va fi prima dată când folosim RapidMiner, primii câțiva pași vor implica configurarea RapidMiner. Apoi vom trece direct în gestionarea datelor lipsă. Datele lipsă sunt date care … Citeşte mai mult

Pregătirea datelor pentru activitatea de data mining cu modelul CRISP

|

Jerry este managerul de marketing la o mică firmă de design și publicitate pe internet. Șeful lui Jerry îi cere să dezvolte un set de date care să conțină informații despre utilizatorii de internet. Compania va folosi aceste date pentru … Citeşte mai mult

Tipuri de date folosite în mineritul datelor (Data Mining)

|

În esență, există două tipuri de date care pot fi extrase: operaționale și organizaționale. Cel mai elementar tip de date, datele operaționale, provin din sisteme tranzacționale care înregistrează activitățile de zi cu zi. Întâlnirile simple, cum ar fi cumpărarea de benzină, … Citeşte mai mult

Software utilizat în mineritul datelor (Data Mining)

|

Software și aplicații gratuite pentru mineritul datelor cu sursă deschisă Următoarele aplicații sunt disponibile sub licențe gratuite/open source. Accesul public la codul sursă al aplicației este, de asemenea, disponibil. Carrot2: cadru de grupare a textului și a rezultatelor căutării. Chemicalize.org: … Citeşte mai mult

1 2 3