Mineritul datelor: Reducerea atributelor cu RapidMiner

|

În multe seturi de date, veți descoperi că unele atribute sunt pur și simplu irelevante pentru a răspunde la o anumită întrebare. În capitolul 4 vom discuta despre metodele de evaluare a corelației sau a puterii relațiilor dintre atributele date. În … Citeşte mai mult

Manipularea datelor inconsistente în mineritul datelor (Data Mining) cu RapidMiner

|

Datele inconsecvente sunt diferite de datele lipsă. Datele inconsecvente apar atunci când o valoare există, dar acea valoare nu este validă sau semnificativă. Referiți-vă la Figura 3-25; o versiune de aproape a acelei imagini este prezentată aici ca Figura 3-29. … Citeşte mai mult

Reducerea datelor în mineritul datelor (Data Mining) cu RapidMiner

|

Următorul set de pași vă va învăța să reduceți numărul de observații din setul de date prin procesul de filtrare. 1) În caseta de căutare din fila Operators, tastați cuvântul „filter”. Acest lucru vă va ajuta să găsiți operatorul „Filter … Citeşte mai mult

RapidMiner pentru mineritul datelor (Data Mining): Importarea datelor și gestionarea datelor lipsă

|

Prima noastră sarcină în pregătirea datelor este să gestionăm datele lipsă; totuși, deoarece aceasta va fi prima dată când folosim RapidMiner, primii câțiva pași vor implica configurarea RapidMiner. Apoi vom trece direct în gestionarea datelor lipsă. Datele lipsă sunt date care … Citeşte mai mult

Pregătirea datelor pentru minerit cu RapidMiner: Colaționarea datelor

|

COLAŢIONARE Să presupunem că baza de date care stă la baza sondajului pe Internet al lui Jerry este proiectată așa cum este descris în captura de ecran din LibreOffice Base din Figura 3-1.  Figura 3-1: O bază de date relațională … Citeşte mai mult