RapidMiner pentru mineritul datelor (Data Mining): Importarea datelor și gestionarea datelor lipsă

|

Prima noastră sarcină în pregătirea datelor este să gestionăm datele lipsă; totuși, deoarece aceasta va fi prima dată când folosim RapidMiner, primii câțiva pași vor implica configurarea RapidMiner. Apoi vom trece direct în gestionarea datelor lipsă. Datele lipsă sunt date care … Citeşte mai mult

Pregătirea datelor pentru minerit cu RapidMiner: Colaționarea datelor

|

COLAŢIONARE Să presupunem că baza de date care stă la baza sondajului pe Internet al lui Jerry este proiectată așa cum este descris în captura de ecran din LibreOffice Base din Figura 3-1.  Figura 3-1: O bază de date relațională … Citeşte mai mult

Tipuri de date folosite în mineritul datelor (Data Mining)

|

În esență, există două tipuri de date care pot fi extrase: operaționale și organizaționale. Cel mai elementar tip de date, datele operaționale, provin din sisteme tranzacționale care înregistrează activitățile de zi cu zi. Întâlnirile simple, cum ar fi cumpărarea de benzină, … Citeşte mai mult

Organizarea datelor în mineritul datelor

|

Luați în considerare câteva dintre activitățile în care ați fost implicat în ultimele trei sau patru zile. Ați cumpărat produse alimentare sau benzină? Ați participat la un concert, film sau alt eveniment public? Poate ați ieșit să mâncați la un … Citeşte mai mult

Evaluarea și implementarea mineritului datelor cu CRISP-DM

|

(RapidMiner) CRISP-DM Pasul 5: Evaluarea Toate analizele datelor au potențialul de fals pozitive. Chiar dacă un model nu dă rezultate false pozitive, este posibil ca modelul să nu găsească modele interesante în datele dvs. Acest lucru se poate datora faptului … Citeşte mai mult

Software utilizat în mineritul datelor (Data Mining)

|

Software și aplicații gratuite pentru mineritul datelor cu sursă deschisă Următoarele aplicații sunt disponibile sub licențe gratuite/open source. Accesul public la codul sursă al aplicației este, de asemenea, disponibil. Carrot2: cadru de grupare a textului și a rezultatelor căutării. Chemicalize.org: … Citeşte mai mult

Mineritul datelor (Data Mining): CRISP-DM – Înțelegerea datelor

|

Ca și în cazul înțelegerii organizaționale, înțelegerea datelor este o activitate pregătitoare și, uneori, valoarea sa este neglijată. Nu lăsați să-și piardă valoarea! Cu ani în urmă, când lucrătorii nu aveau propriul lor computer (sau mai multe computere) stând la … Citeşte mai mult

Situația drepturilor de autor în mineritul datelor în Europa și SUA

|

Situația în Europa Din cauza lipsei de flexibilitate în legislația europeană a drepturilor de autor și a bazelor de date, mineritul datelor cu drepturi de autor, cum ar fi mineritul web, fără permisiunea proprietarului drepturilor de autor, nu este legală. … Citeşte mai mult

Probleme cu evaluările implicite în mineritul datelor (Data Mining)

|

Într-un articol anterior am dat o listă cu articolele pe care le-am cumpărat de la Amazon în ultima lună. Se pare că am cumpărat două dintre acele articole pentru alte persoane. Am cumpărat un microelicopter și cartea Ready Player One … Citeşte mai mult

Mineritul datelor (Data Mining) în cercetare. Confidențialitatea și etica.

|

Cercetare Cel mai important organism profesional în domeniu este Grupul de interes special (SIG) al Asociației pentru Mașini de Calcul (ACM) pentru descoperirea cunoștințelor și extragerea datelor (SIGKDD). Din 1989, acest ACM SIG a găzduit o conferință internațională anuală și și-a … Citeşte mai mult

Măsurarea similitudinilor în mineritul datelor (Data Mining)

|

Iată câteva indicii utile: Dacă datele sunt rare, luați în considerare utilizarea similarității cosinusului. Dacă datele sunt supuse unei inflații de grad (utilizatorii diferiți pot folosi scale diferite) utilizați Pearson. Dacă datele sunt dense (aproape toate atributele au valori diferite … Citeşte mai mult

Procesul de minerit a datelor (Data Mining)

|

Procesul de înțelegere a modelelor găsite în seturile mari de date este cunoscut sub numele de minerit de date. Unele dintre aspectele mineritului de date care au fost elucidate în secțiunea următoare sunt învățarea regulilor de asociere, analiza clusterelor, analiza … Citeşte mai mult

1 2