Măsurarea similitudinilor în mineritul datelor (Data Mining)

|

Iată câteva indicii utile: Dacă datele sunt rare, luați în considerare utilizarea similarității cosinusului. Dacă datele sunt supuse unei inflații de grad (utilizatorii diferiți pot folosi scale diferite) utilizați Pearson. Dacă datele sunt dense (aproape toate atributele au valori diferite … Citeşte mai mult

Data mining: Similaritatea cosinusoidală

|

Similaritatea cosinusoidală este o formulă foarte populară în mineritul de text, dar este utilizată și în filtrarea colaborativă. Pentru a vedea când putem folosi această formulă, să presupunem că îmi schimb ușor exemplul. Vom urmări de câte ori o persoană … Citeşte mai mult

Procesul de minerit a datelor (Data Mining)

|

Procesul de înțelegere a modelelor găsite în seturile mari de date este cunoscut sub numele de minerit de date. Unele dintre aspectele mineritului de date care au fost elucidate în secțiunea următoare sunt învățarea regulilor de asociere, analiza clusterelor, analiza … Citeşte mai mult

Mineritul datelor (Data Mining): Coeficientul de corelație Pearson

|

Mineritul datelor (Big Data): Coeficientul de corelație Pearson Să aruncăm o privire mai detaliată asupra evaluărilor utilizatorilor. Vedem că utilizatorii au comportamente foarte diferite atunci când vine vorba de evaluarea trupelor: Angelica Bill Chan Dan Hailey Jordyn Sam Veronica Blues … Citeşte mai mult

Data Mining: Reprezentarea datelor în Python

|

Matematica Atunci când vedeți astfel de formule într-o carte, aveți mai multe opțiuni. O opțiune este să treceți rapid peste ele. Cealaltă opțiune este să studiați cu atenție formula, și să o disecați. De multe ori veți găsi formula destul … Citeşte mai mult

Distanța în mineritul datelor (Data Mining)

|

Un avantaj al distanței Manhattan este că este rapid de calculat. Dacă suntem Facebook și încercăm să găsim cine dintre un milion de utilizatori este cel mai asemănător cu micuțul Danny din Kalamazoo, rapid este bine. Teorema lui Pitagora S-ar … Citeşte mai mult

Mineritul datelor (Data Mining): Filtrarea colaborativă pe baza recomandărilor

|

Îmi place ceea ce îți place Vom începe explorarea exploatării datelor prin analizarea sistemelor de recomandare. Sistemele de recomandare sunt peste tot – de la Amazon: la last.fm recomandând muzică sau concerte: În exemplul Amazon de mai sus, Amazon combină … Citeşte mai mult

Data Mining (Mineritul datelor) – Rezumat schematic

|

Ce este Data Mining? Termen inventat pentru confluența ideilor din statistici și informatică (învățare automată (Machine Learning) și metode de baze de date) aplicate bazelor de date mari (Big Data) din știință, inginerie și afaceri. Există multe definiții și multe … Citeşte mai mult

Mineritul de date (Data Mining) pe înțelesul tuturor

|

Imaginați-vă viața într-un mic oraș american acum 150 de ani. Toată lumea se cunoaște. O ladă cu țesături ajunge la magazinul general. Vânzătorul observă că modelul unei anumite pânze i-ar place foarte mult doamnei Clancey, deoarece știe că îi plac … Citeşte mai mult

Mineritul datelor (Data Mining) în afaceri

|

Mineritul datelor, procesul de descoperire a modelelor în seturi mari de date, este utilizat în multe aplicații. În afaceri, mineritul datelor este analiza activităților istorice ale afacerii, stocate ca date statice în bazele de date ale depozitului de date. Scopul … Citeşte mai mult

Probleme de confidențialitate, etică și drepturi de autor în mineritul datelor (Data Mining)

|

Probleme de confidențialitate și etică În timp ce termenul „mineritul de date” (data mining) în sine nu poate avea implicații etice, este adesea asociat cu extragerea informațiilor în legătură cu comportamentul oamenilor (etic și de altă natură). Modul în care … Citeşte mai mult

Data mining (Mineritul datelor)

|

Mineritul datelor (Data mining) este un proces de extragere și descoperire a modelelor în seturi mari de date care implică metode la intersecția sistemelor de învățare automată, statistici și baze de date. Mineritul datelor este un subdomeniu interdisciplinar al informaticii … Citeşte mai mult