Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Data mining » Filtrarea colaborativă în Data Mining – Evaluări implicite și filtrare bazată pe articole

Filtrarea colaborativă în Data Mining – Evaluări implicite și filtrare bazată pe articole

postat în: Data mining 0

Algoritmii sistemelor colaborative de filtrare și recomandare au un scop general și pot fi utilizați cu o varietate de date. Utilizatorii evaluează diferite articole pe o scară de cinci sau zece puncte, iar algoritmii găsesc alți utilizatori care au avut evaluări similare. Există unele dovezi care sugerează că utilizatorii nu folosesc de obicei această distincție fină și tind, în schimb, să acorde fie evaluarea superioară, fie cea mai scăzută. Această strategie de evaluare „totul sau nimic” poate duce uneori la rezultate inutilizabile. Aici vom examina modalități de a ajusta filtrarea colaborativă pentru a produce recomandări mai precise într-un mod eficient.

Evaluări explicite

O modalitate de a distinge tipurile de preferințe ale utilizatorului este dacă acestea sunt explicite sau implicite. Evaluările explicite sunt atunci când utilizatorul însăși evaluează în mod explicit articolul. Un exemplu în acest sens este evaluarea „degetul în sus/degetul în jos” pe site-uri precum Pandora și YouTube.

YouTube - Evaluare

Și sistemul cu stele al Amazon:

Amazon - Principia - Evaluare

Evaluări implicite

Pentru evaluările implicite, nu le cerem utilizatorilor să acorde evaluări, ci doar le observăm comportamentul. Un exemplu în acest sens este urmărirea unde face clic un utilizator în New York Times online.

După ce ați observat pe ce face clic un utilizator timp de câteva săptămâni, vă puteți imagina că am putea dezvolta un profil rezonabil al utilizatorului respectiv — nu-i place sportul, dar pare să-i placă știrile despre tehnologie. Dacă utilizatorul dă clic pe articolul „Cea mai rapidă modalitate de a pierde în greutate descoperită de formatorii profesioniști” și pe articolul „Încet și constant: cum să slăbești și să nu renunți”, poate că dorește să slăbească. Dacă dă clic pe reclama pentru iPhone, poate că are un interes pentru acel produs. (Apropo, termenul folosit atunci când un utilizator face clic pe un anunț se numește „clic pe” (”click through”).)

Luați în considerare ce informații putem obține din înregistrarea produselor pe care face clic un utilizator în Amazon. Pe prima pagină personalizată Amazon sunt afișate aceste informații:

În acest exemplu, Amazon ține evidența pe care fac clic oamenii. Știe, de exemplu, că oamenii care au văzut cartea Jupiter’s Travels: Four years around the world on a Triumph au vizionat și DVD-ul Long Way Round, care îl prezintă pe actorul Ewan McGregor în timp ce călătorește cu partenerul său în jurul lumii pe motociclete. După cum se poate vedea în captura de ecran Amazon de mai sus, aceste informații sunt folosite pentru a afișa articolele din secțiunea „Clienții care au văzut acest lucru au văzut și ei”.

Un alt rating implicit este ceea ce cumpără de fapt clientul. De asemenea, Amazon ține evidența acestor informații și le folosește pentru recomandările sale „Produse populare inspirate de acest articol” și „Best Sellers in Books”:

Amazon - More

Ai crede că „Cumparate frecvent împreună” ar duce la câteva recomandări neobișnuite, dar acest lucru funcționează surprinzător de bine.

Imaginați-vă ce informații poate obține un program prin monitorizarea comportamentului dvs. în iTunes.

Nume Durata Artist Ascultări
Anchor 3:24 Zee Avi 52
My Companjera 3:22 Gogol Bordello 27
Wake Up Everybody 4:25 John Legend & the… 17
Milestone Moon 3:40 Zee Avi 17

În primul rând, este faptul că am adăugat o melodie pe iTunes. Asta indică minim că am fost suficient de interesat de cântec pentru a face acest lucru. Apoi există informațiile Play Count (număr de ascultări). În imaginea de mai sus, am ascultat „Anchor” al lui Zee Avi de 52 de ori. Asta sugerează că îmi place cântecul (și de fapt îmi place). Dacă am o melodie în bibliotecă de ceva vreme și am ascultat-o ​​doar o singură dată, asta ar putea spune că nu-mi place melodia.

Exercițiu mental

  • Credeți că este mai corect ca un utilizator să acorde în mod explicit o evaluare unui articol?
  • Sau credeți cp vizionarea a ceea ce cumpără sau face un utilizator (de exemplu, numărul de ascultări) este o evaluare mai precisă a ceea ce îi place unui individ?

Exemplu de evaluare explicită: Biografia pe match.com

  • Sunt vegan. Îmi place un Cabernet Sauvignon rafinat, plimbări lungi în pădure, citind Chekov lângă foc, filme franceze, sâmbăta la muzeul de artă și lucrări la pian de Schumann.

Exemplu de evaluare implicită: Ce am găsit în buzunarul lui Jim

  • Chitanțe pentru set de 12 beri Pabst Blue Ribbon, Whataburger, înghețată Ben și Jerrys, pizza și gogoși. Chitanțe de închiriere DVD: Marvels The Avengers, Resident Evil: Retribution, Ong Bak 3

Sursa: Ron Zacharski, A Programmer’s Guide to Data Mining – The Ancient Art of the Numerati. Licența CC BY-NC 3.0. Traducere și adaptare: Nicolae Sfetcu

Articol oferit sub licență CC BY-NC 3.0

Introducere în Business Intelligence
Introducere în Business Intelligence

Colecția ȘTIINȚA INFORMAȚIEI ”Introducere în Business Intelligence” oferă cititorilor informații cuprinzătoare despre business intelligence, explorând toate aspectele importante ale inteligenței de afaceri în scenariul actual. Subiectele tratate se referă la abordările de bază ale business intelligence. Cartea își propune să … Citeşte mai mult

Nu a fost votat 2.924.69 Selectează opțiunile
Introducere în inteligența artificială
Introducere în inteligența artificială

Inteligența artificială s-a dezvoltat exploziv în ultimii ani, facilitând luarea deciziilor inteligente și automate în cadrul scenariilor de implementare. Inteligența artificială se referă la un ecosistem de modele și tehnologii pentru percepție, raționament, interacțiune și învățare.  Asistăm la o convergență … Citeşte mai mult

Nu a fost votat 2.924.95 Selectează opțiunile
Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat 2.9211.72 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.