Algoritmii sistemelor colaborative de filtrare și recomandare au un scop general și pot fi utilizați cu o varietate de date. Utilizatorii evaluează diferite articole pe o scară de cinci sau zece puncte, iar algoritmii găsesc alți utilizatori care au avut evaluări similare. Există unele dovezi care sugerează că utilizatorii nu folosesc de obicei această distincție fină și tind, în schimb, să acorde fie evaluarea superioară, fie cea mai scăzută. Această strategie de evaluare „totul sau nimic” poate duce uneori la rezultate inutilizabile. Aici vom examina modalități de a ajusta filtrarea colaborativă pentru a produce recomandări mai precise într-un mod eficient.
Evaluări explicite
O modalitate de a distinge tipurile de preferințe ale utilizatorului este dacă acestea sunt explicite sau implicite. Evaluările explicite sunt atunci când utilizatorul însăși evaluează în mod explicit articolul. Un exemplu în acest sens este evaluarea „degetul în sus/degetul în jos” pe site-uri precum Pandora și YouTube.
Și sistemul cu stele al Amazon:
Evaluări implicite
Pentru evaluările implicite, nu le cerem utilizatorilor să acorde evaluări, ci doar le observăm comportamentul. Un exemplu în acest sens este urmărirea unde face clic un utilizator în New York Times online.
După ce ați observat pe ce face clic un utilizator timp de câteva săptămâni, vă puteți imagina că am putea dezvolta un profil rezonabil al utilizatorului respectiv — nu-i place sportul, dar pare să-i placă știrile despre tehnologie. Dacă utilizatorul dă clic pe articolul „Cea mai rapidă modalitate de a pierde în greutate descoperită de formatorii profesioniști” și pe articolul „Încet și constant: cum să slăbești și să nu renunți”, poate că dorește să slăbească. Dacă dă clic pe reclama pentru iPhone, poate că are un interes pentru acel produs. (Apropo, termenul folosit atunci când un utilizator face clic pe un anunț se numește „clic pe” (”click through”).)
Luați în considerare ce informații putem obține din înregistrarea produselor pe care face clic un utilizator în Amazon. Pe prima pagină personalizată Amazon sunt afișate aceste informații:
În acest exemplu, Amazon ține evidența pe care fac clic oamenii. Știe, de exemplu, că oamenii care au văzut cartea Jupiter’s Travels: Four years around the world on a Triumph au vizionat și DVD-ul Long Way Round, care îl prezintă pe actorul Ewan McGregor în timp ce călătorește cu partenerul său în jurul lumii pe motociclete. După cum se poate vedea în captura de ecran Amazon de mai sus, aceste informații sunt folosite pentru a afișa articolele din secțiunea „Clienții care au văzut acest lucru au văzut și ei”.
Un alt rating implicit este ceea ce cumpără de fapt clientul. De asemenea, Amazon ține evidența acestor informații și le folosește pentru recomandările sale „Produse populare inspirate de acest articol” și „Best Sellers in Books”:
Ai crede că „Cumparate frecvent împreună” ar duce la câteva recomandări neobișnuite, dar acest lucru funcționează surprinzător de bine.
Imaginați-vă ce informații poate obține un program prin monitorizarea comportamentului dvs. în iTunes.
Nume | Durata | Artist | Ascultări |
Anchor | 3:24 | Zee Avi | 52 |
My Companjera | 3:22 | Gogol Bordello | 27 |
Wake Up Everybody | 4:25 | John Legend & the… | 17 |
Milestone Moon | 3:40 | Zee Avi | 17 |
În primul rând, este faptul că am adăugat o melodie pe iTunes. Asta indică minim că am fost suficient de interesat de cântec pentru a face acest lucru. Apoi există informațiile Play Count (număr de ascultări). În imaginea de mai sus, am ascultat „Anchor” al lui Zee Avi de 52 de ori. Asta sugerează că îmi place cântecul (și de fapt îmi place). Dacă am o melodie în bibliotecă de ceva vreme și am ascultat-o doar o singură dată, asta ar putea spune că nu-mi place melodia.
Exercițiu mental
- Credeți că este mai corect ca un utilizator să acorde în mod explicit o evaluare unui articol?
- Sau credeți cp vizionarea a ceea ce cumpără sau face un utilizator (de exemplu, numărul de ascultări) este o evaluare mai precisă a ceea ce îi place unui individ?
Exemplu de evaluare explicită: Biografia pe match.com
- Sunt vegan. Îmi place un Cabernet Sauvignon rafinat, plimbări lungi în pădure, citind Chekov lângă foc, filme franceze, sâmbăta la muzeul de artă și lucrări la pian de Schumann.
Exemplu de evaluare implicită: Ce am găsit în buzunarul lui Jim
- Chitanțe pentru set de 12 beri Pabst Blue Ribbon, Whataburger, înghețată Ben și Jerrys, pizza și gogoși. Chitanțe de închiriere DVD: Marvels The Avengers, Resident Evil: Retribution, Ong Bak 3
Sursa: Ron Zacharski, A Programmer’s Guide to Data Mining – The Ancient Art of the Numerati. Licența CC BY-NC 3.0. Traducere și adaptare: Nicolae Sfetcu
Articol oferit sub licență CC BY-NC 3.0
Lasă un răspuns