Cu ceva timp în urmă am dat o listă cu articolele pe care le-am cumpărat de la Amazon în ultima lună. Se pare că am cumpărat două dintre acele articole pentru alți oameni. Am cumpărat cartea anticancer pentru vărul meu și cartea Rework pentru fiul meu. Pentru a vedea de ce aceasta este o problemă, permiteți-mi să vin cu un exemplu mai convingător, mergând mai departe în istoricul meu de achiziții. Am cumpărat niște greutăți pentru exerciții și cartea Enter the Kettlebell! Secret of the Soviet Supermen drept cadou pentru fiul meu, și un animal de pluș Chase Border Collie pentru soția mea, deoarece câinele nostru border collie de 14 ani a murit. Folosind istoricul achizițiilor ca o evaluare implicită a ceea ce îi place unei persoane, te-ar putea face să crezi că oamenilor cărora le plac greutățile, le plac animalele de pluș, cum ar fi microElicopterele, cărțile despre cancer și cartea Ready Player One. Istoricul achizițiilor Amazon nu poate face distincția între achizițiile pentru mine și achizițiile pe care le fac cadou. Stephen Baker descrie un exemplu înrudit:
Baker 2008.60-61:
”Să-ți dai seama că o anumită bluză albă este o ținută de afaceri pentru o femeie baby boomer este doar primul pas pentru computer. Sarcina mai importantă este să construiești un profil al cumpărătorului care cumpără acea bluză. Să zicem că este soția mea. Ea merge la Macy’s și cumpără patru sau cinci articole pentru ea însăși. Lenjerie, pantaloni, câteva bluze, poate o curea. Toate articolele se potrivesc profilului de boomer. Se concentrează. Apoi, la plecare, își amintește să cumpere un cadou de ziua de naștere pentru nepoata noastră de 16 ani. Ultima dată când am văzut-o, această fată purta haine negre, cu multe înscrisuri pe ea, majoritatea furioase. Ea ne-a spus că este un adept al stilului gotic. Așa că soția mea intră într-o secțiune „alternativă” și – la naiba – ia unul dintre acele zgarde de câine plină de vârfuri ascuțite.”
Dacă încercăm să construim un profil al unei persoane – ceea ce îi place unei anumite persoane – această achiziție de zgarda pentru câini este problematică.
În cele din urmă, luați în considerare un cuplu care partajează un cont Netflix. Îi plac filmele de acțiune cu multe explozii și elicoptere; îi plac filmele intelectuale și comediile romantice. Dacă ne uităm doar la istoricul vizionării, construim un profil ciudat al cuiva care îi plac două lucruri foarte diferite.
Amintiți-vă că am spus că achiziționarea cărții Anticancer: A New Way of Life a fost un cadou pentru vărul meu. Dacă mi-aș analiza puțin mai mult istoricul achizițiilor, am vedea că am cumpărat această carte înainte. De fapt, în ultimul an am cumpărat mai multe exemplare a trei cărți. Ne putem imagina că fac aceste achiziții multiple nu pentru că pierd cărțile sau că îmi pierd mințile și uit că am citit cărțile. Motivul cel mai rațional este că mi-au plăcut atât de mult cărțile încât, într-un fel, recomand aceste cărți altora, oferindu-le cadou. Astfel, putem obține o cantitate substanțială de informații din istoricul achizițiilor unei persoane.
Calistenia creierului: Ce putem folosi ca date implicite atunci când observăm comportamentul unei persoane la computer? Înainte de a întoarce pagina, veniți cu o listă de posibilități
Date implicite:
- Pagini web: clicul pe linkul către o pagină și timpul petrecut uitându-se la o pagină, vizite repetate, trimiterea unei pagini către alții, ce vizionează o persoană pe playerele Hulu
- Muzică: ce ascultă persoana sărind peste anumite melodii de câte ori apar acestea la rând
Acest lucru doar zgârie suprafața!
Rețineți că algoritmii descriși în capitolul 2 pot fi utilizați indiferent dacă datele sunt explicite sau implicite.
Sursa: Ron Zacharski, A Programmer’s Guide to Data Mining – The Ancient Art of the Numerati. Licența CC BY-NC 3.0. Traducere și adaptare: Nicolae Sfetcu
Lasă un răspuns