Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Data mining » Probleme cu evaluările explicite în mineritul de date (Data Mining)

Probleme cu evaluările explicite în mineritul de date (Data Mining)

Problema 1: Oamenii sunt leneși și nu evaluează articolele

În primul rând, utilizatorii nu se vor deranja să evalueze articolele. Îmi imaginez că majoritatea dintre voi ați cumpărat o cantitate substanțială de lucruri de pe Amazon. Știu asta pentru că și eu am cumpărat. În ultima lună am cumpărat un microHelicopter, un hard disk de 1 TB, un convertor USB-SATA, o grămadă de vitamine, două cărți Kindle și două cărți tipărite. Adică douăsprezece articole. Câte am evaluat? Zero. Îmi imaginez că majoritatea dintre voi sunteți la fel. Nu evaluați articolele pe care le cumpărați.

Am o problemă la genunchi. Îmi place să fac drumeții în munți și, în consecință, dețin o serie de bețe de drumeție, inclusiv unele ieftine pe care le-am cumpărat de pe Amazon, pe care le-am folosit mult. Anul trecut am zburat la Austin pentru festivalul de muzică Austin City Limits, de trei zile. Mi-am agravat accidentarea la genunchi, alergând de la un zbor la altul și am ajuns să merg la REI să cumpăr un băț de drumeție cu marca REI oarecum scump. S-a rupt în mai puțin de o zi de mers pe iarba plată într-un parc al orașului. Am deci niște bețe 10 USD care nu se rup în timpul utilizării constante în drumețiile în Munții Stâncoși, iar acest model scump s-a rupt pe teren plat. La momentul festivalului, pe când eram încă supărat, am plănuit să evaluez și să scriu o recenzie a bățului pe site-ul REI. Am făcut-o? Nu, sunt prea leneș. Deci, chiar și în acest caz extrem, nu am evaluat articolul. Cred că există o mulțime de leneși ca mine. Oamenii, în general, sunt prea leneși sau nemotivați să evalueze produsele.

Problema 2: Oamenii pot minți sau pot oferi doar informații parțiale

Să presupunem că cineva trece peste lenea inițială și evaluează de fapt un produs. Acea persoană poate minți. Poate minți direct, oferind evaluări inexacte sau poate minți prin omisiune, oferind doar informații parțiale. Ben are o primă întâlnire cu Ann pentru a vedea câștigătorul Festivalului de Film de la Cannes 2010, un film thailandez, Uncle Boonmee Who Can Recall His Past Lives. Ei merg cu prietenul lui Ben, Dan, și cu prietena lui Dan, Clara. Ben crede că a fost cel mai prost film pe care l-a văzut vreodată. Tuturor celorlalți le-a plăcut absolut și s-au contrazis despre asta după vizionare, la restaurant. Nu ar fi surprinzător dacă Ben ar crește punctajul evaluării sale a filmului pe site-urile de evaluare online pe care prietenii săi le-ar putea vedea, sau pur și simplu e posibil să nu evalueze filmul.

Problema 3: Oamenii nu își actualizează evaluările

Să presupunem că sunt motivat în scrierea acestui articol să evaluez achizițiile mele pe Amazon. Acel hard disk de 1 TB funcționează bine – este foarte rapid și, de asemenea, foarte silențios. Îi acord cinci stele. Acel microHelicopter este grozav. Zboară ușor și este foarte distractiv și a supraviețuit mai multor accidente. Îl notez cu cinci stele. Trece o lună. Hard disk-ul moare și, în consecință, pierd toate filmele și muzica descărcate – o dezamăgire majoră. MicroHelicopterul se oprește brusc să mai funcționeze – se pare că motorul s-a ars. Acum cred că ambele produse sunt proaste. Sunt șanse destul de mari să nu merg pe Amazon și să-mi actualizez evaluările (lenea, din nou). Oamenii încă mai cred că le-aș evalua pe ambele cu 5 stele.

Luați în considerare pe Mary, o studentă. Din anumite motive, îi place să facă evaluări pe Amazon. În urmă cu zece ani, ea și-a evaluat albumele muzicale preferate cu cinci stele: Giggling and Laughing: Silly Songs for Kids și Sesame Songs: Sing Yourself Silly! Cele mai recente evaluări ale ei au inclus 5 stele pentru Wolfgang Amadeus Phoenix și The Twilight Saga: Eclipse Soundtrack. Pe baza acestor evaluări recente, ea ajunge să fie cea mai apropiată vecină de o altă studentă, Jen. Ar fi ciudat să-i recomand lui Jen Giggling and Laughing: Silly Songs for Kids. Acesta este un tip de problemă de actualizare puțin diferit față de cel de mai sus, dar o problemă totuși.

Sursa: Ron Zacharski, A Programmer’s Guide to Data Mining – The Ancient Art of the Numerati. Licența CC BY-NC 3.0. Traducere și adaptare: Nicolae Sfetcu

Articol oferit sub licență CC BY-NC 3.0

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat $2,99$11,99 Selectează opțiunile
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0,00$2,35 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.