Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Big Data în afaceri vs. în cercetarea științifică

Big Data în afaceri vs. în cercetarea științifică

Dacă combinăm constatările noastre despre tipurile de modele de afaceri (utilizatori de date, facilitatori și furnizori) cu provocările pe care le-am subliniat, este clar că cei care urmăresc modelele de faceri cu big data vor avea blocaje destul de diferite în avansarea strategică: calitatea datelor le afectează pe toate trei, dar soluționarea acestei probleme poate fi costisitoare pentru furnizori, poate determina utilizatorii să reducă sau să ia în considerare fiabilitatea datelor și determină facilitatorii să caute cele mai bune surse disponibile. În mod similar, dacă ne gândim la context, metadate și proveniență: furnizorii vor avea un stimulent puternic să furnizeze date mai bine organizate, în timp ce utilizatorii se vor baza pe cele mai bine organizate date, iar furnizorii vor trebui să suporte costurile substanțiale ale acestei organizații mai bune. Politica organizațională este esențială pentru utilizatori doar dacă are o influență directă asupra fiabilității, în timp ce furnizorii vor trebui să pună în aplicare mecanisme prin care să permită accesul doar care să-și mențină avantajul competitiv, în timp ce facilitatorii au nevoie de mecanisme astfel încât serviciile lor să poată pune în legătură datele. surse și abilități cu cei pentru care sunt utile. Această rețea complexă de dependențe este obligată să se cristalizeze în următorii ani, dar companiile trebuie să se întrebe cum sunt plasate pentru a depăși aceste provocări, având în vedere că tipul de model de afaceri pe care îl urmăresc este în mod sigur determinat de capacitățile sale și resurse.

Calitatea datelor indică, de asemenea, o tensiune emergentă care este legată de modelele de afaceri, dar ne duce dincolo de acestea. Savage și Burrows (2007, 2009) (a se vedea și Kitchin, 2014) au subliniat cu ceva timp în urmă că accesul la date mari oferă un avantaj pentru sectorul privat, care adesea nu este disponibil pentru specialiştii în științe sociale (deși Wikipedia este un contraexemplu important). Deși aceasta este o dezbatere în desfășurare, este, de asemenea, important să recunoaștem că big data în cercetarea academică este diferită de big data din sectorul privat. O definiție a megadatelor (Schroeder, 2014; vezi și Cowls & Schroeder, 2015) poate fi oferită pentru cercetarea științifică și se referă la modul în care datele sunt o sursă pentru validitatea cunoștințelor. Cu toate acestea, big data pentru scopuri comerciale (și într-adevăr în scopuri în afara cunoștințelor științifice) este o chestiune diferită: de ex. noile capacități de predicție pe care un număr dintre intervievați le-au discutat ca o caracteristică cheie a abordărilor de date mari nu necesită validitate științifică (dacă, pe baza datelor de geolocalizare, cineva este indus în eroare la magazinul greșit care oferă reduceri sau dacă predicția că aș dori cumpărarea unei cărți pe Amazon este greșită – acestea sunt erori care pot să nu conteze pentru a putea îmbunătăți vânzările, deși ar fi inacceptabile pentru publicarea academică). Deși, în unele cazuri, vor exista drepturi juridice sau însoțitoare de drepturi ale consumatorilor la predicțiile înșelătoare (Pasquale, 2015), acestea nu sunt aceleași probleme ca și cu datele mari pentru validitatea științifică, care pot avea puține sau deloc implicații legale sau de drepturi în unele cazuri (de ex. ca și în cazul analizei Wikipedia). Există unele cazuri în care sunt implicate astfel de probleme — din nou, studiul de contagiune pe Facebook oferă un exemplu pe scară largă — dar aici problema este când compania ar putea folosi aceste cunoștințe pentru a-și manipula utilizatorii, în timp ce problema validității științifice. al studiului (din nou) este separată. Acest lucru implică, de asemenea, că problemele privind calitatea datelor menționate de intervievați se suprapun doar parțial cu aspectele legate de calitatea datelor în cazul cercetării academice. Un alt exemplu aici este Twitter, unde accesul sau accesul limitat la modul în care sunt colectate datele reprezintă o problemă pentru cercetarea în științe sociale (Gonzalez-Baildn, Wang, Rivero, Borge-Holthoefer și Moreno, 2014). Cu toate acestea, analiza acelorași date în scopuri de marketing, de exemplu, nu necesită aceleași standarde de valabilitate, chiar dacă, bineînțeles, companiile de marketing doresc ca analiza lor să fie cât mai exactă posibil.

Cu alte cuvinte, deși câțiva dintre intervievați au ridicat problema calității datelor și a înțelegerii contextului datelor, acestea sunt probleme practice separate de problemele științifice și, de asemenea, se suprapun doar parțial cu problemele de reglementare care decurg din datele inexacte. Prin urmare, discuțiile despre validitatea cunoștințelor bazate pe megadate (Boyd & Crawford, 2012) și despre necesitatea unei reglementări mai mari (Pasquale, 2015) pot suferi de o diferențiere insuficientă între tipurile de surse de date, utilizările și scopurile acestora (de exemplu, contribuind la cunoștințe științifice sau care contribuie la creșterea vânzărilor). Valoarea datelor este din ce în ce mai mult recunoscută ca un activ, indiferent dacă datele sunt proprietare sau publice (caz în care este probabil să necesite curățare sau punerea în formate adecvate pentru analiză). Această valoare ridică, de asemenea, noi probleme pentru afaceri: printre principalele identificate până acum se numără calitatea analizelor (a se vedea la acest punct Cowls & Schroeder, 2015) sau faptul că sunt luate decizii pe baza naturii „cutiei negre” pe care se face analiza (Pasquale, 2015), putând afecta negativ clienții și factorii de decizie.

O problemă suplimentară, totuși, sunt pur și simplu sursele datelor: dacă sunt utilizate date publice sau date colectate de la public, este nevoie de medii de reglementare în care aceste utilizări să aibă loc, astfel încât rezultatele să fie considerate ca fiind benefice pentru cei care furnizează datele. Acestea ar putea fi state, ai căror contribuabili furnizează date deschise, sau companii care oferă servicii gratuite în schimbul clienților care furnizează date, sau state și furnizori de servicii (state sociale sau companii de asigurări) care au nevoie de date pentru a furniza servicii. În toate aceste cazuri, mai mulți actori se angajează în analize cost-beneficiu mai complexe, care necesită medii instituționale care să facă aceste analize previzibile și transparente.

În sfârșit, în ceea ce privește rolul guvernului, acesta este, desigur, un utilizator de date, dar în principal un furnizor (vezi Reimsbach-Kounatze, 2015), și astfel rolul său poate beneficia doar de alți utilizatori și facilitatori și furnizori. În același timp, guvernul are, de asemenea, nevoie de date din sectorul privat pentru a permite elaborarea de politici în cunoștință de cauză. Prin urmare, coerența și incoerența în mediul de reglementare și juridic în ceea ce privește datele devine o problemă critică și necesită urgent atenția factorilor de decizie. Deși acesta este un subiect amplu, se poate menționa că există, desigur, o literatură în plină dezvoltare privind legile despre confidențialitatea dincolo de granițe în legătură cu protejarea datelor (Greenleaf, 2012, 2013; vezi și Rule, 2007). Importanța legii și a politicii ridică un aspect care a fost evidențiat mai devreme în această lucrare, și anume că, deși o tipologie a modelelor de afaceri cu megadate și implicațiile acesteia pot fi de interes în principal pentru cei din studii de management și afaceri, subiectul nu poate fi limitat la aceste discipline: trebuie să țină seama de aspectele legale și de reglementare și acoperă, de asemenea, întrebări privind metodele și natura cunoștințelor din știința socială academică, și în continuare problema mai largă a modului în care cunoștințele din afara universității sunt aplicate în diferite contexte.

Prin urmare, în final, există o tensiune care reiese din interviuri, care nu a fost evidentă pentru cei intervievați înșiși, dar care nici până acum nu a fost evidentă în literatura despre big data și implicațiile sale sociale: multe dintre modelele de afaceri se bazează, cel puțin parțial, pe seturi de date deschise, iar preocuparea principală a persoanelor intervievate a fost aceea că guvernele ar trebui să permită utilizarea seturilor de date private și publice prin furnizarea de cadre de reglementare sau juridice care să asigure utilizarea maximă productivă a surselor de date. În societate în general, pe de altă parte, există preocupări tot mai mari cu privire la utilizarea megadatelor, poate declanșate de probleme care au prea puțin de-a face cu datele mari (Wikileaks, revelațiile Snowden). Principalele preocupări în discuțiile publice sunt legate de utilizarea megadatelor în cercetarea rețelelor sociale, care este una dintre principalele surse noi de date, în special în cercetarea academică (din nou, studiul Facebook al contagiunii sociale a fost cel mai mult discutat) – deși este un mic subset al datelor. Astfel, ajungem la o tensiune legată de modelele de afaceri de megadate, în măsura în care aceste preocupări mai largi și soluția lor potențială domină discuțiile publice, dar se suprapun doar într-o măsură limitată cu sursele de date pe care le-am discutat aici. Big Data care utilizează rețelele sociale este doar una dintre sursele de date care au fost discutate aici. Datele, în afară de datele din rețelele sociale, formează, de asemenea, cea mai mare parte a datelor din modelele de afaceri și a datelor pe care guvernele doresc să le pună la dispoziție. În plus, există un al treilea tip de date care nu sunt obținute din rețelele sociale și nici date guvernamentale deschise: datele proprietare deținute în cadrul firmelor, și acestea sunt de obicei date pe care se bazează cele trei modele descrise (deși de obicei în combinație cu datele deschise promovate de guvern). Trebuie remarcat faptul că folosim date deschise aici pentru a desemna date disponibile public, colectate de obicei de guverne. Nu ne referim la date căutate de societatea civilă pentru o mai mare transparență.

Spațiul din diagrama Venn în care se suprapun aceste trei tipuri de date (date din rețelele sociale, date deschise promovate de guvern și date proprietare) este mic, dar cu excepția cazului în care aceste surse de date diferite, și în special utilizările și implicațiile lor, nu sunt dezlegate, nici comunitatea de afaceri și nici publicul nu sunt probabil mulțumiți, guvernul fiind prins în mijlocul diferitelor discursuri și incapabil să reconcilieze cererile care combină o serie de surse de date și politici cu privire la modul în care ar putea fi asigurată confidențialitatea în legătură cu acestea. Este posibil ca aceste tensiuni să afecteze viitorul modelelor de afaceri cu megadate. Cum pot fi rezolvate rămâne o întrebare deschisă.

Sursa: Ralph Schroeder (2016) Big data business models: Challenges and opportunities, Cogent Social Sciences, 2:1, 1166924, DOI: 10.1080/23311886.2016.1166924, licența CC BY 4.0. Traducere și adaptare de Nicolae Sfetcu

Introducere în inteligența artificială
Introducere în inteligența artificială

Pășește în era digitală pregătit să înțelegi și să aplici conceptele care schimbă lumea!

Nu a fost votat 14.45 lei25.32 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat 0.00 lei11.36 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Transformă-ți perspectiva asupra tehnologiei blockchain și începe să descoperi oportunitățile digitale de mâine!

Nu a fost votat 24.11 lei57.94 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *