Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Probleme de confidențialitate, etică și drepturi de autor în mineritul datelor (Data Mining)

Probleme de confidențialitate, etică și drepturi de autor în mineritul datelor (Data Mining)

Probleme de confidențialitate și etică

În timp ce termenul „mineritul de date” (data mining) în sine nu poate avea implicații etice, este adesea asociat cu extragerea informațiilor în legătură cu comportamentul oamenilor (etic și de altă natură).

Modul în care poate fi utilizată extragerea datelor poate, în unele cazuri și contexte, să ridice întrebări cu privire la confidențialitate, legalitate și etică. În special, seturile de date guvernamentale sau comerciale privind exploatarea datelor în scopuri de securitate națională sau de aplicare a legii, cum ar fi în Total Information Awareness Program sau în ADVISE, au ridicat probleme de confidențialitate.

Mineritul datelor necesită pregătirea datelor care descoperă informații sau modele care compromit confidențialitatea și obligațiile de intimitate. O modalitate obișnuită de a se produce acest lucru este prin agregarea datelor. Agregarea datelor implică combinarea datelor împreună (posibil din diverse surse) într-un mod care facilitează analiza (dar care ar putea face, de asemenea, identificarea datelor private la nivel individual deductibile sau altfel evidente). Nu este vorba de extragerea datelor în sine, ci de un rezultat al pregătirii datelor înainte – și în scopul – analizei. Amenințarea la adresa confidențialității unei persoane intră în joc atunci când datele, odată compilate, determină minerul de date sau oricine are acces la setul de date nou compilat, să poată identifica anumite persoane, mai ales atunci când datele erau inițial anonime.

Se recomandă să se stabilească următoarele înainte de colectarea datelor:

  • Scopul colectării datelor și al oricăror proiecte (cunoscute) de extragere a datelor;
  • Cum vor fi utilizate datele;
  • Cine va putea extrage datele și utiliza datele și instrumentele derivate ale acestora;
  • Starea securității în jurul accesului la date;
  • Cum pot fi actualizate datele colectate.

Datele pot fi, de asemenea, modificate astfel încât să devină anonime, astfel încât persoanele să nu fie ușor identificate. Cu toate acestea, chiar și seturile de date „anonimizate” pot conține suficiente informații pentru a permite identificarea indivizilor, așa cum s-a întâmplat atunci când jurnaliștii au putut găsi mai mulți indivizi pe baza unui set de istorii de căutare care au fost publicate în mod neintenționat de AOL.

Dezvăluirea accidentală a informațiilor de identificare personală care duc la furnizor încalcă practicile de informare echitabile. Această indiscreție poate provoca vătămări financiare, emoționale sau corporale persoanei indicate. Într-un caz de încălcare a confidențialității, patronii Walgreens au intentat un proces împotriva companiei în 2011 pentru vânzarea de informații despre rețete companiilor de minerit de date care, la rândul lor, au furnizat datele companiilor farmaceutice.

Situația în Europa

Europa are legi cu privire la confidențialitate destul de puternice și sunt în curs eforturi pentru a consolida în continuare drepturile consumatorilor. Cu toate acestea, Principiile Safe Harbor SUA – E.U., dezvoltate între 1998 și 2000, expun în mod eficient utilizatorii europeni la exploatarea confidențialității de către companiile americane. Ca o consecință a dezvăluirii supravegherii globale a lui Edward Snowden, au existat discuții sporite pentru revocarea acestui acord, deoarece, în special, datele vor fi pe deplin expuse Agenției Naționale de Securitate și încercările de a ajunge la un acord cu Statele Unite au eșuat.

În Regatul Unit, în special, au existat cazuri de corporații care foloseau mineritul datelor ca o modalitate de a viza anumite grupuri de clienți, obligându-i să plătească prețuri nedrept de ridicate. Aceste grupuri tind să fie persoane cu un statut socio-economic mai scăzut, care nu sunt pricepuți la modul în care pot fi exploatați pe piețele digitale.

Situația din Statele Unite

În Statele Unite, Congresul SUA a abordat problemele legate de confidențialitate prin adoptarea unor controale de reglementare, cum ar fi Legea privind portabilitatea și responsabilitatea asigurărilor de sănătate (HIPAA). HIPAA cere persoanelor fizice să-și dea „consimțământul informat” cu privire la informațiile pe care le furnizează și la utilizările prezente și viitoare ale acestora. Potrivit unui articol din Biotech Business Week, „„ în practică, HIPAA ar putea să nu ofere o protecție mai mare decât reglementările de lungă durată din arena cercetării”, spune AAHC. Mai important, obiectivul regulii de protecție prin consimțământul informat este abordarea la un nivel de neînțelegere de către indivizii obișnuiți.” Acest lucru subliniază necesitatea anonimatului datelor în agregarea datelor și practicile miniere.

Legislația SUA privind confidențialitatea informațiilor, cum ar fi HIPAA și Legea privind drepturile educaționale și confidențialitatea familiei (FERPA), se aplică numai domeniilor specifice pe care le abordează fiecare astfel de lege. Utilizarea mineritului datelor de către majoritatea companiilor din SUA nu este controlată de nicio legislație.

Legea drepturilor de autor

Situația în Europa

Conform legilor europene privind drepturile de autor și bazele de date, exploatarea operelor cu drepturi de autor (cum ar fi prin exploatarea web) fără permisiunea proprietarului drepturilor de autor nu este legală. În cazul în care o bază de date reprezintă date pure în Europa, este posibil să nu existe drepturi de autor – dar pot exista drepturi de bază de date, astfel încât exploatarea datelor să fie supusă drepturilor proprietarilor de proprietate intelectuală care sunt protejate de Directiva bazei de date. La recomandarea revizuirii Hargreaves, acest lucru a condus guvernul britanic să-și modifice legea privind drepturile de autor în 2014 pentru a permite extragerea conținutului ca limitare și excepție. Marea Britanie a fost a doua țară din lume care a făcut acest lucru după Japonia, care a introdus o excepție în 2009 pentru mineritul datelor. Cu toate acestea, datorită restricției Directivei privind societatea informațională (2001), excepția Regatului Unit permite mineritul de conținut numai în scopuri necomerciale. Legea drepturilor de autor din Marea Britanie nu permite, de asemenea, ca această prevedere să fie anulată de termenii și condițiile contractuale.

Comisia Europeană a facilitat discuțiile părților interesate cu privire la mineritul de date și text în 2013, sub titlul Licențe pentru Europa. Accentul pus pe soluționarea acestei probleme juridice, precum licențierea, mai degrabă decât limitările și excepțiile, a condus la reprezentanții universităților, cercetătorilor, bibliotecilor, grupurilor societății civile și editorilor cu acces liber să părăsească dialogul părților interesate în mai 2013.

Situația din Statele Unite

Legea drepturilor de autor din SUA și, în special, prevederile sale pentru utilizarea loială, confirmă legalitatea mineritului conținutului în America și în alte țări cu utilizare loială, cum ar fi Israel, Taiwan și Coreea de Sud. Deoarece mineritul conținutului este transformatoare, adică nu înlocuiește lucrarea originală, este privită ca fiind legală în condiții de utilizare loială. De exemplu, ca parte a soluționării Google Book, judecătorul de caz a decis că proiectul Google de digitalizare a cărților cu drepturi de autor este legal, în parte datorită utilizărilor transformative afișate de proiectul de digitalizare – una fiind mineritul de text și date.

Include texte traduse din Wikipedia

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *