Home » Articole » RO » Afaceri » Știința datelor (Data Science) » Mineritul datelor (Data Mining): CRISP-DM – Înțelegerea datelor

Mineritul datelor (Data Mining): CRISP-DM – Înțelegerea datelor

Ca și în cazul înțelegerii organizaționale, înțelegerea datelor este o activitate pregătitoare și, uneori, valoarea sa este neglijată. Nu lăsați să-și piardă valoarea! Cu ani în urmă, când lucrătorii nu aveau propriul lor computer (sau mai multe computere) stând la birou (sau cu el în poală, sau în buzunar), datele erau centralizate. Dacă aveți nevoie de informații de la depozitul de date al unei companii, puteți solicita un raport de la cineva care ar putea interoga acele informații dintr-o bază de date centrală (sau să le aducă de la un birou de fișiere al companiei) și să vă ofere rezultatele. Invențiile computerului personal, stației de lucru, laptopului, tabletei și chiar a smartphone-ului au eliminat necesitatea deplasării la centralizarea datelor. Pe măsură ce hard disk-urile au devenit simultan mai mari și mai ieftine și pe măsură ce software precum Microsoft Excel și Access au devenit din ce în ce mai accesibile și mai ușor de utilizat, datele au început să se împrăștie în întreaga întreprindere. De-a lungul timpului, depozitele valoroase de date au ajuns să se răspândească pe sute și chiar mii de dispozitive, sechestrate în foile de calcul ale managerilor de marketing, bazele de date de asistență pentru clienți și sistemele de fișiere de resurse umane.

După cum vă puteți imagina, acest lucru a creat o problemă de date cu mai multe fațete. Marketingul poate avea date minunate care ar putea fi un atu valoros pentru conducerea superioară, dar managementul superior poate să nu fie conștient de existența datelor – fie din cauza teritorialismului din partea departamentului de marketing, fie pentru că oamenii de marketing pur și simplu nu s-au gândit să le spună directorilor despre datele pe care le-au adunat. Același lucru s-ar putea spune despre schimbul de informații, sau lipsa acestuia, între aproape orice două unități de afaceri dintr-o organizație. În limbajul Corporate America, termenul „silozuri” este adesea invocat pentru a descrie separarea unităților până la punctul în care partajarea și comunicarea interdepartamentală este aproape inexistentă. Este puțin probabil ca extragerea eficientă a datelor organizaționale să aibă loc atunci când angajații nu știu ce date au (sau ar putea avea) la dispoziție sau unde se află în prezent acele date. Există mecanisme pe care organizațiile le folosesc pentru a încerca să-și aducă toate datele într-o locație comună. Acestea includ baze de date, magazine de date și depozite de date.

Cu toate acestea, simpla centralizare a datelor nu este suficientă. Există o mulțime de întrebări care apar odată ce datele unei organizații au fost adunate. De unde au venit datele? Cine le-a colectat, și a existat o metodă standard de colectare? Ce înseamnă diferitele coloane și rânduri de date? Există acronime sau abrevieri necunoscute sau neclare? Poate fi necesar să faceți câteva cercetări în faza de pregătire a datelor a activităților dvs. de minerit a datelor. Uneori va trebui să vă întâlniți cu experți în domeniu din diferite departamente pentru a afla de unde provin anumite date, cum au fost colectate și cum au fost codificate și stocate. Este foarte important să verificați, de asemenea, acuratețea și fiabilitatea datelor. Vechea zicală „Mai bine puțin decât nimic” nu se aplică în mineritul de date. Datele inexacte sau incomplete ar putea face mai mult rău decât nimic într-o activitate de minerit a datelor, deoarece deciziile bazate pe date parțiale sau greșite pot fi decizii parțiale sau greșite. Odată ce ați adunat, identificat și înțeles datele dvs., atunci vă puteți angaja în pregătirea datelor.

Sursa: Dr. Matthew North, Data Mining for the Masses, licența CC BY 3.0. Traducere și adaptare de Nicolae Sfetcu

© 2022 MultiMedia Publishing, Mineritul de date

Rețele de comunicații 5G
Rețele de comunicații 5G

Datorită impactului său așteptat în economie și societate, a cincea generație de telecomunicații mobile (5G) este una dintre cele mai importante inovații ale timpului nostru. Așteptările cresc cu capacitățile de bandă largă ale 5G, accesibile tuturor și peste tot, la … Citeşte mai mult

Nu a fost votat $2,99$6,88 Selectează opțiunile
Lucrul cu baze de date
Lucrul cu baze de date

Colecția ȘTIINȚA INFORMAȚIEI Lucrul cu bazele de date este astăzi printre cele mai căutate abilități IT. Acum puteți obține o bază de plecare în proiectarea și implementarea bazelor de date cu o abordare practică, ușor de înțeles. ”Lucrul cu baze … Citeşte mai mult

Nu a fost votat $3,99$7,99 Selectează opțiunile
Introducere în Business Intelligence
Introducere în Business Intelligence

Colecția ȘTIINȚA INFORMAȚIEI ”Introducere în Business Intelligence” oferă cititorilor informații cuprinzătoare despre business intelligence, explorând toate aspectele importante ale inteligenței de afaceri în scenariul actual. Subiectele tratate se referă la abordările de bază ale business intelligence. Cartea își propune să … Citeşte mai mult

Nu a fost votat $2,99$4,80 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată.