Mineritul datelor, procesul de descoperire a modelelor în seturi mari de date, este utilizat în multe aplicații.
În afaceri, mineritul datelor este analiza activităților istorice ale afacerii, stocate ca date statice în bazele de date ale depozitului de date. Scopul este de a dezvălui tipare și tendințe ascunse. Software-ul de minerit a datelor folosește algoritmi avansați de recunoaștere a modelelor pentru a trece prin cantități mari de date pentru a ajuta la descoperirea informațiilor strategice de afaceri necunoscute anterior. Exemple pentru care întreprinderile folosesc mineritul de date este includerea efectuării de analize de piață pentru identificarea pachetelor de produse noi, găsirea cauzei principale a problemelor de fabricație, prevenirea renunțării clienților și achiziționarea de noi clienți, vânzarea încrucișată către clienții existenți și profilarea clienților cu mai multă acuratețe .
În lumea de astăzi, datele brute sunt colectate de companii cu o rată explozivă. De exemplu, Walmart procesează peste 20 de milioane de tranzacții la punctul de vânzare în fiecare zi. Aceste informații sunt stocate într-o bază de date centralizată, dar ar fi inutile fără un tip de software de minerit a datelor care să le analizeze. Dacă Walmart și-ar analiza datele de la punctul de vânzare cu tehnici de extragere a datelor, acestea ar fi capabile să determine tendințele de vânzare, să dezvolte campanii de marketing și să prezică mai fidel loialitatea clienților. Un astfel de exemplu pentru Walmart ar fi cel al vânzărilor de scutece și bere, descoperite prin mineritul datelor.
Categorizarea articolelor disponibile pe site-ul de comerț electronic este o problemă fundamentală. Un sistem corect de clasificare a articolelor este esențial pentru experiența utilizatorului, deoarece ajută la determinarea articolelor relevante pentru el pentru căutare și navigare. Clasificarea articolelor poate fi formulată ca o problemă de clasificare supravegheată în extragerea datelor, în care categoriile sunt clasele țintă și caracteristicile sunt cuvintele care compun o descriere textuală a articolelor. Una dintre abordări este de a găsi inițial grupuri similare și de a le pune împreună într-un grup latent. Acum, având un nou element, clasificați mai întâi într-un grup latent (clasificare la nivel grosier). Apoi, efectuați o a doua rundă de clasificare pentru a găsi categoria căreia îi aparține elementul.
De fiecare dată când se folosește un card de credit sau un card de fidelitate de magazin, sau se completează un card de garanție, sunt colectate date despre comportamentul utilizatorului. Mulți oameni consideră că informațiile stocate despre noi la companii, precum Google, Facebook și Amazon, sunt deranjante și sunt îngrijorați pentru confidențialitate. Deși există potențialul ca datele noastre cu caracter personal să fie utilizate în moduri dăunătoare sau nedorite, acestea sunt folosite și pentru a ne îmbunătăți viața. De exemplu, Ford și Audi speră să colecteze într-o zi informații despre modelele de conducere ale clienților, astfel încât să poată recomanda rute mai sigure și să-i avertizeze pe șoferi cu privire la condițiile de drum periculoase.
Exploatarea datelor în aplicațiile de gestionare a relației cu clienții poate contribui semnificativ la rezultatul final. În loc să contacteze în mod aleatoriu un client potențial sau un client prin intermediul unui call center sau să trimită e-mailuri, o companie își poate concentra eforturile asupra potențialilor clienți care se estimează că au o mare probabilitate de a răspunde la o ofertă. Metode mai sofisticate pot fi folosite pentru a optimiza resursele din toate campaniile, astfel încât să se poată prezice la ce canal și la ce ofertă este cel mai probabil să răspundă un individ (în toate ofertele potențiale). În plus, aplicații sofisticate ar putea fi utilizate pentru automatizarea corespondenței. Odată ce rezultatele obținute din extragerea datelor (perspectivă potențială / client și canal / ofertă) sunt determinate, această „aplicație sofisticată” poate trimite automat un e-mail sau un o scrisoare obișnuită. În cele din urmă, în cazurile în care mulți oameni vor întreprinde o acțiune fără o ofertă, se poate utiliza „modelarea crescătoare” pentru a determina care persoane au cea mai mare creștere a răspunsului dacă li se face o ofertă. Modelarea crescătoare permite, astfel, specialiștilor în marketing să concentreze e-mailurile și ofertele către persoane convingătoare și să nu trimită oferte persoanelor care vor cumpăra produsul fără o ofertă. Clusterul de date poate fi, de asemenea, utilizat pentru a descoperi automat segmentele sau grupurile dintr-un set de date pentru clienți.
Întreprinderile care folosesc mineritul de date pot vedea o rentabilitate a investiției, dar recunosc, de asemenea, că numărul modelelor predictive poate deveni rapid foarte mare. De exemplu, mai degrabă decât să utilizeze un singur model pentru a prezice câți clienți vor produce, o companie poate alege să construiască un model separat pentru fiecare regiune și tip de client. În situațiile în care trebuie menținut un număr mare de modele, unele companii apelează la metodologii mai automatizate de extragere a datelor.
Mineritul datelor poate fi utilă departamentelor de resurse umane (HR) în identificarea caracteristicilor celor mai de succes angajați. Informațiile obținute – cum ar fi universitățile la care participă angajați de mare succes – pot ajuta HR să concentreze eforturile de recrutare în consecință. În plus, aplicațiile de gestionare strategică a întreprinderilor ajută o companie să traducă obiectivele la nivel de corporație, cum ar fi obiectivele de profit și cota de marjă, în decizii operaționale, cum ar fi planurile de producție și nivelurile de forță de muncă.
Analiza coșului de piață a fost utilizată pentru a identifica tiparele de cumpărare ale consumatorului Alpha. Analiza datelor colectate despre acest tip de utilizator a permis companiilor să prezică tendințele viitoare de cumpărare și să prevadă cererile de aprovizionare.
Mineritul datelor este un instrument extrem de eficient în industria de marketing a catalogului. Creatorii de cataloage au o bază de date bogată cu istoricul tranzacțiilor clienților lor pentru milioane de clienți, care datează de mai mulți ani. Instrumentele de minerit a datelor pot identifica tiparele clienților și pot ajuta la identificarea celor mai probabili clienți care să răspundă la viitoarele campanii de e-mail.
Mineritul datelor pentru aplicațiile de afaceri poate fi integrată într-un proces complex de modelare și luare a deciziilor. LIONsolver folosește inteligenta de afaceri reactivă (RBI) pentru a susține o abordare „holistică”, care integrează mineritul datelor, modelarea și vizualizarea interactivă într-o descoperire end-to-end și un proces de inovare continuă alimentat de învățarea umană și automată.
În domeniul luării deciziilor, abordarea RBI a fost utilizată pentru a extrage cunoștințele care sunt dobândite progresiv de la factorii de decizie, apoi pentru a regla automat metoda deciziei în consecință. Relația dintre calitatea unui sistem de minerit a datelor și cantitatea de investiții pe care este dispus să o facă factorul de decizie a fost oficializată prin furnizarea unei perspective economice asupra valorii „cunoștințelor extrase” în ceea ce privește recompensa sa către organizație. Acest cadru de clasificare teoretică a deciziilor a fost aplicat unei linii de fabricare a semiconductorilor din lumea reală, unde au fost dezvoltate reguli de decizie pentru monitorizarea și controlul eficient al liniei de fabricare a semiconductorilor.
Un exemplu de extragere a datelor legat de o linie de producție cu circuit integrat (IC) este descris în lucrarea „Mining IC Test Data to Optimize VLSI Testing.” În această lucrare, este descrisă aplicarea extragerii de date și analiza deciziilor la problema testaării funcționalității la nivel de matriță. Experimentele menționate demonstrează abilitatea de a aplica un sistem de minerit a datelor istorice de testare a matriței pentru a crea un model probabilistic de tipare ale eșecului. Aceste tipare sunt apoi utilizate pentru a decide, în timp real, care matriță se va testa în continuare și când să se oprească testarea. S-a demonstrat că acest sistem, bazat pe experimente cu date de testare istorice, are potențialul de a îmbunătăți profiturile produselor IC mature. Alte exemple de aplicare a metodologiilor de minerit a datelor în mediile de fabricație a semiconductoarelor sugerează că metodologiile de minerit a datelor pot fi deosebit de utile atunci când datele sunt rare, iar diferiții parametri fizici și chimici care afectează procesul prezintă interacțiuni extrem de complexe. O altă implicație este că monitorizarea on-line a procesului de fabricație a semiconductorilor folosind mineritul datelor poate fi extrem de eficientă.
Include texte traduse din Wikipedia
Lasă un răspuns