Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Procese în analitica social media

Procese în analitica social media

Analitica social media este procesul de colectare și analiză a datelor din rețelele sociale precum Facebook, Instagram, LinkedIn și Twitter. Este folosită în mod obișnuit de agenții de marketing pentru a urmări conversațiile online despre produse și companii. Un autor a definit-o drept „arta și știința de a extrage informații valoroase ascunse din cantități mari de date semi-structurate și nestructurate de pe rețelele sociale pentru a permite luarea deciziilor informate și perspicace.”[1]

Există trei pași principali în analiza social media: identificarea datelor, analiza datelor și interpretarea informațiilor. Pentru a maximiza valoarea derivată în fiecare moment al procesului, analiștii pot defini o întrebare la care să se răspundă. Întrebările importante pentru analiza datelor sunt: ​​„Cine? Ce? Unde? Când? De ce? și Cum?” Aceste întrebări ajută la determinarea surselor de date adecvate de evaluat, ceea ce poate afecta tipul de analiză care poate fi efectuată.[2]

Identificarea datelor

Identificarea datelor este procesul de identificare a subseturilor de date disponibile pe care să se concentreze pentru analiză. Datele brute sunt utile odată ce sunt interpretate. După ce datele au fost analizate, se poate începe să se transmită un mesaj. Orice dată care transmite un mesaj semnificativ devine informație. La un nivel înalt, datele neprocesate iau următoarele forme pentru a se traduce într-un mesaj exact: date zgomotoase; date relevante și irelevante, date filtrate; numai date relevante, informații; date care transmit un mesaj vag, cunoștințe; date care transmit un mesaj precis, înțelepciune; date care transmit mesajul exact și motivul din spatele acestuia. Pentru a obține înțelepciune dintr-o dată neprelucrată, trebuie să începem să le procesăm, să rafinăm setul de date prin includerea datelor pe care vrem să ne concentrăm și să organizăm datele pentru a identifica informațiile. În contextul analiticii social media, identificarea datelor înseamnă „ce” conținut este de interes. Pe lângă textul de conținut, vrem să știm: cine a scris textul? Unde a fost găsit sau pe ce rețea de socializare a apărut? Suntem interesați de informații dintr-o zonă specifică? Când a spus cineva ceva în rețelele sociale?[2]

Atributele datelor care trebuie luate în considerare sunt următoarele:

  • Structură: Datele structurate sunt date care au fost organizate într-un depozit formatat – de obicei o bază de date – astfel încât elementele sale să poată fi adresate pentru o procesare și o analiză mai eficace. Datele nestructurate, spre deosebire de datele structurate, sunt datele cel mai puțin formatate.[3]
  • Limbă: Limba devine semnificativă dacă vrem să cunoaștem sentimentul unei postări, mai degrabă decât numărul de mențiuni.
  • Regiune: Este important să ne asigurăm că datele incluse în analiză provin doar din acea regiune a lumii pe care se concentrează analiza. De exemplu, dacă scopul este de a identifica problemele cu apa curată din India, am dori să ne asigurăm că datele colectate sunt numai din India.
  • Tip de conținut: Conținutul datelor poate fi Text (text scris ușor de citit și de înțeles dacă cunoașteți limba), Fotografii (desene, schițe simple sau fotografii), Audio (înregistrări audio ale cărților, articolelor, discuțiilor, sau discuții) sau Videoclipuri (înregistrare, streamuri live).
  • Locație: Conținutul rețelelor sociale este generat într-o varietate de locuri, cum ar fi site-uri de știri și site-uri de rețele sociale (de exemplu, Facebook, Twitter). În funcție de tipul de proiect pentru care sunt colectate datele, locația devine foarte semnificativă.
  • Timp: Este important să colectați datele postate în intervalul de timp care este analizat.
  • Proprietatea datelor: Datele sunt private sau disponibile public? Există vreun drept de autor asupra datelor? Acestea sunt întrebările importante care trebuie abordate înainte de colectarea datelor.
Proces de analiză a rețelelor sociale.
Credit: Asmat Muradi, https://en.wikipedia.org/wiki/File:SocialMediaAnalyticsProcess.png, licența CC BY-SA 4.0

([4] Proces de analiză a rețelelor sociale. )

Analiza datelor

Analiza datelor este setul de activități care ajută la transformarea datelor brute în perspectivă, care, la rândul său, conduce la o nouă bază de cunoștințe și valoare de afaceri. Cu alte cuvinte, analiza datelor este faza care ia datele filtrate ca intrare și le transformă în informații de valoare pentru analiști. Multe tipuri diferite de analize pot fi efectuate cu datele din rețelele de socializare, inclusiv analiza postărilor, sentimentul, factorii de sentiment, geografia, datele demografice etc. Etapa de analiză a datelor începe odată ce știm ce problemă vrem să rezolvăm și știm că avem suficiente date

Dezvoltarea unui model de date este un proces sau o metodă pe care o folosim pentru a organiza elementele de date și pentru a standardiza modul în care elementele individuale de date se relaționează între ele. Acest pas este important deoarece dorim să rulăm un program de calculator peste date; avem nevoie de o modalitate de a spune computerului care cuvinte sau teme sunt importante și dacă anumite cuvinte se referă la subiectul pe care îl explorăm.

În analiza datelor noastre, este util să avem la dispoziție mai multe instrumente pentru a obține o perspectivă diferită asupra discuțiilor care au loc în jurul subiectului. Scopul aici este de a configura instrumentele care să funcționeze la vârf pentru o anumită sarcină. De exemplu, gândindu-ne la un nor de cuvinte, dacă luăm o cantitate mare de date în jurul profesioniștilor din informatică, să spunem „arhitectul IT”, și construim un nor de cuvinte, fără îndoială cel mai mare cuvânt din cloud ar fi „arhitect”. Această analiză se referă și la utilizarea instrumentului. Unele instrumente pot face o treabă bună la determinarea sentimentelor, în timp ce altele pot face o treabă mai bună în descompunerea textului într-o formă gramaticală care ne permite să înțelegem mai bine sensul și utilizarea diferitelor cuvinte sau expresii. În efectuarea analizei analitice, este dificil de enumerat fiecare pas de făcut într-o călătorie analitică. Este foarte mult o abordare iterativă, deoarece nu există un mod prescris de a face lucrurile.[2]

Taxonomia și înțelegerea derivată din această analiză sunt următoarele:

  • Profunzimea analizei: Statistici descriptive simple bazate pe date în flux, analiză ad-hoc pe datele acumulate sau analiză profundă efectuată pe datele acumulate. Această dimensiune de analiză este într-adevăr determinată de cantitatea de timp disponibilă pentru a veni cu rezultatele unui proiect. Acesta poate fi considerat un continuum larg, în care timpul de analiză variază de la câteva ore la un capăt la câteva luni la celălalt capăt. Această analiză poate răspunde la următoarele tipuri de întrebări:
    • Câți oameni au menționat cuvântul în tweet-urile lor?
    • Care politician a avut cel mai mare număr de aprecieri în timpul dezbaterii?
    • Care concurent adună cele mai multe mențiuni în contextul afacerilor sociale?
  • Capacitatea mașinii: Cantitatea de procesor necesară pentru a procesa seturi de date într-o perioadă de timp rezonabilă. Capacitatea trebuie să răspundă nu numai nevoilor CPU, ci și capacității rețelei necesare pentru a prelua date. Această analiză ar putea fi efectuată în timp real, aproape în timp real, explorare ad-hoc și analiză profundă. Analiza în timp real în rețelele sociale este un instrument important atunci când încercați să înțelegeți percepția publicului asupra unui anumit subiect pe măsură ce se desfășoară, pentru a permite o reacție sau o schimbare imediată a cursului. În analiza aproape în timp real, presupunem că datele sunt ingerate în instrument la o rată mai mică decât în ​​timp real. Analiza ad-hoc este un proces conceput pentru a răspunde la o singură întrebare specifică. Produsul analizei ad-hoc este de obicei un raport sau un rezumat al datelor. O analiză profundă implică o analiză care se întinde pe o perioadă lungă de timp și implică o cantitate mare de date, care de obicei se traduce într-o cerință ridicată de CPU.[2]
  • Domeniul analizei: Domeniul analizei este clasificat pe scară largă în rețelele sociale externe și rețelele sociale interne. De cele mai multe ori, când oamenii folosesc termenul de social media, se referă la rețele sociale externe. Aceasta include conținutul generat de pe site-uri populare de rețele sociale, cum ar fi Twitter, Facebook și LinkedIn. Rețelele sociale interne includ rețeaua socială a întreprinderii, care este o rețea socială privată utilizată pentru a sprijini comunicarea în cadrul afacerilor.[5]
  • Viteza datelor: Viteza datelor în rețelele sociale poate fi împărțită în două categorii: date în repaus și date în mișcare. Dimensiunile vitezei datelor în mișcare pot răspunde la întrebări precum: Cum se schimbă sentimentul populației generale despre jucători în timpul disputei? Mulțimea transmite un sentiment pozitiv despre cel care pierde de fapt jocul? În aceste cazuri, analiza se face așa cum vine. În această analiză, cantitatea de detaliu produsă este direct corelată cu complexitatea instrumentului sau a sistemului analitic. Un instrument extrem de complex produce mai multe detalii. Al doilea tip de analiză în contextul vitezei este o analiză a datelor în repaus. Această analiză este efectuată odată ce datele sunt colectate complet. Efectuarea acestei analize poate oferi perspective precum: care dintre produsele companiei dumneavoastră are cele mai multe mențiuni în comparație cu altele? Care este sentimentul relativ în jurul produselor dvs. în comparație cu produsul unui concurent?[2]

Interpretarea informațiilor

Perspectivele derivate din analiză pot fi la fel de variate ca întrebarea inițială care a fost pusă în primul pas al analizei. În această etapă, întrucât utilizatorii de afaceri netehnici sunt receptorii informațiilor, forma de prezentare a datelor devine importantă. Cum ar putea datele să aibă sens în mod eficient, astfel încât să poată fi utilizate în luarea deciziilor corecte? Vizualizarea (grafica) informațiilor este răspunsul la această întrebare.[6]

Cele mai bune vizualizări sunt cele care expun ceva nou despre tiparele de bază și relațiile care conțin datele. Expunerea tiparelor și subestimarea acestora joacă un rol cheie în procesul de luare a deciziilor. În principal, există trei criterii de luat în considerare în vizualizarea datelor.

  • Înțelegeți audiența: înainte de a construi vizualizarea, stabiliți-vă un scop, care este transmiterea unor cantități mari de informații într-un format ușor de asimilat de către consumatorul de informații. Este important să răspundeți „Cine este publicul?” și „Puteți presupune că publicul are cunoștințele terminologiilor folosite?” Un public de experți va avea așteptări diferite față de un public general; prin urmare, așteptările trebuie luate în considerare.[7]
  • Stabiliți un cadru clar: analistul trebuie să se asigure că vizualizarea este corectă din punct de vedere sintactic și semantic. De exemplu, atunci când se folosește o pictogramă, elementul ar trebui să semene cu lucrul pe care îl reprezintă, cu dimensiunea, culoarea și poziția, toate comunicând sens pentru privitor.[7]
  • Spuneți o poveste: informațiile analitice sunt complexe și greu de asimilat, prin urmare, scopul vizualizării este de a înțelege și de a da sens informațiilor. Povestirea ajută spectatorul să obțină o perspectivă din date. Vizualizarea ar trebui să împacheteze informațiile într-o structură care este prezentată ca o narațiune și ușor de reținut. Acest lucru este important în multe scenarii când analistul nu este aceeași persoană cu un factor de decizie.[7]

Referințe

  1. Sponder, Marshall; Khan, Gohar F. (2017). Digital analytics for marketing. New York, NY. ISBN 9781138190672. OCLC 975370877.
  2. Ganis, Matthew; Kohirkar, Avinash (2015). Social media Analytics: Techniques and insights for Extracting Business Value Out of Social Media. New York: IBM Press. pp. 40–137. ISBN 978-0-13-389256-7.
  3. „What is structured data? – Definition from WhatIs.com”. WhatIs.com. Retrieved 2016-12-06.
  4. Ganis, Matthew; Kohirkar, Avinash (2015). Social media Analytics: Techniques and insights for Extracting Business Value Out of Social Media. New York: IBM Press. pp. 247–248. ISBN 978-0-13-389256-7.
  5. Kitt, Denise (2012-05-24). „Enterprise Social Networks Explained”. CRM Switch. Retrieved 2016-11-05.
  6. Steele, Julie (2012-02-15). „Why data visualization matters”. O’Reilly Media. Retrieved 2016-12-11.
  7. „The Three Elements of Successful Data Visualizations”. Harvard Business Review. Retrieved 2016-12-11.

Include texte din Wikipedia traduse de Nicolae Sfetcu

Introducere în Business Intelligence
Introducere în Business Intelligence

O resursă esențială pentru toți cei interesați de analiza datelor și de optimizarea proceselor de afaceri.

Nu a fost votat 14.32 lei25.71 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat 0.00 lei11.25 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Transformă-ți perspectiva asupra tehnologiei blockchain și începe să descoperi oportunitățile digitale de mâine!

Nu a fost votat 23.89 lei57.41 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *