Aici, examinăm platforme cuprinzătoare de rețele sociale care combină arhivele rețelelor sociale, fluxurile de date, extragerea de date și instrumentele de analiză a datelor. Mai simplu spus, platformele sunt diferite de instrumente și seturi de instrumente, deoarece platformele sunt mai cuprinzătoare și oferă atât instrumente, cât și date.
Ele se împart în general în:
- Platforme de știri — platforme precum Thomson Reuters care oferă arhive/ffluxuri de știri și analitici asociate și vizează companii precum instituțiile financiare care caută să monitorizeze sentimentul pieței în știri.
- Platforme media de rețele sociale — platforme care furnizează extragerea datelor și analize pe Twitter, Facebook și pe o gamă largă de alte surse de rețele sociale. Furnizorii vizează de obicei companiile care doresc să monitorizeze sentimentul în legătură cu mărcile sau produsele lor.
Platforme de știri
Cei mai importanți doi furnizori de știri de afaceri sunt Thomson Reuters și Bloomberg.
Computerul citește știrile în timp real și oferă automat indicatori cheie și informații semnificative. Știrile sunt preluate, analizate și interpretate automat în câteva milisecunde. Indicatorii de știri citibili de mașină pot îmbunătăți potențial strategiile cantitative, gestionarea riscurilor și luarea deciziilor.
Exemple de știri care pot fi citite automat includ: Thomson Reuters Machine Readable News, Event-Driven Trading Feed de la Bloomberg și AlphaFlash (fluxul de știri care poate fi citit automat de la Deutsche Borse). Thomson Reuters Machine Readable News (Thomson Reuters 2012a, b, c) are conținut de știri Reuters care datează din 1987 și știri cuprinzătoare de la peste 50 de terți care datează din 2003, cum ar fi PR Newswire, Business Wire și Regulatory News Service (LSE). Fluxul oferă text complet și metadate cuprinzătoare prin flux XML.
Thomson Reuters News Analytics folosește tehnici de procesare a limbajului natural (NLP) pentru a nota articole de știri despre zeci de mii de companii și aproape 40 de subiecte de mărfuri și energie. Măsurătorile se fac în următoarele dimensiuni:
- Sentimentul autorului — valori pentru cât de pozitiv, negativ sau neutru este tonul articolului, specific fiecărei companii din articol.
- Relevanță — cât de relevantă sau de substanțială este povestea pentru un anumit articol.
- Analiza volumului — câte știri se întâmplă despre o anumită companie.
- Unicitatea — cât de nou sau repetitiv este articolul pe diverse perioade de timp.
- Analiza titlului — evidențiază caracteristici speciale, cum ar fi acțiuni ale brokerului, comentarii privind prețurile, interviuri, exclusivități și concluzii.
Platforme media de rețele sociale
Attensity, Brandwatch, Salesforce Marketing Cloud (denumit anterior Radian6) și Sysomos MAP (Media Analysis Platform) sunt exemple de platforme de monitorizare a rețelelor sociale, care măsoară datele demografice, subiectele influente și sentimentele. Acestea includ analize de text și analiză de sentimente cu privire la conversațiile online cu consumatorii și oferă interfețe ușor de utilizat pentru personalizarea interogării de căutare, tablourilor de bord, rapoartelor și funcțiilor de export de fișiere (de exemplu, în format Excel sau CSV). Cele mai multe dintre platforme scanează o gamă largă de rețele sociale folosind un crawler distribuit care vizează: microblogging (Twitter prin Twitter Firehose complet), bloguri (Blogger, WordPress etc.), rețele sociale (Facebook și MySpace), forumuri, știri site-uri, site-uri de imagini (Flickr) și site-uri corporative. Unele dintre platforme oferă suport în mai multe limbi pentru limbi utilizate pe scară largă (de exemplu, engleză, franceză, germană, italiană și spaniolă).
Platformele de analiză a sentimentelor folosesc două metodologii principale. Una implică o abordare statistică sau bazată pe model, în care sistemul învață să evalueze sentimentul analizând cantități mari de material pre-construite. Cealaltă metodă folosește un dicționar mare de fraze pre-construite.
RapidMiner este o platformă care combină minarea datelor și analiza datelor, care, în funcție de cerințe, poate fi open source. Folosește biblioteca de învățare automată WEKA și oferă acces la surse de date precum Excel, Access, Oracle, IBM, MySQL, PostgreSQL și fișiere text.
Mozenda oferă o interfață cu utilizatorul de tip punct și clic pentru extragerea de informații specifice de pe site-urile web și permite automatizarea și exportul de date în fișiere CSV, TSV sau XML.
DataSift oferă acces atât la date sociale în timp real, cât și la date istorice de la principalele rețele sociale și de la milioane de alte surse, permițând clienților să reunească, să filtreze și să obțină perspective și să descopere tendințe din miliardele de conversații sociale publice. Odată ce datele sunt agregate și procesate (adică, DataSift poate filtra și adăuga context, cum ar fi îmbogățiri-prelucrare de limbă, date geografice și date demografice – și categorizare – detectarea spam-ului, identificarea intențiilor și învățarea automată), clienții pot folosi integrări pre-construite cu instrumente populare BI, aplicații și instrumente pentru dezvoltatori pentru a furniza datele în afacerile lor sau utiliza API-urile DataSift pentru a transmite date în timp real în aplicațiile lor.
Există un număr tot mai mare de platforme de analitica rețelelor sociale înființate în prezent. Alte platforme notabile care gestionează sentimentul și analiza semantică a materialelor din sursă Web și Web 2.0 includ Google Analytics, HP Autonomy IDOL (Intelligent Data Operating Layer), IBM SPSS Modeler, Adobe SocialAnalytics, GraphDive, Keen IO, Mass Relevance, Parse.ly, ViralHeat, Social-bakers, DachisGroup, evolve24, OpenAmplify și AdmantX.
Recent, au apărut tot mai multe platforme specifice de analitica socială. Unul dintre ele este iSpot.tv, care și-a lansat propria platformă de analitica rețelelor sociale care potrivește reclamele de televiziune cu mențiuni pe Twitter și Facebook. Oferă rapoarte în timp real despre când și unde apare un anunț, împreună cu ceea ce spun oamenii despre el pe rețelele sociale (iSpot.tv monitorizează aproape 80 de rețele diferite).
Thomson Reuters a anunțat că încorporează acum analiza sentimentului Twitter pentru platforma de tranzacționare și analiză de piață Thomson Reuters Eikon, oferind vizualizări și diagrame bazate pe datele de sentiment. Bloomberg a încorporat tweet-uri legate de anumite companii într-un flux de date mai larg.
Studiu de caz: Thomson Reuters News Analytics
Thomson Reuters News Analytics (TRNA) oferă o arhivă uriașă de știri cu analize pentru a citi și interpreta știrile, oferind informații semnificative. TRNA înregistrează știri pe peste 25.000 de acțiuni și aproape 40 de subiecte (mărfuri și energie). Platforma colectează și analizează datele de știri în timp real și alimentează datele în alte programe/proiecte sau strategii cantitative.
TRNA folosește un sistem NLP de la Lexalytics, unul dintre liderii tehnologiei lingvistice, care poate urmări sentimentele știrilor de-a lungul timpului și punctează textul în diferite dimensiuni, așa cum este menționat în secțiunea. 8.1.
Scorul textului și metadatele platformei au mai mult de 80 de câmpuri (Thomson Reuters 2010), cum ar fi:
- Tip de articol — scena poveștii: Alertă, Articol, Actualizări sau Corecții.
- Genul articolului — clasificarea poveștii, adică interviu, exclusiv și concluzie.
- Titlu — alerta sau textul titlului.
- Relevanță — variază de la 0 la 1,0.
- Sentimentul predominant — poate fi 1, 0 sau -1.
- Pozitiv, neutru, negativ — indicație mai detaliată a sentimentului.
- Acțiunea brokerului — indică acțiunile brokerului: upgrade, downgrade, menținere, nedefinit sau dacă este brokerul însuși
- Comentariul preț/piață — utilizat pentru a semnala articole care descriu prețul/comentariul pieței
- Codurile subiectului — descrie despre ce este vorba, adică RCH = Cercetare, RES = Rezultate, RESF = Prognoză rezultatelor, MRG = Fuziuni și achiziții
Un fragment din analiza sentimentului știrilor este ilustrat în Fig. 17.
În 2012, Thomson Reuters și-a extins oferta de știri care poate fi citită de mașină pentru a include analiza sentimentelor și scorul pentru rețelele sociale. Extensia TRNA se numește Thomson Reuters News Analytics (TRNA) pentru știri de pe Internet și rețelele sociale, care adună conținut de pe peste patru milioane de canale de rețele sociale și 50.000 de site-uri de știri de pe Internet. Conținutul este apoi analizat de TRNA în timp real, generând rezultate cuantificabile în diferite dimensiuni, cum ar fi sentimentul, relevanța, volumul de noutăți, categoriile și rangurile sursei. Această extensie folosește aceeași etichetare extinsă cu metadate (în peste 80 de câmpuri).
TRNA for Internet News and Social Media este o platformă puternică, care analizează, etichetează și filtrează milioane de surse publice și premium de conținut de pe internet, transformând megadatele în idei care pot fi acționate. Platforma oferă, de asemenea, o modalitate de a analiza vizual datele mari. Poate fi combinată cu software-ul de vizualizare a datelor Panopticon pentru a ajunge la concluzii semnificative mai rapid cu afișaje intuitive vizual (Thomson Reuters 2012a, b, c), așa cum este ilustrat în Fig.
Thomson Reuters a extins și serviciul News Analytics cu MarketPsych Indices (Thomson Reuters 2012a, b, c), care permite analiza psihologică în timp real a știrilor și a rețelelor sociale. Serviciul Thomson Reuters MarketPsych Indices (TRMI) dobândește o viziune cantitativă asupra psihologiei pieței în timp ce încearcă să identifice emoțiile și sentimentele umane. Este o completare a TRNA și folosește procesarea NLP creată de MarketPsych (http://www.marketpsych.com), o companie lider în psihologia comportamentală pe piețele financiare.
Economiștii comportamentali au investigat pe larg dacă emoțiile afectează piețele în moduri previzibile, iar TRMI încearcă să măsoare starea „emoțiilor” în timp real pentru a identifica tiparele pe măsură ce apar. TRMI are două tipuri de indicatori cheie:
(Aplicația Thomson Reuters News Discovery cu Sentiment Analysis)
(Combinarea TRNA pentru Internet News și Social Media cu Panopticon Data Visualization Software)
Măsurarea zvonurilor — indică cât de mult se discută ceva în știri și rețelele sociale și includ teme macroeconomice (de exemplu, litigii, fuziuni, volatilitate, sector financiar, sector aerian și sector tehnologie curată)
Platforma de la Thomson Reuters permite ca exploatarea știrilor și a rețelelor sociale să fie folosită pentru a identifica oportunități și pentru a valorifica ineficiența pieței (Thomson Reuters 2013).
Referințe
- Thomson Reuters (2010). Thomson Reuters news analytics.
- Thomson Reuters (2012) Thomson Reuters machine readable news.
- Thomson Reuters (2012) Thomson Reuters MarketPsych Indices.
- Thomson Reuters (2012) Thomson Reuters news analytics for internet news and social media.
- Thomson Reuters (2013) Machine readable news.
Sursa: Bogdan Batrinca, Philip C. Treleaven, „Social media analytics: a survey of techniques, tools and platforms„, AI & Soc (2015) 30:89-116 DOI 10.1007/s00146-014-0549-4, Creative Commons Attribution License. Traducere și adaptare Nicolae Sfetcu
Lasă un răspuns