Sentimentul în analitica se referă la mineritul de atitudini, emoții, sentimente – mai degrabă impresii subiective decât fapte. În general vorbând, analiza sentimentelor urmărește să determine atitudinea exprimată de scriitorul de text sau vorbitorul cu privire la tema sau polaritatea contextuală generală a unui document (Mejova 2009). Pang și Lee (2008) furnizează o documentare amănunțită cu privire la fundamentele și abordările clasificării și mineritului sentimentelor, inclusiv polaritatea sentimentelor, gradele de pozitivitate, detectarea subiectivității, identificarea opiniei, informații non-factuale, prezența termenului versus frecvență, POS (părți de vorbire). ), sintaxă, negație, caracteristici orientate pe subiect și caracteristici bazate pe termeni dincolo de unigramele de termeni.
Clasificarea sentimentelor
Analiza sentimentelor se împarte în subsarcini specifice:
- Contextul sentimentului — pentru a extrage opiniile, trebuie să cunoașteți „contextul” textului, care poate varia în mod semnificativ de la portaluri/fluxuri de recenzii de specialitate până la foruri generale în care opiniile pot acoperi un spectru larg de subiecte (Westerski 2008).
- Nivelul sentimentului — analiza textului poate fi efectuată la nivel de document, propoziție sau atribut.
- Subiectivitatea sentimentului — decideți dacă un anumit text exprimă o opinie sau este faptic (adică, fără a exprima o opinie pozitivă/negativă).
- Orientarea/polaritatea sentimentului — decideți dacă o opinie dintr-un text este pozitivă, neutră sau negativă.
- Forța sentimentului — decideți „puterea” unei opinii dintr-un text: slabă, ușoară sau puternică.
Poate că cea mai dificilă analiză este identificarea orientării/polarității și a tăriei sentimentelor – pozitiv (minunat, elegant, uimitor, grozav), neutru (bine, ok) și negativ (oribil, dezgustător, sărac, slab, nasol) din cauza argoului.
O abordare populară este de a atribui scoruri de orientare/polaritate (+1, 0, -1) tuturor cuvintelor: opinie pozitivă (+1), opinie neutră (0) și opinie negativă (-1). Scorul general de orientare/polaritate al textului este suma scorurilor de orientare ale tuturor cuvintelor de „opinie” găsite. Cu toate acestea, există diverse probleme potențiale în această abordare simplistă, cum ar fi negarea (de exemplu, nu există nimic pe care să-l urăsc la acest produs). O metodă de estimare a orientării sentimentului/ polarității textului este informația reciprocă punctuală (PMI), o măsură a asocierii utilizată în teoria și statistica informațiilor.
Referințe
- Mejova Y (2009) Sentiment analysis: an overview, pp 1-34. http:// www.academia.edu/291678/Sentiment_Analysis_An_Overview.
- Pang B, Lee L (2008) Opinion mining and sentiment analysis. Found Trends Inf Retr 2(1-2):1-135
- Westerski A (2008) Sentiment analysis: introduction and the state of the art overview. Universidad Politecnica de Madrid, Spain, pp 1-9. http://www.adamwesterski.com/wpcontent/files/docsCursos/sentimentA_doc_TLAW.pdf .
Sursa: Bogdan Batrinca, Philip C. Treleaven, „Social media analytics: a survey of techniques, tools and platforms„, AI & Soc (2015) 30:89-116 DOI 10.1007/s00146-014-0549-4, Creative Commons Attribution License. Traducere și adaptare Nicolae Sfetcu
Lasă un răspuns