Home » Articole » Articles » Affaires » Science des données » L’analyse exploratoire des médias sociaux

L’analyse exploratoire des médias sociaux

Les médias sociaux sont définis comme des applications Internet basées sur le Web et sur mobile qui permettent la création, l’accès et l’échange de contenu généré par l’utilisateur qui est accessible de manière omniprésente (Kaplan et Haenlein 2010). Outre les médias de réseaux sociaux (par exemple, Twitter et Facebook), nous utiliserons également le terme « médias sociaux » pour englober les flux de syndication vraiment simple (RSS), les blogs, les wikis et les actualités, tous produisant généralement du texte non structuré et accessibles via le Web. Les médias sociaux sont particulièrement importants pour la recherche en sciences sociales computationnelles qui étudie des questions (Lazer et al. 2009) à l’aide de techniques quantitatives (par exemple, les statistiques computationnelles, l’apprentissage automatique et la complexité) et les mégadonnées pour l’exploration de données et la modélisation de simulation (Cioffi- Revilla 2010).

Cela a conduit à de nombreux services de données, outils et plates-formes d’analyse exploratoire des données (AED). Cependant, cette disponibilité facile des données des médias sociaux pour la recherche universitaire peut changer de manière significative en raison des pressions commerciales. De plus, les outils dont disposent les chercheurs sont loin d’être idéaux. Ils donnent soit un accès superficiel aux données brutes, soit (pour un accès non superficiel) obligent les chercheurs à programmer des analyses exploratoire des données dans un langage tel que Java.

Terminologie

Définir certaines des techniques clés liées à l’analyse de données textuelles non structurées :

  • Le traitement automatique du langage naturel (Natural language processing, NLP) est un domaine de l’informatique, de l’intelligence artificielle et de la linguistique concerné par les interactions entre les ordinateurs et les langages humains (naturels). Plus précisément, il s’agit du processus par lequel un ordinateur extrait des informations significatives à partir d’une entrée en langage naturel et/ou produit une sortie en langage naturel.
  • L’analyse exploratoire des actualités : la mesure des divers attributs qualitatifs et quantitatifs des reportages textuels (données non structurées). Certains de ces attributs sont : le sentiment, la pertinence et la nouveauté.
  • L’exploration des opinions : l’exploration d’opinions (l’exploration de sentiments, l’exploration d’opinions) est le domaine de recherche qui tente de créer des systèmes automatiques pour déterminer l’opinion humaine à partir d’un texte écrit en langage naturel.
  • La scraping : collecte de données en ligne à partir de réseaux sociaux et d’autres sites Web sous forme de texte non structuré, également connu sous le nom de scraping de sites, harvesting Web et extraction de données Web.
  • Analyse des sentiments : l’analyse des sentiments fait référence à l’application du traitement du langage naturel, de la linguistique computationnelle et de l’analyse exploratoire de texte pour identifier et extraire des informations subjectives dans les documents sources.
  • L’analyse exploratoire de texte : implique la récupération d’informations (information retrieval, IR), l’analyse lexicale pour étudier les distributions de fréquence des mots, la reconnaissance de formes, le marquage/l’annotation, l’extraction d’informations, les techniques d’exploration de données, y compris l’analyse des liens et des associations, la visualisation et l’analyse exploratoire prédictive.

Références

  • Cioffi-Revilla C (2010) Computational social science. Wiley Inter-discip Rev Comput Statistics 2(3):259-271
  • Kaplan AM, Haenlein M (2010) Users of the world, unite! the challenges and opportunities of social media. Bus Horiz 53(1):59-68
  • Lazer D et al (2009) Computational social science. Science 323:721-723

Source: Bogdan Batrinca, Philip C. Treleaven, « Social media analytics: a survey of techniques, tools and platforms« , AI & Soc (2015) 30:89-116 DOI 10.1007/s00146-014-0549-4, Creative Commons Attribution License. Traduction et adaptation Nicolae Sfetcu

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *