Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Accesul la fluxul de date prin intermediul API-urilor în media wiki, pentru analitica rețelelor sociale

Accesul la fluxul de date prin intermediul API-urilor în media wiki, pentru analitica rețelelor sociale

Pentru cercetători, probabil că cele mai utile surse de date din rețelele sociale sunt cele care oferă acces programabil prin intermediul API-urilor, folosind de obicei protocoale bazate pe HTTP. Având în vedere importanța lor pentru mediul academic, se pot folosi wiki-uri, rețelele sociale, fluxuri RSS, știri etc.

Gnip(Tabloul de bord Gnip, editorii și fluxurile)

Wikipedia (și wiki-urile în general) oferă cadrelor academice arhive mari open-source de conținut generat de utilizatori (crowdsourcing). Ceea ce nu este cunoscut este faptul că Wikipedia oferă API-uri bazate pe HTTP care permit acces programabil și căutare (adică, scraping) care returnează date într-o varietate de formate, inclusiv XML. De fapt, API-ul nu este unic pentru Wikipedia, ci face parte din setul de instrumente open-source al MediaWiki și, prin urmare, poate fi folosit cu orice wiki bazat pe MediaWiki.

API-ul wiki bazat pe HTTP funcționează prin acceptarea solicitărilor care conțin unul sau mai multe argumente de intrare și returnând șiruri, adesea în format XML, care pot fi analizate și utilizate de clientul solicitant. Alte formate acceptate includ JSON, WDDX, YAML sau PHP serializate. Detalii pot fi găsite la: http://en.wikipedia.org/w/api.php?action=query&list=allcategories&acprop=size&acprefix=hollywood&format=xml .

Solicitarea HTTP trebuie să conțină: a) „acțiunea” solicitată, cum ar fi operația de interogare, editare sau ștergere; b) o cerere de autentificare; și c) orice alte acțiuni susținute. De exemplu, solicitarea de mai sus returnează un șir XML enumerând primele 10 categorii Wikipedia cu prefixul „hollywood”. Vaswani (2011) oferă o descriere detaliată a modului în care să faceți scrapping pe Wikipedia folosind un mediu de dezvoltare Apache/PHP și un client HTTP capabil să transmită solicitările GET și PUT și gestionarea răspunsurilor.

Referințe

Sursa: Bogdan Batrinca, Philip C. Treleaven, „Social media analytics: a survey of techniques, tools and platforms„, AI & Soc (2015) 30:89-116 DOI 10.1007/s00146-014-0549-4, Creative Commons Attribution License. Traducere și adaptare Nicolae Sfetcu

Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Transformă-ți perspectiva asupra tehnologiei blockchain și începe să descoperi oportunitățile digitale de mâine!

Nu a fost votat 23.89 lei57.41 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Big Data: Modele de afaceri - Securitatea megadatelor
Big Data: Modele de afaceri – Securitatea megadatelor

Nu rata oportunitatea de a rămâne competitiv într-o lume bazată pe date!

Nu a fost votat 19.11 lei28.68 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.
Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat 0.00 lei11.25 lei Selectează opțiunile Acest produs are mai multe variații. Opțiunile pot fi alese în pagina produsului.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *