Home » Articole » Articole » Afaceri » Traduceri » BabelNet

BabelNet

postat în: Traduceri 0

The_BabelNet_structure

BabelNet este o reţea semantică lexicalizată multilingvă şi ontologie. BabelNet a fost creat în mod automat prin conectarea celei mai mari enciclopedii online în mai multe limbi (Wikipedia) la cel mai popular lexicon de calcul a limbii engleze, WordNet. Integrarea se realizează prin intermediul unui automat de cartografiere și de completare a lacunelor lexicale în limbile cu resurse sarace, cu ajutorul traducerii automate statistice. Rezultatul este un „dicționar enciclopedic”, care oferă concepte și entități numite lexicalizate în mai multe limbi, și conectat cu cantități mari de relații semantice. În mod similar ca la WordNet, BabelNet grupează cuvinte din limbi diferite în seturi de sinonime, numite synset-uri Babel. Pentru fiecare synset Babel, BabelNet oferă definiții scurte (numite glose) în mai multe limbi colectate atât din WordNet cât și Wikipedia.

Statistica BabelNet

Din octombrie 2013, BabelNet (versiunea 2.0) acoperă 50 de limbi, inclusiv toate limbile europene, şi cele mai multe limbi asiatice, și chiar latină. BabelNet 2.0 conține mai mult de 9 milioane de synset-uri şi aproximativ 50 de milioane de sensuri de cuvinte (indiferent de limba lor). Fiecare synset Babel conține 5,5 sinonime în medie, de exemplu sensurile cuvintelor, în orice limbă. Rețeaua semantică include toate relațiile lexico-semantice din WordNet (hypernimie și hiponimie, meronimie și holonimie, antonimie și sinonimie, etc, totalizând aproximativ 364.000 seturi de relații), precum și o relație de înrudire subspecificată din Wikipedia (un total de aproximativ 262 milioane seturi de relații). Versiunea 2.0 asociază, de asemenea, 7,7 milioane de imagini cu synset-uri Babel, și oferă o codare Lemon RDF a resursei.

Aplicații

BabelNet permite aplicații multilingve de procesare a limbajului natural. Cunoștințele lexicalizate disponibile în BabelNet obțin rezultate deosebite în corelarea semantică și dezambiguizarea multilingvă a sensului cuvintelor.

Acest articol conţine materiale din Wikipedia sub licenţă gratuită GNU.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *