Home » Articole » Articole » Afaceri » Știința datelor (Data Science) » Data mining » Mineritul structurii web

Mineritul structurii web

postat în: Data mining 0

Acesta analizează structura linkurilor site-ului. Această structură de legături poate fi organizată sub formă de topologie și poate fi folosită pentru a găsi similarități și relații între site-uri web. Aceste informații despre linkuri pot fi folosite și pentru reorganizarea site-ului web și clasarea paginilor web. Algoritmul popular bazat pe linkuri pentru clasarea paginilor sunt HITS (Hypertext Induced Topic Search – Căutare de subiecte induse prin hipertext) și PageRank [22]. După ce am văzut rezultatul analizei minării structurii web, o nouă zonă de cercetare numită Link Mining (mineritul linkurilor) devine și ea populară. Unele dintre sarcinile posibile ale minării de linkuri sunt următoarele:

  1. Clasificare bazată pe link: paginile web sunt reprezentate ca noduri ale graficului web. Aceasta etichetează sau clasifică nodurile sau obiectele din grafic pe baza caracteristicilor nodurilor sau nodurilor învecinate.
  2. Analiza cluster bazată pe link: linkul paginii web include suficiente informații pentru gruparea site-urilor web. Aceasta folosește abordarea de învățare nesupravegheată.
  3. Tip de link: aceasta este folosită pentru a prezice tipul sau scopul linkului dintre două pagini web.
  4. Puterea linkului: indică importanța unei legături prin ponderea asocierii pentru aceasta. Ponderea este atribuită în funcție de gradul de apropiere dintre două noduri/pagini din graficul web.
  5. Cardinalitatea linkului: indică numărul de linkuri existente între două noduri din graficul web.

Referințe

  • Page, L., Brin, S., Motwani, R., and Winograd, T. The Pagerank citation ranking: Bring order to the web. Technical report, Stanford University, 1998.

Sursa: Santosh Kumar and Ravi Kumar, ”A Study on Different Aspects of Web Mining and Research Issues”, 2021 IOP Conf. Ser.: Mater. Sci. Eng. 1022 012018. Licența CC BY 3.0. Traducere Nicolae Sfetcu

Etica Big Data în cercetare
Etica Big Data în cercetare

Principalele probleme cu care se confruntă oamenii de știință în lucrul cu seturile mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv legislația din Uniunea Europeană. După o scurtă Introducere despre Big Data, secțiunea Tehnologia prezintă … Citeşte mai mult

Nu a fost votat $0.00$2.35 Selectează opțiunile
Analitica rețelelor sociale
Analitica rețelelor sociale

Analitica rețelelor sociale este un domeniu nou și emergent, pregătit pentru a permite companiilor să își îmbunătățească inițiativele de gestionare a performanței în diferite funcții de afaceri. Indiferent dacă este vorba de măsurarea eficienței campaniilor promoționale, colectarea de informații despre … Citeşte mai mult

Nu a fost votat $3.99 Selectează opțiunile
Tehnologia Blockchain - Bitcoin
Tehnologia Blockchain – Bitcoin

Internetul a schimbat complet lumea, cultura şi obiceiurile oamenilor. După o primă fază caracterizată prin transferul liber al informaţiilor, au apărut preocupările pentru siguranţa comunicaţiilor online şi confidenţialitatea utilizatorilor. Tehnologia blockchain asigură ambele aceste deziderate. Relativ nouă, ea are şansa să producă … Citeşte mai mult

Nu a fost votat $4.99$11.99 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *