(PageRanks matematic pentru o rețea simplă, exprimată în procente (Google utilizează o scară logaritmică). Pagina C are un PageRank mai mare decât pagina E, chiar dacă sunt mai puține linkuri către C. Singurul link către C vine de la o pagină importantă și, prin urmare, este de valoare mai mare. Dacă navigatorii web care încep de la o pagină la întâmplare au o probabilitate de 85% de a alege un link aleator de pe pagina pe care se găsesc în vizită, precum și o probabilitate de 15% de a sări la o pagină aleasă la întâmplare de pe întregul Web, ele vor ajunge pe pagina E în 8,1% din cazuri. (probabilitatea de 15% pentru saltul la o pagină arbitrară corespunde unui factor de amortizare de 85%.) Fără amortizare, toţi surferii web vor termina în cele din urmă pe pagini A, B, sau C, și toate celelalte pagini vor avea PageRank zero. În prezența amortizării, pagina A se leagă în mod eficient la toate paginile din web, chiar dacă nu are legături de ieșire proprii.)
PageRank este un algoritm folosit de Google Search pentru a clasifica site-urile din rezultatele motorului de căutare. PageRank a fost numit după Larry Page, unul dintre fondatorii Google. PageRank este o modalitate de măsurare a ponderii paginilor site-ului. Potrivit lui Google:
„PageRank funcţionează prin luarea în considerare a numărului și calităţii linkurilor către o pagină pentru a determina o estimare aproximativă a cât de important este site-ul. Ipoteza de bază este că site-urile mult mai importante sunt susceptibile de a primi mai multe linkuri de la alte site-uri.”
Acesta nu este singurul algoritm utilizat de Google pentru a ordona rezultatele motorului de căutare, dar acesta este prima algoritm care a fost folosit de companie, şi este cel mai cunoscut.
Descriere
PageRank este un algoritm de analiză a linkurilor și atribuie o pondere numerică fiecărui element al unui set de hyperlinkuri ale documentelor, cum ar fi World Wide Web, cu scopul de a „măsura” importanța sa relativă în set. Algoritmul poate fi aplicat la orice colecție de entități cu citări și referințe reciproce. Greutatea numerică atribuiră oricărui element dat E este menționată ca PageRank a lui E și notată prin PR(E). Alți factori, cum ar fi Author Rank, pot contribui de asemenea la importanța unei entități.
Un PageRank rezultă dintr-un algoritm matematic bazat pe webgraph, creat de toate paginile World Wide Web ca noduri și hiperlinkuri ca terminale, luând în considerare huburi de autoritate, cum ar fi cnn.com sau usa.gov. Valoarea rangului indică importanța unei anumite pagini. Un hiperlink către o pagină conteaza ca un vot de recomandare. PageRank-ul unei pagini este definit recursiv și depinde de numărul și metrica PageRank-urilor tuturor paginilor care se leagă de aceasta („link-uri primite”). O pagină către care vin linkuri de la mai multe pagini cu PageRank mare primește şi ea un rang înalt.
Numeroase lucrări academice referitoare la PageRank au fost publicate după publicarea originală a lui Page si Brin. În practică, conceptul PageRank poate fi vulnerabil la manipulare. Cercetările au fost efectuate în identificarea rangurilor PageRank influențate incorect. Scopul este de a găsi un mijloc eficient de a ignora linkuri din documente cu PageRank obţinute incorect.
Alţi algoritmi de clasare bazate pe link pentru pagini Web includ algoritmul HITS inventat de Jon Kleinberg (utilizat de Teoma și acum Ask.com), proiectul IBM CLEVER, algoritmul TrustRank și algoritmul Hummingbird.
Algoritmul
Algoritmul PageRank determină o distribuție de probabilitate utilizată pentru a reprezenta probabilitatea ca o persoană care face clic pe linkuri la întâmplare să ajungă la orice pagină. PageRank poate fi calculat pentru colecții de documente de orice dimensiune. Se presupune în mai multe lucrări de cercetare că distribuția este egal împărțită între toate documentele din colecție la începutul procesului de calcul. Calculele PageRank necesită mai multe treceri, numite „iterații”, prin colectare pentru a ajusta valorile PageRank aproximative pentru a reflecta mai îndeaproape teoretic valoarea reală.
O probabilitate este exprimată ca o valoare numerică între 0 și 1. Probabilitatea 0,5 este de obicei exprimată ca „50% șansă” din ceva ce se întâmplă. Prin urmare, un PageRank de 0,5 înseamnă că există o șansă de 50% ca o persoană care face clic pe un link la întâmplare să fie direcționată către documentul cu PageRank 0,5.
Bara de instrumente Google
Bara de instrumente pentru PageRank (Google Toolbar) afişeaza PageRank al unei pagini vizitate ca un număr întreg între 0 și 10. Cele mai populare site-uri au un PageRank de 10. Cele mai puțin populare au un PageRank de 0. Google nu a dezvăluit metoda specifică pentru stabilirea unei valori. Bara de instrumente PageRank trebuie să fie luate în considerare doar ca o indicație aproximativă a valorii unui site web.
PageRank măsoară numărul de site-uri care se leagă de o anumită pagină. PageRank al unei anumite pagini se bazează în mare pe cantitatea de linkuri spre ea, precum și PageRank-ul paginilor care furnizează linkurile. Algoritmul include de asemenea şi alți factori, cum ar fi dimensiunea unei pagini, numărul de schimbări, data la care pagina a fost actualizată, textul în titluri și textul în textele ancoră cu link.
Bara de instrumente pentru PageRank nu este actualizată frecvent, deci valorile pe care le prezintă sunt de multe ori depășite.
Rangul în SERP
Pagina cu rezultatele motorului de căutare (SERP) este rezultatul efectiv returnat de un motor de căutare ca răspuns la o interogare pentru un cuvânt cheie. SERP constă dintr-o listă de linkuri către pagini web cu fragmente de text asociate. Rangul SERP al unei pagini web se referă la plasarea linkului corespunzător în SERP, unde un plasament mai sus înseamnă rang SERP superior. Rangul SERP al unei pagini web este o funcție nu numai de PageRank-ul său, ci de un set relativ mare și ajustat continuu de factori (peste 200). Optimizarea pentru motoarele de căutare (SEO) are drept scop influențarea rangului SERP pentru un site web sau un set de pagini web.
Poziționarea unei pagini web pe SERP-ul lui Google pentru un cuvânt cheie depinde de relevanță și reputație, de asemenea cunoscute sub numele de autoritate și popularitate. PageRank este indicatorul Google de evaluare a reputației unei pagini web: nu depinde de cuvintele cheie. Google utilizează o combinație de autoritate a pagini web și a site-ului pentru a determina autoritatea generală a unei pagini web concurente pentru un cuvânt cheie. PageRank de pe prima pagina a unui site web este cea mai importantă indicație Google pentru autoritatea site-ului.
După introducerea serviciului Google Places în SERP organic principal, numeroși alți factori în plus față de PageRank afectează clasamentul afacerilor în Local Business Results.
PageRank false sau falsificate
În trecut, PageRank-ul prezentat în bara de instrumente era ușor de manipulat. Redirecţionarea de la o pagină la alta, fie prin intermediul unui răspuns HTTP 302 fie cu o etichetă meta „Refresh”, făcea ca pagina sursă să obţină PageRank-ul paginii de destinație. Prin urmare, o nouă pagină cu PR 0 și fără niciun link către ea putea în principiu obține PR 10 prin redirecționarea de la pagina de start Google. Această tehnică de falsificare a fost o vulnerabilitate cunoscută. Falsificarea poate fi detectată în general prin efectuarea unei căutări pe Google pentru un URL sursă; dacă URL-ul unui site cu totul diferit este afișat în rezultate, acest din urmă URL poate reprezenta destinația unei redirecționări.
Manipularea PageRank
În scopul optimizării pentru motoarele de căutare, unele companii se oferă să vândă linkuricu PageRank mari către webmasteri. Întrucât linkurile din pagini cu PR mai mare sunt considerate a fi mai valoroase, ele tind să fie mai scumpe. Aceasta poate fi o strategie eficientă și viabilă de marketing pentru a cumpăra linkuri pe paginile de conținut ale site-urilor de calitate și relevante pentru a genera trafic și a crește popularitatea linkului unui webmaster. Cu toate acestea, Google a avertizat public webmasterii că dacă sunt sau au fost descoperiţi că vând linkuri cu scopul de a conferi PageRank și reputație, linkurile lor vor fi devalorizate (ignorate în calcularea PageRank pentru alte pagini). Practica de cumpărare şi vânzare de linkuri este intens dezbătută în cadrul comunității webmasterilor. Google recomandă webmasterilor să utilizeze valoarea atributului HTML nofollow pe linkuri sponsorizate. Potrivit lui Matt Cutts, Google este preocupat de webmasterii care încearcă să păcălească sistemul, și să reducă astfel calitatea și relevanța rezultatelor de căutare Google.
Modelul surferului intențional
Algoritmul PageRank inițial reflecta așa-numitul model surferului aleatoriu, ceea ce înseamnă că PageRank al unei anumite pagini este derivat din probabilitatea teoretică a vizitării acelei pagini, atunci când faceți clic pe linkuri la întâmplare. Un model de clasament al paginii care reflectă importanța unei anumite pagini, ca funcție de cât de multe vizite actuale primește de utilizatorii reali se numeşte modelul surferului intențional. Bara de instrumente Google trimite informații către Google pentru fiecare pagină vizitată, și, astfel, oferă o bază pentru calcularea PageRank bazat pe modelul surferului intențional. Introducerea atributului nofollow de Google pentru a combate spamarea indexării are ca efect secundar că webmasterii de obicei se folosesc de linkuri de ieșire pentru a spori propriul lor PageRank. Acest lucru duce la o pierdere de linkuri reale pentru crawlerele Web, făcând astfel algoritmul PageRank original bazat pe modelul de surfer aleatoriu potențial nesigur. Folosind informațiile despre obiceiurile de navigare ale utilizatorilor furnizate de bara de instrumente Google compensează parțial pierderea de informaţii cauzată de atributul nofollow. Rangul SERP al unei pagini, care determină plasarea reală a paginii în rezultatele de căutare, se bazează pe o combinație a modelului surferului aleatoriu (PageRank) și modelul surferului intențional (obiceiurile de navigare), în plus față de alți factori.
Lasă un răspuns