ponedjeljak, 24. rujna 2007.

Kako se racuna Page Rank

Page Rank je mjerilo popularnosti odredjene web stranice. Sto je vise jedna stranica linkana sa drugih stranica, veci ce biti njen Page Rank.

Ono sto nas interesira je koju vrijednost Page Rank-a nam prenosi neka stranica koja nas linka. Da bismo imali ovu vrijednost potrebne su nam dvije informacije: realna vrijednost Page Rank-a stranice koja nas linka i ukupno broj linkova na samoj stranici.

Vrijednost Page Rank-a poznata svima je ona koju pokazuje Google Toolbar i koja varira od 0 do 10. Ta vrijednost je logaritamska predstava realne vrijednosti i uvijek je zaokruzena na nize (prakticno se zanemaruje decimali dio).

Po formuli za racunanje Page Rank-a, realna vrijednost koju neka stranica (nazovimo je stranica A) prenosi stranici koju linka (zovimo je X) je:

PR[Xa] = d * ( PR[A] / C[A])

Rijecima: realna vrijednost Page Rank-a koju dobija stranica X od stranice A (PR[Xa]) se dobije podjelivsi realni Page Rank stranice A (PR[A]) sa ukupnim brojem linkova koji se nalaze na stranici A (C[A]) (uzimajuci u obzir unutrasnje i vanjske linkove). Tako dobivena vrijednost se mnozi s faktorom prigusenja (d), za koji se preptostavlja da ima vrijednost 0,75 (ta vrijednost nije poznata, ali se koncept izlaganjane ne mijenja, ako usvojena vrijednost nije sasvim tocna).

Vrijednost realnog Page Rank-a stranice X je zbroj svih “doprinosa” koje stranica dobiva od raznih stranica koje je linkaju. Pretpstavljajuci da je stranica X linkano sa stranica A, B, C e D, njen stvarni Page Rank ce biti:

PR[X] = PR[Xa] + PR[Xb] + PR[Xc] + PR[Xd]

Usvojiti cemo da se koristi logaritam na bazi 7 (i ovdje se ne poznaje tocna vrijednost koju Google koristi).

Na osnovu gore iznesenih podataka, moze se izracunati tabela realnih vrijednosti Page Rank-a koju neka stranica (A) s odredjenim Page Rank-om procitanim sa Toolbar-a prenosi stranici koju linka (X), pretpostavljajuci da ta stranica (A) linka samo stranicu X.

PR Minimalna Maksimalna
Toolbar vrijednost vrijednost
0 1 4
1 5 36
2 37 256
3 257 1.800
4 1.801 12.604
5 12.605 88.236
6 88.237 617.656

Paznja: ovo nisu realne vrijednosti Page Rank-a, nego vrijednosti Page Rank-a koju prenosi stranica na stranicu koju linka.

Minimalne vrijednosti su dobivene potencirajuci broj 7 (baza logaritma) sa PR-om i mnozeci vrijednost sa 0,75 (faktor prigusenja), na primjer: minimalna vrijednost za Toolbar Page Rank 5 je (7^5)*0,75 = 12.605.

Maksimalna vrijednost se dobije umanjujuci za jedan minimalnu vrijednost za slijedeci, veci Page Rank, na primjer: maksimalna vrijednost za Toolbar Page Rank 5 je 88.237-1 = 88.236.

Da bi se poznavala stvarna vrijednost koju daje neka stranica, treba uzeti realnu vrijednost njenog Page Rank-a iz gornje tabele i podijeliti je sa ukupnim brojem linkova na toj stranici. Ovdje se postavlja jedan problem: koju vrijednost uzeti iz tabele? Onu minimalnu ili maksimalnu, ili neku srednju?

Nije moguce rijesiti ovaj problem jer iz informacije o Page Rank-u koju nam daje Google preko Toolbar-a mozemo izracunati samo siroki interval vrijednosti, a ne tocnu vrijednost. Osobno, gotovo uvijek radim s minimalnom vrijednoscu, sto je jako na strani sigurnosti.

Jos jedan problem koji treba rijesiti je kako naci ukupni broj linkova na stranici. Postoje na Internetu site-ovi preko kojih se moze dobiti ova informacija.

Na kraju svih proracuna, zbrajajuci parcijalne vrijednosti Page Rank-a sa svih stranica koje nas linkaju, dobiti cemo stvarnu vrijednost Page Rank-a nase stranice. Prepostavimo da je ta vrijednost 780. Da bi se dobio ekvivalentni Toolbar Page Rank treba izracunati logaritam na bazi 7 te vrijednosti.
Buduci se ta funkcija (logaritam na bazi 7) ne nalazi na uobicajenim kalkulatorima, moze se koristiti logaritam na bazi 10, na slijedeci nacin: log(780) / log(7) = 3,4. Kako se vrijednost zaokruzuje uvijek na manje, Page Rank na ToolBar-u ce biti 3.