一式解讀 PageRank

轉貼自http://mmdays.wordpress.com

大家都說一圖抵得千言萬語,也許對於學習數學的人來說,一個數學公式也是「一式抵得千言萬語」,我們這邊就拿 PageRank 這個演算法來講好了,PageRank 一直是搜尋引擎最佳化這個產業最為關注的焦點之一,那麼你的網頁 PageRank 是怎麼算出來的?請看以下的式子:

PageRank

其中

  • T1 到 Tn 是連結到你的 n 個網頁
  • PR(A) 是你網頁的 PageRank 值
  • PR(T1) 是 T1 這個網頁的 PageRank 值,以此類推
  • C(T1) 是 T1 這個網頁對外的連結數目,以此類推

看看上面這個公式翻譯成白話文的話,就是假設有 n 個網頁連結到你的網站,那麼你的 PageRank 就是這些網頁個別的 PageRank 值除以他們個別的對外連結數目,再白話一點,在你的立場來看,別人的 PageRank 值就是他們手上握有的投票數目,他們對外連結的數目就代表了他們把自己手中的票均分成幾份投了出去。也就是說,別人連結到你的網站,就表示他投了票給你,但是這票的效力有多少,就取決於他把票投給了幾個人,如果他手中的 PageRank 值是 5 (也就是五票),而他把票投給 10 個人的話 (也就是有十個對外連結),那麼你從他手中拿到的票就只有 0.5 票。

所以,連結到你網站的網頁越多,你的 PageRank 就越高,這個結論大致上是對的,但是如果連結到你的網站的連結都是一些很弱的連結 (對方有太多的對外連結或是 PageRank 不夠高),那麼你的 PageRank 就比較難以累積。當大家談到 PageRank 時,都喜歡說「一個連結就是一票」,其實從上面的簡單分析就知道這是不太正確的。在 PageRank 的世界中,不是每個網站都是人人平等、人人一票,有的人可以有好多票,而且要把這些票分多細去投都可以。

這樣的投票機制會衍伸出一個問題,對於你自己的網站而言,如果有很多人去你那邊留言,並且在留言中留下連結到他們自己的網站 ,那麼你的 PageRank 值就會有一些被分到這些網站去,如此一來,其他你自己真正有價值的對外連結,效力就會被減弱,投票變成了偷票。要避免這個問題很簡單,Google 已經在 2005 年就給大家一個解決方案,你只要告訴 Google 不要讓這些連結去瓜分你的 PageRank 就可以了。如果你懂得一點 HTML,方法就是在原本的連結 tag 之中加上 rel=”nofollow” 這個 attribute:

如果某個網友跑來你這邊留下連結:
<a href="http://certain-link.com">歡迎參觀</a>
你只要把上面的 code 改成
<a href="http://certain-link.com" rel=”nofollow”>歡迎參觀</a>

這樣子一來你的 PageRank就不會被這個連結瓜分出去了,這種 tag 方式可以告訴搜尋引擎不要把這個連結納入 PageRank 的計算,MSN Search 和 Yahoo Search 都認得這種 tag 方式。

值得注意的是,Google 在決定網頁的搜尋結果排名時,PageRank 只是其中一項依據, 畢竟 PageRank 的計算與搜尋的內容無關,是一個絕對的數值,所以在決定搜尋結果的排名時,Google 還要看使用者是在搜尋什麼東西,用另外的機制來決定網頁的排名,而這就是另外一個故事了。

~ 由 壞孩子 於 六月 5, 2007.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

 
%d 位部落客按了讚: