您現(xiàn)在的位置:首頁 >關(guān)于我們 >行業(yè)新聞 >Google--PageRank(網(wǎng)頁級別)技術(shù)解密

Google--PageRank(網(wǎng)頁級別)技術(shù)解密

時間:2007年5月2日

1. 什么是PageRank
2. PageRank的決定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000項搜索結(jié)果
6. PageRank與其它影響網(wǎng)站排名因素間的區(qū)別

一:什么是PageRank(網(wǎng)頁級別)
        PageRank(網(wǎng)頁級別)是Google用于評測一個網(wǎng)頁“重要性”的一種方法。在揉合了諸如Title標(biāo)識和Keywords標(biāo)識等所有其它因素之后,Google通過PageRank來調(diào)整結(jié)果,使那些更具“重要性”的網(wǎng)頁在搜索結(jié)果中另網(wǎng)站排名獲得提升,從而提高搜索結(jié)果的相關(guān)性和質(zhì)量。apistockmarket.com
  簡單說來,Google通過下述幾個步驟來實現(xiàn)網(wǎng)頁在其搜索結(jié)果頁(SERPS)中的排名:
  1) 找到所有與搜索關(guān)鍵詞匹配的網(wǎng)頁
  2) 根據(jù)頁面因素如標(biāo)題\關(guān)鍵詞密度等排列等級
  3) 計算導(dǎo)入鏈接的錨文本中的關(guān)鍵詞
  4) 通過PageRank得分調(diào)整網(wǎng)站排名結(jié)果
  事實上,真正的網(wǎng)站排名過程并不是這么簡單,我們會在后面進(jìn)行詳細(xì)深入的闡述。

二:PageRank的決定因素
Google的PageRank是基于這樣一個理論:若B網(wǎng)頁設(shè)置有連接A網(wǎng)頁的鏈接(B為A的導(dǎo)入鏈接時),說明B認(rèn)為A有鏈接價值,是一個“重要”的網(wǎng)頁。當(dāng)B網(wǎng)頁級別(重要性)比較高時,則A網(wǎng)頁可從B網(wǎng)頁這個導(dǎo)入鏈接分得一定的級別(重要性),并平均分配給A網(wǎng)頁上的導(dǎo)出鏈接。

導(dǎo)入鏈接(也叫逆向鏈接)指鏈至你網(wǎng)站的站點,也就是我們一般所說的“外部鏈接”。而當(dāng)你鏈至另外一個站點,那么這個站點就是你的“導(dǎo)出鏈接”,即你向其它網(wǎng)站提供的本站鏈接。

PageRank反映了一個網(wǎng)頁的導(dǎo)入鏈接的級別(重要性)。所以一般說來,PageRank是由一個網(wǎng)站的導(dǎo)入鏈接的數(shù)量和這些鏈接的級別(重要性)所決定的。

三:如何知道一個網(wǎng)頁的PageRank得分
可從http://toolbar.google.com上下載并安裝Google的工具欄,這樣就能顯示所瀏覽網(wǎng)頁的PageRank得分了。PageRank得分從0到10,若不能顯示PageRank得分,可檢查所安裝版本號,需將老版本完全卸載,重啟機(jī)器后安裝最新版本即可。

四:PageRank的重要性
搜索引擎網(wǎng)站排名算法中的各排名因子的重要性均取決于它們所提供信息的質(zhì)量。但如果排名因子具有易操縱性,則往往會被一些網(wǎng)站管理員利用來實現(xiàn)不良競爭。例如初引入的排名因子之一--關(guān)鍵詞元標(biāo)識(Meta Keywords),是由于理論上它可以很好地概括反映一個頁面的內(nèi)容,但后來卻由于一些網(wǎng)站管理員的惡意操縱而不得不黯然退出。所以“加權(quán)值”--即我們對該因子提供信息的信任程度是由排名因子的易操縱程度和操縱程度共同決定的。

PageRank無疑是頗難被操縱的一個排名因子了。但在它最初推出時針對的只是鏈接的數(shù)量,所以被一些網(wǎng)站管理員鉆了空子,利用鏈接工廠和訪客簿等大量低劣外部鏈接輕而易舉地達(dá)到了自己的目的。Google意識到這個問題后,便在系統(tǒng)中整合了對鏈接的質(zhì)量分析,并對發(fā)現(xiàn)的作弊網(wǎng)站進(jìn)行封殺,從而不但有效地打擊了這種做法,而且保證了結(jié)果的相關(guān)性和精準(zhǔn)度。

五:Google的前1,000項搜索結(jié)果
一般說來,網(wǎng)站排名因素包括網(wǎng)頁標(biāo)題(META TITLE),網(wǎng)頁正文中的關(guān)鍵詞密度,錨文本(也叫鏈接文本,指鏈接或超鏈的文本內(nèi)容)和PageRank所決定的。

請記住:單靠PageRank是無法使你獲得比較理想的網(wǎng)站排名的。PageRank只是網(wǎng)站排名算法中的一個乘積因子,若你網(wǎng)站的其它排名因子的得分是零,就算你的PageRank是兩百億,最后的得分還是零。但這并不是說PageRank就毫無價值,而是在什么情況下PageRank才能完全發(fā)揮其功力。

如果在Google上進(jìn)行廣泛搜索,看起來好象有幾千個結(jié)果,但實際顯示最多前1,000項結(jié)果。例如對“car rental”,顯示搜索結(jié)果為5,110,000,但實際顯示結(jié)果只有826個。而且用時只有0.81秒。試想一下,0.84秒的時間就可以計算這五百萬搜索結(jié)果的每個排名因子得分,然后給出最終我們所看到的網(wǎng)站排名結(jié)果嗎?

答案就在于:搜索引擎選取與查詢條件最相關(guān)的那些網(wǎng)頁形成一個子集來加速搜索的速度。例如:假設(shè)子集中包含2,000個元素,搜索引擎所做的就是使用排名因子中的兩到三個因素對整個數(shù)據(jù)庫進(jìn)行查詢,找到針對這兩三個排名因子得分較高的前2,000個網(wǎng)頁。(請記住,雖然可能有五百多萬搜索結(jié)果,但最終實際顯示的1,000項搜索結(jié)果卻是從這個2,000頁的子集中提煉出來的。) 然后搜索引擎再把所有排名因子整合進(jìn)這2,000項搜索結(jié)果組成的子集中并進(jìn)行相應(yīng)的網(wǎng)站排名。由于按相性進(jìn)行排序,子集中越靠后的搜索結(jié)果(不是指網(wǎng)頁)相關(guān)性(質(zhì)量)也就越低,所以搜索引擎只向用戶顯示與查詢條件最相關(guān)的前1,000項搜索結(jié)果。

請注意,在搜索引擎生成這2,000項網(wǎng)頁的子集中我們強(qiáng)調(diào)了“相關(guān)性”這個詞。即搜索引擎找尋的是與查詢條件有共同主題的網(wǎng)頁。如果這時候我們把PageRank考慮進(jìn)去,就很可能得到一些PageRank很高但主題只是略微相關(guān)的一些搜索結(jié)果。顯然這有違搜索引擎為用戶提供最為相關(guān)和精準(zhǔn)的搜索結(jié)果的原則。

一旦理解了為什么會如此,就說明了為什么你應(yīng)當(dāng)首先努力在“頁面”因子和錨文本上下足工夫,最后才是PageRank。所以關(guān)鍵在于:

你必須首先在頁面因素和/或錨文本上下足工夫,使這些排名因子能夠獲得足夠的得分,從而使你的網(wǎng)站能夠按目標(biāo)關(guān)鍵詞躋身于這2,000項搜索結(jié)果的子集中,否則PageRank再高也與事無補(bǔ)。

六:PageRank和其它排名因子之間的不同

網(wǎng)頁Title標(biāo)識 僅能被列出一次。
正文中的關(guān)鍵詞 連續(xù)的重復(fù)只會降低關(guān)鍵詞的重要性,重要的是接近度。
錨文本 加權(quán)值極高,但存在上限,超過上限的錨文本信息將被忽略或降低權(quán)值。
PageRank 潛質(zhì)無窮,沒有上限的限制,但需要大量工作。
備注 其它排名因子都存在一個上限(闕值),超過上限部分其權(quán)值將降低或不再計分。PageRank則不存在此問題。

Google--PageRank(網(wǎng)頁級別)技術(shù)解密(二)

7. 非PageRank因素闕值
8. 使用闕值推知兩種排名策略的價值
9. PageRank的計算

七:非PageRank因子的上限闕值(Non-PageRank Factor Threshold)
除了PageRank外,其它排名因子都存在一個闕值,也叫臨界值或差值。即當(dāng)增長到一定值時,因子的重要性反而開始慢慢降低,則該值就是非PageRank因子的闕值。

設(shè)闕值為1,000,如果網(wǎng)頁A和B是我們對某一查詢條件的其中兩個查詢結(jié)果,且A的總分?jǐn)?shù)(包括頁面因子得分和PageRank得分)是900,B是500,則顯然A會排在B的前面。但由于A和B的分?jǐn)?shù)均低于我們上面假設(shè)的非PageRank因子闕值,因而在不改變PageRank的情況下,我們可以通過對B頁進(jìn)行精心的頁面優(yōu)化使頁面因子分?jǐn)?shù)得到提高來使其排名超過A。但如果A的總得分升至1,100分,則B若還只是一味優(yōu)化頁面因子是遠(yuǎn)遠(yuǎn)不夠的。在這種情況下,提升PageRank就成為首要任務(wù)了。

一般說來,Google的查詢結(jié)果頁中既可能包含一些分?jǐn)?shù)超過闕值的網(wǎng)頁,也可能包含一些分?jǐn)?shù)低于闕值的網(wǎng)頁。所以:

為了提高競爭能力,必須在闕值范圍內(nèi)盡可能提高頁面的搜索引擎排名得分,否則會降低頁面的競爭力!绊撁嬉蜃印笔墙咏瓦_(dá)到闕值最迅捷的方式,它與PageRank的結(jié)合使用才是提升網(wǎng)站排名得分的最佳優(yōu)化策略。

八:使用闕值推知兩種排名策略的價值
闕值解釋了搜索引擎商所遵循的原則和不同的實施途徑,同時亦闡述了為什么會產(chǎn)生關(guān)于PageRank的一些誤解。我們可以把這兩種策略當(dāng)成兩個人A和B。

A認(rèn)為“PageRank”并不重要。他們已有數(shù)年網(wǎng)頁優(yōu)化經(jīng)驗并知道如何完美地利用“頁面因素”來達(dá)到優(yōu)化的目的。他們亦理解基本的錨文本,但對PageRank得分毫不在意。結(jié)果如何呢?由于最大化地使用了“頁面因子”,從而使A迅速達(dá)到“非PageRank因子的闕值”。所以通過精心選擇關(guān)鍵詞可使他們獲得較好的網(wǎng)站排名。而且只要網(wǎng)站內(nèi)容比較好,隨著時間推移總會有排名高的站點鏈接,涓涓細(xì)流匯成河。A最后亦得到了PageRank得分,并籍此鞏固了排名。

B認(rèn)為“PageRank”十分重要。他掌握了很多關(guān)于提升PageRank得分的信息,并為提高該得分下足了工夫。結(jié)果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,結(jié)果卻得到了PageRank得分。而B在PageRank因子上下工夫,結(jié)果卻得到非PageRank因子得分。究其原因,就是由于提高PageRank得分需要外部鏈接,鏈接又具有錨文本,從而通過精心挑選外部鏈接的錨文本,B自發(fā)提高了其非PageRank因子的得分,從而贏得了較高的PageRank得分。

雖然這只是兩個極端,但我們可以利用它們來推知這兩種途徑各自的優(yōu)缺點:

對象
優(yōu)點
缺點
A:忽略PageRank
  • 網(wǎng)站排名在短期內(nèi)就可得到提升
  • 自我生成鏈接節(jié)省了工作量
  • 需投入大量工作維持網(wǎng)站排名
  • 對新競爭者的應(yīng)變速度較慢
  • B:忽略頁面排名因子
  • 可獲得可靠網(wǎng)站排名,并可在需要時輕松修改頁面因素使排名迅速提升
  • 極可能從非搜索類引擎來源上獲得更高訪問量
  • 網(wǎng)站排名提升較慢
  • 操作難度較大
  • 容易為SPAM過濾程序所制


  • 對象 優(yōu)點 缺點
    A:忽略PageRank 網(wǎng)站排名在短期內(nèi)就可得到提升

    自我生成鏈接節(jié)省了工作量
    需投入大量工作維持網(wǎng)站排名

    對新競爭者的應(yīng)變速度較慢

    B:忽略頁面排名因子 可獲得可靠網(wǎng)站排名,并可在需要時輕松修改頁面因素使排名迅速提升

    極可能從非搜索類引擎來源上獲得更高訪問量
    網(wǎng)站排名提升較慢

    操作難度較大

    容易為SPAM過濾程序所制

    事實上,我們前面說過,最終排名得分=所有非PageRank因子實際得分x實際PageRank得分。亦即二者相輔相成,再加上隨著網(wǎng)上營銷方式的發(fā)展壯大,關(guān)鍵詞的競爭也變的愈來愈激烈,這種情況下只靠非PageRank因子得到好排名顯然是不可能的。而且非PageRank因子存在著闕值的局限性。同時,對于競爭性極高的關(guān)鍵詞,還存在著PageRank下限的問題。也就是說,除非網(wǎng)站的PageRank得分超過這個下限標(biāo)準(zhǔn),否則網(wǎng)站排名很難上去。PageRank的下限由關(guān)鍵詞的競爭度所決定。競爭性一般的關(guān)鍵詞PageRank下限也不高,而對競爭較為激烈的關(guān)鍵詞來說,它所要求的PageRank下限相應(yīng)就要高。而PageRank得分的提升又非常有難,這時候非PageRank因子就變的非常重要了。
    綜上所述:我們需要充分發(fā)揮各排名因子的優(yōu)勢來贏取理想的綜合排名得分。同時關(guān)鍵詞(競爭度適宜)的精心選擇亦變的非常重要,它可以節(jié)省大量的支出。九:PageRank的計算方法
      PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
      其中PageRank (A)表示給定頁面A的PageRank得分;
      D為阻尼因子,一般設(shè)為0.85;
      PageRank (T1)表示一個指向A頁的網(wǎng)站其本身的PageRank得分;
      C(T1)表示該頁面所擁有的導(dǎo)出鏈接數(shù)量;
      PageRank (Tn)/C(Tn)表示為每一個指向A頁的頁面重復(fù)相同的操作步驟。

    事實上,計算某個頁面的PageRank得分需要大量繁復(fù)計算。例如若計算A頁的PageRank得分則首先要知道所有鏈至A頁的網(wǎng)頁(導(dǎo)入鏈接)的PageRank得分。要想知道這些外部鏈接頁的PageRank得分,又需要先知道這些頁面的外部鏈接的PageRank得分,等等。我們只需要知道:

    A頁的外部鏈接B能夠帶給A的PageRank得分與B的導(dǎo)出鏈接數(shù)量成反比,即隨著B上導(dǎo)出鏈接數(shù)的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個網(wǎng)頁的PageRank得分是該網(wǎng)頁對其它頁面投票的一個基本的度量形式。一個網(wǎng)頁可以投票給一個或多個導(dǎo)出鏈接,但其總投票權(quán)一定,并被平均分配給所有的導(dǎo)出鏈接。假設(shè)B的PageRank得分是5,且B上只有一條指向A的鏈接,那么A將獲得B全部的PageRank得分(B沒有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個鏈接,則A只能得到B的PageRank得分的N分之一。

    我們可以用圖表來闡述其工作原理。假設(shè)有四個網(wǎng)頁A,B,C和D,它們相互鏈接,如表-1所示:

    表-1:鏈接前的PageRank得分


    表-2:鏈接后的PageRank得分

    假設(shè)這四個網(wǎng)頁初始PageRank得分均為0。則根據(jù)上面的公式它們的PageRank得分都是0.15。我們計算一下鏈接后各自的PageRank得分情況。
    1.A鏈向B、C和D。A的初始PageRank得分是0.15,所以A的導(dǎo)出鏈接獲得PageRank得分總數(shù)為 0.85 * 0.15 = 0.1275。B,C和D三個網(wǎng)頁各得0.0425分。
    2.B鏈向C、B的初始PageRank得分也是0.15,所以其唯一鏈接頁面C所能夠獲得的PageRank得分是0.85 * 0.15 = 0.1275分。
      C鏈向A,其0.1275的PageRank得分傳遞給唯一鏈接對象A。
      D鏈向C,其0.1275的PageRank得分傳遞給了C。
      現(xiàn)在各網(wǎng)頁的PageRank得分結(jié)果如下:
      A:0.15 + 0.1275 (得自C) = 0.2775
      B:0.15 + 0.0425 (得自A) = 0.1925
      C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475
      D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
    繼續(xù)這樣的計算,直到每個頁面的數(shù)值逼近一個定值(PageRank屬收斂函數(shù))。最后可以發(fā)現(xiàn),C的PageRank最高。而且外部鏈接的數(shù)量顯著地改變了PageRank得的分布。

    表-3:最后的PageRank得分結(jié)果

    表-4:外部鏈接與PageRank得分對照表:

     
    導(dǎo)入鏈接
    數(shù)量
    導(dǎo)出鏈接
    數(shù)量
    最終PageRank得分
    C
    A/B/D
    3
    A
    1
    1.4860614724
    A
    C
    1
    B/C/D
    3
    1.4131522515
    B
    A
    1
    C
    1 0.5503931379
    D
    A
    1
    C
    1 0.5503931379


    十四:網(wǎng)站的內(nèi)部結(jié)構(gòu)和聯(lián)接

    一:網(wǎng)站的內(nèi)部頁面
    說完了“外部鏈接”,現(xiàn)在讓我們來看看“內(nèi)部鏈接”。如果PageRank確由頁面投票的質(zhì)量和數(shù)量所決定,那么我們立即就可以得出網(wǎng)站內(nèi)鏈與PageRank的關(guān)系的一個重要結(jié)論:

    網(wǎng)站上每個已被Google收錄的內(nèi)部網(wǎng)頁(內(nèi)鏈)都是對該網(wǎng)站的一記投票,不過投票份量很小。因而,一個網(wǎng)站若能擁有更多已被Google收錄的內(nèi)部網(wǎng)頁,就有可能獲得更多的總投票。

    這樣一來,我們可以通過創(chuàng)建大量內(nèi)部網(wǎng)頁來提高網(wǎng)站整體的PageRank。但這還遠(yuǎn)遠(yuǎn)不夠。因為我們此處所指的內(nèi)部網(wǎng)頁是指已被Google收錄,即擁有自己的PageRank的那些內(nèi)鏈頁面。這些網(wǎng)頁之所以被Google檢索是由于它們具備豐富充實的內(nèi)容。所以應(yīng)盡力充實和豐富你的網(wǎng)站,一旦網(wǎng)站內(nèi)容得到充實和豐富,會有更多的內(nèi)頁得到檢索,從而帶來更多的PageRank。同時“升值”的網(wǎng)站也會獲得更多站點的青睞,從而會有更多的站點主動鏈接你。

    簡言之,就提升PageRank而言,對“內(nèi)”最需要做的就是為網(wǎng)站填充更加豐富和有價值的內(nèi)容。應(yīng)確保網(wǎng)頁內(nèi)容不會過長或過短,如有必要可將網(wǎng)頁內(nèi)容分割成若干網(wǎng)頁。

    二:網(wǎng)站的內(nèi)部結(jié)構(gòu)&聯(lián)接
    網(wǎng)站有三種內(nèi)部聯(lián)方式,宜結(jié)合使用這三種聯(lián)接方式進(jìn)行網(wǎng)站的建設(shè)。假設(shè)一個網(wǎng)站由“主頁”,“關(guān)于我們”頁,“產(chǎn)品介紹”頁和“更多信息”頁這四個頁面組成,通過下表我們可以看出每種結(jié)構(gòu)對網(wǎng)站PageRank的影響度。

    表-11:層級結(jié)構(gòu)(Hierarchical)

    表-12:環(huán)路網(wǎng)站結(jié)構(gòu)(Looping)

    表-13:內(nèi)頁廣泛互聯(lián)的網(wǎng)站結(jié)構(gòu)(Extensive Interlinking)

    表14-16是內(nèi)部頁面在不同結(jié)構(gòu)網(wǎng)站上的PageRank分布情況。了解了這一點我們就可以從“內(nèi)部鏈接”著手來獲得最大的PageRank反饋。

    世紀(jì)創(chuàng)聯(lián)

    Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營性ICP/ISP證 備案號:B1-20180452   豫公網(wǎng)安備 41019702002018號    電子營業(yè)執(zhí)照