歡迎訪問SEO診斷網官方網站!

SEO診斷

如何讓搜索引擎重新收錄和更新優化完的網頁?


如何讓搜索引擎重新收錄和更新優化完的網頁?老周最近幾天正在閱讀關于搜索引擎核心技術的一本書,今天看到了一個關于搜索引擎網頁更新策略的文章,特來給大家分享一下,因為個人覺得這能夠加深大家對搜索引擎的理解。


我就簡單的用自己網站SEO診斷總結的語言來給大家介紹下,搜索引擎是如何更新已收錄頁面的?


我們網站的一個頁面被收錄了,搜索引擎不可能每天還來爬一遍特意檢查下頁面有沒有變化;那么假如我們將這個頁面做了一定的改動,搜索引擎又會如何知道呢?很顯然,某個網頁已被刪除或者內容作出重大變動,而搜索引擎對此卻茫然不知,仍按照舊有內容排序,將其作為結果搜索提供給用戶,其用戶體驗糟糕的不言而喻。


所以,對于已經抓取過的網頁,爬蟲還要負責保持快照內容和互聯網實際內容的同步,這取決于爬蟲所采用的網頁更新策略!


搜索引擎重用的網頁更新策略有三種

歷史參考策略

用戶體驗策略

聚類抽樣策略

這三種方式的順序也能夠體現搜索引擎的進步,接下來就給大家簡單介紹下三種策略的區別。


歷史參考策略

這種策略用通俗的話來說就是最不靠譜的了。因為它建立于如下假設之上:過去頻繁更新的網頁,那么將來也會頻繁更新;這種方法是通過判斷你網站頁面的歷史更新信息,來預估某個網頁何時進行更新,這時就過來再次爬取你網站已被收錄的頁面。


哪里的改動算更新?

不同的方法側重點不同,有的研究將一個網頁劃分成不同的區域,抓取策略應該忽略掉廣告欄或者導航欄這類不重要區域的變化,而集中到頁面的核心內容變化探測上。

缺點:如果網站的網頁都是首次抓取,那么就沒有歷史信息可供參考,也就無法預估更新周期了,另外如果為每個網頁保存其歷史信息,搜搜索引擎會增加大量的額外負擔。


用戶體驗策略

這種策略思想是這樣的:以用戶體驗為核心,即使索引過的網頁內容是過時的,那么在不影響用戶體驗的前提下,晚些更新這些過時網頁也是未嘗不可的。


那么如何判定一個網頁何時更新為好?取決于一個網頁的內容變化所帶來的搜索質量的變化,也就是用搜索結果的排名變化來衡量,影響越大的網頁,則越快更新。可能有的朋友對這句話不怎么理解,我再解釋一下,首先你要了解,搜索引擎的爬蟲程序和排名程序是相對獨立卻又緊密相關的。


通過搜索引擎搜索到的一個頁面的質量變化,比如內容被刪了、大幅修改了,等等都會直接導致跳出率增加、停留時間減少等等(搜索質量的體現),從而導致網頁排名下降,搜索引擎通過判斷排名變化來衡量影響的大小,當然,影響包括好和壞,好的影響比如排名上升也是屬于影響。


這里涉及到一個量的問題,就是變化在多大的范圍內算為影響?用戶體驗策略保存網頁的多個歷史版本,并根據過去每次變化對于搜索質量的影響,得出一個平均值,以此作為爬蟲再次抓取該網頁的時機。


缺點:與第一種一樣,需要保存網頁都額歷史信息,會給搜索引擎增加額外的負擔,同樣會存在沒有歷史信息的情況。


聚類抽樣策略

聚類抽樣的原理:網頁具有一些屬性,根據這些屬性可以預測其更新周期,具有相似屬性的網頁,其更新周期也是類似的。


所以簡單點說就是,根據網頁表現出來的特性,將其聚類成不同的類別,每個類別內的網頁具有詳細的更新周期,然后從這些類別中分別抽取一部分最具有代表性的網頁,計算這些網頁的更新周期,然后將這個更新周期應用于這個類別里的所有網頁。最終,只需要根據網頁所屬類別來決定其更新頻率。


其實這一點與我們平時判斷一個網站的關鍵詞頻率的方法是相似的,因為判斷一個網站的關鍵詞密度多少合適,就是分析這個行業類的平均密度是怎么樣的。


那么搜索引擎是根據網頁的哪些屬性來分類的呢?分為兩類:

靜態特性:頁面的內容、圖片數量、頁面大小、鏈接深度、等等十幾種因素。

動態特性:體現了靜態特征隨著時間的變化情況,也就是圖片數量的變化、鏈接的變化等等。


這種更新策略是效果是明顯好于前兩種的,第一,無需保存每個網頁的歷史信息,第二,對于沒有歷史信息的新網頁也可以判斷其更新周期。

 

以上就是搜索引擎對于網頁的更新策略,雖然這對于我們實際操作沒有什么用處,但是能夠幫助網站SEO診斷我們進一步了解搜索引擎的!


作者:周志松

微信/QQ:540220927

首發:SEO診斷

轉載請注明出處:http://www.szvsd.com



  • 上一篇:如何提高網站文章頁面的收錄量?新手必看!
  • 下一篇:百度簡單搜索是否是SEO的新機會?
  • X
    點擊這里給我發消息 點擊這里給我發消息 點擊這里給我發消息
    美女图片|美女图片大全|好看的图片大全|妹子天空