丰满少妇理伦A片在线看,精品日产卡一卡二卡麻豆,天堂之囚在线观看,少妇富婆按摩偷人a片

  • 歡迎使用超級蜘蛛池(CJZZC)網(wǎng)站外鏈優(yōu)化,收藏快捷鍵 CTRL + D

什么是搜索引擎蜘蛛抓取份额?


顧名思義,抓取份額是搜索引擎蜘蛛花在一個網(wǎng)站上的抓取頁面的總的時間上限。對于特定網(wǎng)站,搜索引擎蜘蛛花在這個網(wǎng)站上的總時間是相對固定的,不會無限制地抓取網(wǎng)站所有頁面。抓取份額的英文Google用的是crawl budget,直譯是爬行預算,我覺得不太能說明是什么意思,所以用抓取份額表達這個概念。抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。

什么是搜索引擎蜘蛛抓取份額?

一、抓取需求

抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁面。

決定抓取需求的主要有兩個因素。一是頁面權(quán)重,網(wǎng)站上有多少頁面達到了基本頁面權(quán)重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權(quán)重,權(quán)重高的頁面就不會太久不更新。頁面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁面。

二、抓取速度限制

搜索引擎蜘蛛不會為了抓取更多頁面,把人家網(wǎng)站服務器拖垮,所以對某個網(wǎng)站都會設定一個抓取速度的上限,crawl rate limit,也就是服務器能承受的上限,在這個速度限制內(nèi),蜘蛛抓取不會拖慢服務器、影響用戶訪問。

服務器反應速度夠快,這個速度限制就上調(diào)一點,抓取加快,服務器反應速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。所以,抓取速度限制是搜索引擎“能”抓取的頁面數(shù)。

四、抓取份額是由什么決定的?

抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時又“能”抓的頁面數(shù)。網(wǎng)站權(quán)重高,頁面內(nèi)容質(zhì)量高,頁面夠多,服務器速度夠快,抓取份額就大。

五、小網(wǎng)站沒必要擔心抓取份額

小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權(quán)重再低,服務器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個頁面的網(wǎng)站根本不用擔心抓取份額的事。數(shù)萬個頁面的網(wǎng)站一般也不是什么大事,如果每天幾百個訪問要是能拖慢服務器,SEO就不是主要需要考慮的事了,而是怎么優(yōu)化你的網(wǎng)站,提升服務器配置了。

六、大中型網(wǎng)站經(jīng)常需要考慮抓取份額

幾十萬頁以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問題。抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎每天只能抓幾萬個頁面,那么把網(wǎng)站抓一遍可能需要幾個月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時被更新。

要想網(wǎng)站頁面被及時、充分抓取,首先要保證服務器夠快,頁面夠小。如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。

如下圖某網(wǎng)站百度抓取頻次:

55.jpg


頁面抓取頻次和抓取時間(取決于服務器速度和頁面大小)沒有什么大關(guān)系,說明沒有用完抓取份額,不用擔心。大型網(wǎng)站另一個經(jīng)常需要考慮抓取份額的原因是,不要把有限的抓取份額浪費在無意義的頁面抓取上,導致應該被抓取的重要頁面卻沒有機會被抓取。

浪費抓取份額的典型頁面有:

  1. 站內(nèi)復制內(nèi)容

  2. 低質(zhì)、垃圾內(nèi)容

  3. 日歷之類的無限個頁面

  4. 上面這些頁面被大量抓取,可能用完抓取份額,該抓的頁面卻沒抓。

怎樣節(jié)省抓取份額?

當然首先是降低頁面文件大小,提高服務器速度,優(yōu)化數(shù)據(jù)庫,降低抓取時間。然后,盡量避免上面列出的浪費抓取份額的東西。有的是內(nèi)容質(zhì)量問題,有的是網(wǎng)站結(jié)構(gòu)問題,如果是結(jié)構(gòu)問題,最簡單的辦法是robots文件禁止抓取,但多少會浪費些頁面權(quán)重,因為權(quán)重只進不出。

某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權(quán)重流動和分配的,精心設計的nofollow會使無意義頁面權(quán)重降低,提升重要頁面權(quán)重。搜索引擎抓取時會使用一個URL抓取列表,里面待抓URL是按頁面權(quán)重排序的,重要頁面權(quán)重提升,會先被抓取,無意義頁面權(quán)重可能低到搜索引擎不想抓取。

最后幾個說明:

鏈接加nofollow不會浪費抓取份額。但在Google是會浪費權(quán)重的。

noindex標簽不能節(jié)省抓取份額。搜索引擎要知道頁面上有noindex標簽,就得先抓取這個頁面,所以并不節(jié)省抓取份額。

canonical標簽有時候能節(jié)省一點抓取份額。和noindex標簽一樣,搜索引擎要知道頁面上有canonical標簽,就得先抓取這個頁面,所以并不直接節(jié)省抓取份額。但有canonical標簽的頁面被抓取頻率經(jīng)常會降低,所以會節(jié)省一點抓取份額。

抓取速度和抓取份額不是排名因素。但沒被抓取的頁面也談不上排名。

本文鏈接:http://www.hkass.cn/article/492.html

超級蜘蛛工具

  • 網(wǎng)站鏈接HTTP狀態(tài)批量檢測_在線批量檢測網(wǎng)站鏈接狀態(tài)_超級蜘蛛池
  • 百度關(guān)鍵詞排名查詢_網(wǎng)站關(guān)鍵詞排名批量查詢_超級蜘蛛池
  • 百度收錄查詢_在線百度收錄批量查詢_超級蜘蛛池
  • 域名IP地址批量查詢_在線批量查詢網(wǎng)站IP地址_超級蜘蛛池
  • 超級外鏈發(fā)布工具_在線免費批量發(fā)布SEO外鏈_超級蜘蛛池
  • 網(wǎng)頁蜘蛛模擬抓取測試工具_超級蜘蛛工具_超級蜘蛛池