淺析搜索引擎蜘蛛概念
發(fā)布時(shí)間:2013-02-04 瀏覽:304打印字號:大中小
搜索引擎蜘蛛是搜索引擎自身的一個(gè)程序,它的作用是對網(wǎng)站的網(wǎng)頁進(jìn)行訪問,抓取網(wǎng)頁的文字、圖片等信息,建立一個(gè)數(shù)據(jù)庫,反饋給搜索引擎,當(dāng)用戶搜索的時(shí)候,搜索引擎就會(huì)把收集到的信息過濾,通過復(fù)雜的排序算法將它認(rèn)為對用戶最有用的信息呈現(xiàn)出來。深入分析網(wǎng)站的SEO表現(xiàn)的時(shí)候,一般我們就會(huì)考慮搜索引擎蜘蛛的抓取質(zhì)量,而其中能夠幫我們優(yōu)化網(wǎng)站可能會(huì)涉及到下面的幾個(gè)蜘蛛抓取相關(guān)的概念:
1.爬取率:既定時(shí)間內(nèi)網(wǎng)站被蜘蛛獲取的頁面數(shù)量。
2.爬取頻率:搜索引擎多久對網(wǎng)站或單個(gè)網(wǎng)頁發(fā)起一次新的爬行。
3.爬取深度:一個(gè)蜘蛛從開始位置可以點(diǎn)擊到多深。
4.爬取飽和度:唯一頁面被獲取的數(shù)量。
5.爬取優(yōu)先:那些頁面最常作為蜘蛛的入口。
6.爬取冗余度:網(wǎng)站一般被多少蜘蛛同時(shí)爬取。
7.爬取mapping:蜘蛛爬取路徑還原。
搜索引擎蜘蛛的爬取頻率很多時(shí)候是由網(wǎng)站內(nèi)容質(zhì)量決定的,因?yàn)橹挥芯W(wǎng)站有更新鮮更好的內(nèi)容,才能更吸引蜘蛛來反復(fù)抓取,例如很多大型的內(nèi)容型網(wǎng)站,每天更新大量的內(nèi)容,這樣就把蜘蛛一直留在了站內(nèi),頁面抓取的頻率自然會(huì)提高。而提升了爬取頻率,對于頁面中內(nèi)容和鏈接的更新就會(huì)被搜索引擎蜘蛛更快的抓取到,能夠更充分的收錄網(wǎng)站的頁面內(nèi)容信息。
搜索引擎蜘蛛的爬取深度如果不夠深,主要是因?yàn)榫W(wǎng)站在結(jié)構(gòu)布局的時(shí)候沒有考慮到這蜘蛛是否能夠充分抓取或者是否按照一層一層的抓取,這里就涉及到鏈接入口的布局,也就會(huì)考慮到蜘蛛爬取優(yōu)先的一些入口,很多時(shí)候?qū)σ恍┐蟮木W(wǎng)站做診斷,來提升其流量和收錄主要的策略布局就是優(yōu)化蜘蛛抓取優(yōu)先的入口,實(shí)現(xiàn)的方法就是采用nofollow標(biāo)簽屏蔽一些頁面。還需要分析的可能是爬取的飽和度,因?yàn)閷τ趩蝹€(gè)頁面的爬取太多是在浪費(fèi)蜘蛛資源,我們?nèi)绻軌蜻m當(dāng)?shù)目刂七@些資源的分配,那么對于頁面的抓取和收錄的提升肯定有很大的幫助。
- 1網(wǎng)站內(nèi)容收錄后被刪除的解決方法
- 2北京網(wǎng)站設(shè)計(jì)公司哪家好
- 3網(wǎng)站優(yōu)化如何提高關(guān)鍵詞排名
- 4北京網(wǎng)站設(shè)計(jì)公司:企業(yè)網(wǎng)站忽視十大重要優(yōu)化重點(diǎn)
- 5北京網(wǎng)站建設(shè):SEO優(yōu)化對企業(yè)營銷的重要性
- 6北京網(wǎng)站制作公司談網(wǎng)站草圖設(shè)計(jì)
- 7北京網(wǎng)站制作公司-Robots協(xié)議到底要不要寫
- 8北京電商網(wǎng)站建設(shè)公司
- 9企業(yè)網(wǎng)站關(guān)鍵詞優(yōu)化方法
- 10如何設(shè)置網(wǎng)站標(biāo)題更利于SEO優(yōu)化


