掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
最近不管是在網(wǎng)上還是在長沙線下的圈子里,大家都反應(yīng)說百度對網(wǎng)站收錄有問題,比如很多網(wǎng)站還是一如既往地更新,按理說應(yīng)該像往常那樣正常收錄,但最近很多網(wǎng)站百度就是不收錄。甚至有人認為這是百度升級spider3.0導致的“技術(shù)錯誤”而導致的,甚至也有說之所以推出所謂的“天網(wǎng)算法”就是為了“掩蓋”這一錯誤。當然一切皆有可能,下面就看看百度站長平臺關(guān)于收錄的一篇最近發(fā)布的文章,全文如下:
目前百度spider抓取新鏈接的途徑有兩個,一是主動出擊發(fā)現(xiàn)抓取,二就是從百度站長平臺的鏈接提交工具中獲取數(shù)據(jù),其中通過主動推送功能“收”上來的數(shù)據(jù)最受百度spider的歡迎。對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網(wǎng)站,主動推送首頁數(shù)據(jù),有利于內(nèi)頁數(shù)據(jù)的抓取。
那么同學們要問了,為什么我提交了數(shù)據(jù)還是遲遲在線上看不到展現(xiàn)呢?那涉及的因素可就多了,在spider抓取這個環(huán)節(jié),影響線上展現(xiàn)的因素有:
1、網(wǎng)站封禁。你別笑,真的有同學一邊封禁著百度蜘蛛,一邊向百度狂交數(shù)據(jù),結(jié)果當然是無法收錄。
2、質(zhì)量篩選。百度spider進入3.0后,對低質(zhì)內(nèi)容的識別上了一個新臺階,尤其是時效性內(nèi)容,從抓取這個環(huán)節(jié)就開始進行質(zhì)量評估篩選,過濾掉大量過度優(yōu)化等頁面,從內(nèi)部定期數(shù)據(jù)評估看,低質(zhì)網(wǎng)頁比之前下降62%。
3、抓取失敗。抓取失敗的原因很多,有時你在辦公室訪問完全沒有問題,百度spider卻遇到麻煩,站點要隨時注意在不同時間地點保證網(wǎng)站的穩(wěn)定性。
4、配額限制。雖然我們正在逐步放開主動推送的抓取配額,但如果站點頁面數(shù)量突然爆發(fā)式增長,還是會影響到優(yōu)質(zhì)鏈接的抓取收錄,所以站點在保證訪問穩(wěn)定外,也要關(guān)注網(wǎng)站安全,防止被黑注入。
在文章開頭就提到了百度蜘蛛抓取內(nèi)容的兩種途徑——主動抓取和站長的主動提交,但實際上近期就算是在站長主動提交,效果并不是太好,也許可能度娘正在“大姨媽”吧!
我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流