掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流
在幾年以前百度就開放了結構化數(shù)據(jù)的提交,而且給站長提供了網(wǎng)站數(shù)據(jù)的給百度搜索引擎提交數(shù)據(jù)的多種方式,包括被動推送和主動推送等等。而主動推送百度也提供了開放的API接口,網(wǎng)站可以利用接口實現(xiàn)自動提交功能,比如我們微構網(wǎng)絡官網(wǎng)就基于該接口實現(xiàn)數(shù)據(jù)自動主動推送到百度,而且效果確實還不錯。但是我們看到網(wǎng)上不少人說百度鏈接提交工具推送了不存在的url,針對這個問題,百度官方有說法,以下內容是摘自百度站長平臺的原文:
院長最近又收到工程師反饋,工程師查看反饋中心站點問題,發(fā)現(xiàn)有站長通過鏈接提交工具推送的數(shù)據(jù),是含中文url,對搜索并不友好,需要站長自查推送問題;結果站長卻反饋,網(wǎng)站并不存在這些url,那么,站長在鏈接提交工具中推送的這些不存在的中文url,是怎么出現(xiàn)的呢?
網(wǎng)站自查反饋:
站長是用WordPress建站系統(tǒng)搭建的站點,并使用平臺的鏈接提交工具,向百度提交數(shù)據(jù)。為了推送數(shù)據(jù),站長使用了一款名為Baidu Submit URLs的插件(插件來自第三方,非百度出品),而且,使用此款插件的站點并不在少數(shù)。
經(jīng)排查發(fā)現(xiàn):這個插件拼接的url格式是站點url+post_name
這一列內容在數(shù)據(jù)庫中的格式是以下效果:
推送后會出現(xiàn),給百度的地址是:http://www.XXX.com/2017百度AI開發(fā)者大會
而站點真實地址卻是:http://www.XXX.com/archives/63
最終定位問題:插件采用了域名+標題這種形式在進行推送,而推送的URL會301到真實的URL上面,就會出現(xiàn),推送給百度的數(shù)據(jù),實際上是一條不存在的含中文url,這是推送插件的錯誤導致,站長們需要把程序修補一下。
院長建議:
鏈接提交工具可以快速幫助站點實現(xiàn)內容抓取,部分站長會使用線上第三方的推送插件,這里,希望站長們先檢查下插件數(shù)據(jù)邏輯,否則推送錯誤數(shù)據(jù),站長們自己都不知道呢!
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流