互聯網越來越龐大、復雜,百度為了更好的處理互聯網上的信息,提供了一些的面向站長的工具,合理的利用這些站長工具,可以起事半功倍的效果。
百度站長平臺:
登錄zhanzhang.baidu.com獲取更多幫助信息。
Sitemap :
百度站長平臺支持通過sitemap提交網站內容。通過sitemap可以讓百度更全面更快的發現鏈接,使得收錄更有效率。
Ping:
Ping是針對blog內容的提交方式,實時通知搜索引擎blog上有新內容產生。目前主流的博客程序都支持ping,您只需要將百度的ping服務地址
http://ping.baidu.com/ping/RPC2加入博客后臺并開啟ping功能即可。
死鏈刪除:
百度站長平臺支持通過sitemap向百度提交網站的死鏈列表。網站死鏈過多,不僅影響用戶訪問體驗,也影響百度對網站質量的判斷。通過死鏈刪除的接口可以讓百度更快更全面的發現網站死鏈,從而進行有效刪除。
注:提交需要刪除的網址后,需要做如下處理,才能被百度有效刪除:
1、使用robots.txt阻止其被抓取;
2、或者返回404狀態碼表示當前頁面不存在。
站長工具
URL優化工具檢查
百度站長平臺提供了URL優化工具,可以幫助檢查URL對搜索引擎的友好程度并提出修改建議。
網站安全檢測
百度站長平臺提供工具檢測網站是否被黑并提示站長,幫助修改。
什么是“網站被黑”?
網站被黑,是指黑客利用網站的程序、設置等方面的安全漏洞或管理員安全疏忽(如密碼復雜度等),未經管理員授權,對網站進行了篡改。
如何處理網站被黑?
1、分析系統日志、服務器日志,檢查自己站點的頁面數量、流量等是否有異常波動,是否存在異常訪問或操作日志;
2、檢查網站文件是否有不正常的修改,尤其是首頁等重點頁面;
3、網站頁面是否引用了未知站點的資源(圖片、JS等),是否被放置了外站的異常鏈接;
4、檢查網站是否有不正常增加的文件或目錄;
5、檢查網站目錄中是否有非管理員打包的網站源碼、未知txt文件等。
如何防止網站被黑?
1、定期檢查服務器日志等方式發現問題,檢查是否有可疑的針對非前臺頁面的訪問;
2、經常檢查網站文件是否有不正常的修改或者增加;
3、關注操作系統,以及所使用程序的官方網站。及時下載補丁,修補安全漏洞;必要時建議直接更新至最新版本;
4、修改開源程序關鍵文件的默認文件名,作弊者通常通過程序自動掃描某些特定的文件是否存在來判斷是否使用了某套程序;
5、修改默認管理員用戶名,提高管理后臺的密碼強度,使用字母、數字以及特殊符號多種組合的密碼;
6、關閉不必要的服務,以及端口;
7、關閉或者限制不必要的上傳功能;
8、設置防火墻等安全措施;
9、若問題反復出現,建議重新安裝服務器操作系統,并重新上傳備份的網站文件;
10、缺乏專業維護人員的網站,建議向專業安全公司咨詢;快速發現并處理被黑內容,并做好被黑的預防,非常體現一個網站的運營水平。
上述的幾點僅僅是初步的參考。做好網站的安全需要站長、管理員們的不斷努力。
百度搜索框提示功能
百度向站長開放免費“百度搜索框”代碼和“百度搜索框提示”代碼。
只需進行簡單的設置,即可將“百度搜索框(帶提示功能)”功能快速加入到您的網頁中。提升用戶在網站中的搜索體驗。
(6)改版/換域名
網站改版、換域名在互聯網飛速發展的情況下是不可避免的,但處理不當,會造成重大的流量損失。改版、換域名需要考慮的第一要點就是如何保證老用戶不流失,當用戶訪問舊內容時,能引導用戶到新網站上對應的內容,避免出現用戶訪問不到以前收藏的網頁的情況。
我們建議在改版或者換域名時,將舊網頁301永久重定向到內容對應的新網頁,這樣百度更容易發現這個轉變,并迅速的將舊網頁積累的權值傳遞給對應的新網頁。
其他建議:
如非必要,不要做整站內容的完全更換
網站改版或者網站內重要頁面鏈接發生變動時,應該將改版前的頁面301永久重定向到改版后的對應的頁面
網站更換域名,應該將舊域名的所有頁面301永久重定向到新域名上對應的頁面
網站更換域名后,維持舊域名能穩定訪問盡可能長的時間,給用戶多一些時間記憶新域名
網站改版/更換域名后,請把新的URL/新域名下的URL,通過sitemap提交給百度,幫助百度更快發現和作出調整。
(7)合理的返回碼
百度爬蟲在進行抓取和處理時,是根據http協議規范來設置相應的邏輯的,所以請站長們也盡量參考http協議中關于返回碼的含義的定義來進行設置。
百度spider對常用的http返回碼的處理邏輯是這樣的:
404
404返回碼的含義是“NOT FOUND”,百度會認為網頁已經失效,那么通常會從搜索結果中刪除,并且短期內spider再次發現這條url也不會抓取。
503
503返回碼的含義是“Service Unavailable”,百度會認為該網頁臨時不可訪問,通常網站臨時關閉,帶寬有限等會產生這種情況。對于網頁返回503,百度spider不會把這條url直接刪除,短期內會再訪問。屆時如果網頁已恢復,則正常抓取;如果繼續返回503,短期內還會反復訪問幾次。但是如果網頁長期返回503,那么這個url仍會被百度認為是失效鏈接,從搜索結果中刪除。
403
403返回碼的含義是“Forbidden”,百度會認為網頁當前禁止訪問。對于這種情況,如果是新發現的url,百度spider暫不會抓取,短期內會再次檢查;如果是百度已收錄url,當前也不會直接刪除,短期內同樣會再訪問。屆時如果網頁允許訪問,則正常抓取;如果仍不允許訪問,短期內還會反復訪問幾次。但是如果網頁長期返回403,百度也會認為是失效鏈接,從搜索結果中刪除。
301
301返回碼的含義是“Moved Permanently”,百度會認為網頁當前跳轉至新url。當遇到站點遷移,域名更換、站點改版的情況時,推薦使用301返回碼,盡量減少改版帶來的流量損失。雖然百度spider現在對301跳轉的響應周期較長,但我們還是推薦大家這么做。
建議:
如果站點臨時關閉,當網頁不能打開時,不要立即返回404,建議使用503狀態。503可以告知百度spider該頁面臨時不可訪問,請過段時間再重試。
如果百度spider對您的站點抓取壓力過大,請盡量不要使用404,同樣建議返回503。這樣百度spider會過段時間再來嘗試抓取這個鏈接,如果那個時間站點空閑,那它就會被成功抓取了。
有一些網站希望百度只收錄部分內容,例如審核后的內容,累積一段時間的新用戶頁等等。在這種情況,建議新發內容暫時返回403,等審核或做好處理之后,再返回正常狀態的返回碼。
站點遷移,或域名更換時,請使用301返回。








