百度诊断工具其实就是搜索引擎模拟工具,其实这个工具早就存在。站长之家里面的搜索引擎模拟就是百度出的这个工具。简单说就是让站长能从百度蜘蛛的角度看出百度抓取的你网页的什么东西,是不是跟预期的一样。
 
一、什么是抓取工具?  
 
    抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容,和预期是否一致。每个站点每周可使用200次,抓取结果只展现百度蜘蛛可见的前200KB内容。”
 
    工具地址:https://ziyuan.baidu.com/crawltools/index
 
二、抓取诊断工具能做什么? 
 
1)诊断抓取内容是否符合预期,譬如很多商品详情页面,价格信息是通过JavaScript输出的,对百度蜘蛛不友好,价格信息较难在搜索中应用。问题修正后,可用诊断工具再次抓取检验。 
 
2)诊断网页是否被加了黒链、隐藏文本。网站如果被黑,可能被加上隐藏的链接,这些链可能只在百度抓取时才出现,需要用此抓取工具诊断。 
 
3)检查网站与百度的连接是否畅通,若是IP信息不一致,可以报错通知百度更新IP。 
 
    抓取诊断工具常见错误三大类型:
 
    1、url不符合规范:网站链接即url不符合规范,例如长度超长(一般不超过1024个字符也就是512个汉字),出现过长的建议进行精简解决问题。或者动态字符过多(?  #   %等等,一般不超过3个),出现这样的建议安装一些相关插件进行链接优化,当然也可以采取其他方式。
 
    2、301重定向问题:做了301重定向后跳转效果不佳,例如跳转到长度很长的链接,或者出现连续跳转现象并且次数超过5次,那么都有可能出现抓取失败,找到原因后可以进行针对优化。
 
    3、服务器连接错误,这种情况是指,由于服务器响应过慢或我们的网站屏蔽了百度spider,而导致百度无法正常访问我们的网站。也因此导致百度无法正常收录或者更新我们网站的内容,最直接的后果就是不能获取排名,没有权重。具体错误表现方式:连接超时、连接失败、连接被拒、无响应、响应遭到截断、连接重置、标头遭到截断、超时。这些相对应的状态码大家可以到:五类常见http状态码含义详解查询。
 
4)如果网站有新页面或页面内容有更新,百度蜘蛛较长时间没来访问,可以通过此工具邀请它快速来抓取。 
 
三、百度诊断工具的作用
 
第一、可以帮助站长查看百度蜘蛛抓取的是不是自己网站的内容。例如:网站如果出现被黑的情况,那么网站就有可能被挂黑链接、被隐藏了文字、隐藏链接等等,出现这样的情况只有通过这个工具诊断后才能最终得出结论。因此现在该功能正在被站长朋友广泛应用。
 
第二、可以助力站长查询到自己网站是否被挂了黑链、隐藏文本。这对一些不太懂代码的童鞋可是帮助了不少。
 
第三、百度抓取诊断工具还可以帮助站长查看网站与百度的链接是否畅通,如果自己的IP与百度蜘蛛抓取的不一致的时候还可以报错。