合肥做网站,选择疯狗科技,专业、敬业的合肥网络公司
首页 > 网站SEO优化 > 详情

详解爬虫发起抓取后各种httpcode返回码(http状态码)的含义

2018-11-14 13:27:03   来源:互联网   浏览:  次
大部分网站优化菜鸟都只是人云亦云的采集数据、伪原创、做外链,而从不关心百度爬虫(蜘蛛)有没有抓取网站内容,是如何看待你费心费力优化的网站的?如果你还不知道百度爬虫(蜘蛛)对网站的意义,还不知道它的反馈信息无比重

大部分网站优化菜鸟都只是人云亦云的采集数据、伪原创、做外链,而从不关心百度爬虫(蜘蛛)有没有抓取网站内容,是如何看待你费心费力优化的网站的?如果你还不知道百度爬虫(蜘蛛)对网站的意义,还不知道它的反馈信息无比重要,那么请详细看本篇文章,同时把查看各种httpcode返回码的含义纳入常规工作范围,否则,你有可能因为这个微小的原因而导致网站被降权等。

当然了,现在百度站长工具已经比较完善,不需要像前几年一样,苦逼的分析每天的网站日志,可以通过百度抓取异常工具,进行检查,一目了然!同时,你可以查看本站文章:百度异常抓取工具的网站异常与网址异常

http状态码之5XX服务器错误含义

这类状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。除非这是一个HEAD 请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。

500 服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。一般来说,这个问题都会在服务器的程序码出错时出现。

501 服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法,并且无法支持其对任何资源的请求。

502 作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

503 由于临时的服务器维护或者过载,服务器当前无法处理请求。这个状况是临时的,并且将在一段时间以后恢复。如果能够预计延迟时间,那么响应中可以包含一个 Retry-After 头用以标明这个延迟时间。如果没有给出这个Retry-After信息,那么客户端应当以处理500响应的方式处理它。

注意:503状态码的存在并不意味着服务器在过载的时候必须使用它。某些服务器只不过是希望拒绝客户端的连接。

504 作为网关或者代理工作的服务器尝试执行请求时,未能及时从上游服务器(URI标识出的服务器,例如HTTP、FTP、LDAP)或者辅助服务器(例如DNS)收到响应。

注意:某些代理服务器在DNS查询超时时会返回400或者500错误

505 服务器不支持,或者拒绝支持在请求中使用的 HTTP 版本。这暗示着服务器不能或不愿使用与客户端相同的版本。响应中应当包含一个描述了为何版本不被支持以及服务器支持哪些协议的实体。

506 由《透明内容协商协议》(RFC 2295)扩展,代表服务器存在内部配置错误:被请求的协商变元资源被配置为在透明内容协商中使用自己,因此在一个协商处理中不是一个合适的重点。

507 服务器无法存储完成请求所必须的内容。这个状况被认为是临时的。WebDAV (RFC 4918)

509 服务器达到带宽限制。这不是一个官方的状态码,但是仍被广泛使用。

510 获取资源所需要的策略并没有没满足。(RFC 2774)

599 网络链接超时。这不是一个官方的状态码,但是仍被广泛使用。

相关热词搜索: 上一篇:死链对网站的影响、产生过程、解决办法汇总 下一篇:不知道网站标题怎么写,看这里就够了!