通过HTTP状态代码查看搜索引擎蜘蛛如何爬行你的网站

您所在的位置:网站首页 表排行榜前十名中国 通过HTTP状态代码查看搜索引擎蜘蛛如何爬行你的网站

通过HTTP状态代码查看搜索引擎蜘蛛如何爬行你的网站

2023-03-11 23:09| 来源: 网络整理| 查看: 265

所有 HTTP 状态代码及其定义。

代码 指示2xx  æˆåŠŸ 200  æ­£å¸¸ï¼›è¯·æ±‚已完成。201  æ­£å¸¸ï¼›ç´§æŽ¥ POST 命令。202  æ­£å¸¸ï¼›å·²æŽ¥å—用于处理,但处理尚未完成。203  æ­£å¸¸ï¼›éƒ¨åˆ†ä¿¡æ¯ — 返回的信息只是一部分。204  æ­£å¸¸ï¼›æ— å“åº” — 已接收请求,但不存在要回送的信息。3xx  é‡å®šå‘  301  å·²ç§»åŠ¨ — 请求的数据具有新的位置且更改是永久的。302  å·²æ‰¾åˆ° — 请求的数据临时具有不同 URI。303  è¯·å‚阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。304  æœªä¿®æ”¹ — 未按预期修改文档。305  ä½¿ç”¨ä»£ç† — 必须通过位置字段中提供的代理来访问请求的资源。306  æœªä½¿ç”¨ — 不再使用;保留此代码以便将来使用。4xx  å®¢æˆ·æœºä¸­å‡ºçŽ°çš„错误400  é”™è¯¯è¯·æ±‚ — 请求中有语法问题,或不能满足请求。401  æœªæŽˆæƒ — 未授权客户机访问数据。402  éœ€è¦ä»˜æ¬¾ — 表示计费系统已有效。403  ç¦æ­¢ — 即使有授权也不需要访问。404  æ‰¾ä¸åˆ° — 服务器找不到给定的资源;文档不存在。407  ä»£ç†è®¤è¯è¯·æ±‚ — 客户机首先必须使用代理认证自身。410   请求的网页不存在(永久)ï¼›415  ä»‹è´¨ç±»åž‹ä¸å—支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。5xx  æœåŠ¡å™¨ä¸­å‡ºçŽ°çš„错误500  å†…部错误 — 因为意外情况,服务器不能完成请求。501  æœªæ‰§è¡Œ — 服务器不支持请求的工具。502  é”™è¯¯ç½‘å…³ — 服务器接收到来自上游服务器的无效响应。503  æ— æ³•èŽ·å¾—服务 — 由于临时过载或维护,服务器无法处理请求。

比如说:2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/119.htm - 304 Baiduspider+(+http://www.baidu.com/search/spider.htm) 这就意味着百度蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页,它发现这页是没有更新过的。

再比如说:2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/120.htm - Googlebot/2.1(http://www.google.com/bot.html) 这就意味着Google蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页,它发现这页是新的,并全部爬完。

相关日志SEO项目分析及运作流程第五届Netconcepts SEO排行榜大会演讲PPT分享百度搜索结果图文标识规则分析Flash网页SEO特殊优化策略Wordpress SEO插件搜搜SoSo搜索引擎优化SEO规范【SEO必备】百度蜘蛛IP段大全与权重说明社会化购物分享网站SEO策略研究百度站长平台“外链工具”与“搜索关键词查询”功能评测从Bing(必应)SEO技巧中分析未来网站优化的发展趋势 最后编辑: 郝聪 编辑于2006/11/17 18:32


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3