今天一朋友问我IIS日志里最后三位"200 0 64"是什么意思,说查了一晚上也没搞清楚这是什么意思,网上基本上全把后面这个"64"和百度联系起来~说这里是"200 0 64"就不是正常抓取,只有是"200 0 0"才是正常抓取……,我打开gg搜索了一下"200 0 64",果然如此,更有甚者甚至还给出了解决方法,说如何如何修改网站就可以让"200 0 64"变成"200 0 0"以让搜索引擎正常抓取……
我汗,不知道有多少人被发表这段歪理的人害得把本来好好的网站改来改去.其实这只是3个很正常的状态码,只有前面的"200" 这个有用,后面的"0 64"和是否被正常访问或者正常抓取没有任何关系的!下面详细解说一下这三个状态代码.
打开一个IIS的日志,我们在最上边大约第三行能够看到一个表头,像这样:
引用内容
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
这是日志每行中每个字段的名称,我们看到的"200 0 64"是最后3个,那就是
sc-status sc-substatus sc-win32-status 这三个了,来看看这三个是什么东西:
sc-status:
HTTP协议的状态.HTTP协议的状态代码为200,这个可能大家不熟悉,但是,HTTP404找不到文件,HTTP500内部服务器错误,这两个状态代码大家应该很熟悉了吧? 不错,这个200,其实就是这个的一种,HTTP200就是文件被正常的访问了,只有这个数字是200以外的数字,才说明访问出现了错误(比如上面说的404文件找不到等).
sc-substatus:
HTTP子协议的状态.一般来说网站都是不使用子协议的,所以这个代码为0就是很正常的,我们完全可以不用管它.
sc-win32-status:
Win32状态.这个就是被很多人解释成说是是否被百度正常抓取的代码.除了这个解释之外,这个代码还有N多种解释,有的说是"不可用,打不开",有的说是"客户端传送到服务端的字节大小",真可谓天花乱坠.其实我们稍微懂点脑子,从字面意思就能够看懂.这只是表示客户端是否为32位系统的代码.如果被32位的系统访问,那么这里记录的就是0,如果被64位系统访问,那么这里记录的就是64……
总结上面的,再综合解释一下"200 0 64"和"200 0 0":
200 0 64:
文件被64位系统的访客或者蜘蛛正常访问或抓取.
200 0 0:
文件被32位系统的访客或者蜘蛛正常访问或抓取.
后记:
就是这么简单的一个问题,为什么会有那么多版本的歪解,而且会有那么多人去相信?
也许是站长们对百度过于敏感,对于可能出现不好结果的事,宁愿相信其有不愿相信其无的心理造成的.
或者,是歪理被人们说的多了还真变成人们心中的真理了.
除了站长们需要冷静的思考和学习,最后也希望大家对于自己也不是很确定的事情,不要再胡乱的凭着自己的想象发表意见了,对于你自己来说,也许你只是认为自己发表了一种看法,但是你凭空想象得出的结果,不知道要误导多少人,要给多少人造成麻烦.