【郑州网站建设】分析网站日志来了解搜索引擎
一、看网站的抓取情况
1、新网站刚刚搭建,看看搜索引擎有没有来你网站抓取了;
2、网站收录异常,或者被k,通过日志可以了解搜索引擎是否还有来光顾你的网站;
3、对于网站的问题进行解决,必须要读懂日志;
二、怎么查找网站日志?
一般在FTP一个名为logs的文件夹,不同的服务器可能日志文件命名不一样,不过一定会包含logs这个关键词(KEY),如下图:
三、怎么打开日志?
下载,解压后,可以用文本编辑器打开,如果打开是乱码的话,可以用Editplus或dreamweaver等网页编辑器打开。
四、各大搜索引擎蜘蛛(baidu蜘蛛)名称:
打开日志后我们可以看到如下的这些搜索引擎蜘蛛(baidu蜘蛛)名称,分别代表的就是哪个搜索引擎到过你的网站。郑州网站建设公司,让企业对外宣传的主窗口曝光度更高,提升知名度。
百度:baidu蜘蛛
Google=Googlebot
Msn:msnbot
yahoo:Slurp
yodao:YoudaoBot
sogou:Sogou get 蜘蛛
360:360蜘蛛
五:日志拆解
在日志里面搜索下以上蜘蛛(baidu蜘蛛)的名称就能清楚了解蜘蛛(baidu蜘蛛)有没有来过你的网站,并且知道蜘蛛(baidu蜘蛛)抓取你的网站页面情况。
123.125.71.33 – – [19/AGOOGLE PR/20
16:00:4
7:39 0800] "GET /page/contact/contact.php HTTP/1.1" 200 21978 "-" "Mozilla/5.0 (compatible; Baidu蜘蛛/2.0;
具体分析如下:
123.125.71.33 访问IP
[19/AGOOGLE PR/20
16:00:4
7:39 0800] 访问时间与时区
GET /page/contact/contact.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/page/contact/contact.php 这个页面(GET表示服务器动作)
200 服务器响应状态码。
21978 表示抓取了21978个字节。
Mozilla/5.0 表示访问者使用火狐浏览器访问端信息
六、网站日志对seo(搜索引擎优化)有关于的信息
不同的服务器或虚拟主机设置的日志记录网站内容不同。
有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。
在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(死页面)(错误链接)。
304代表,自从上次抓取后,该网站内容没有更新。一般情况下,网站的图片常常会返回该值。
404(死页面)代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外部链接了这么个死链接。