自从自己从事SEO网站优化以来,自己缓缓的去关注网站日志。网站日志剖析成为自己每天工作的件事件,每天一到公司时光就是对昨天的网站日志进行剖析。兴许局部站长们还不会剖析网站日志,这个可能参阅下之前皇冠网小编发表过的《略懂网站日志剖析,网站更保险》,但也有少局部觉得剖析网站日志就是在挥霍时光,每天看着那些数占领什么作用。这里皇冠网小编觉得至少有四点咱们可能理解到。
第
一、 判断是否有蜘蛛过来爬行
如何判断是否有蜘蛛过来爬行:
1、 通过观看网站日志代码进行观看,这个针对剖析高手
2、 通过网站日志剖析工具进行观看,这个比较适合新手利用
通过网站日志剖析工具可能直接查看站点有哪些页面已经被蜘蛛爬行抓取了。
第
二、 客户ip便知蜘蛛类型。
1、220.181.108.ip段的百度蜘蛛
2、123.125.71.ip段的百度蜘蛛
3、123.125.68.ip段的百度蜘蛛
4、117.28.255.ip段的百度蜘蛛
5。。。
第
三、 检测页面状况畸形与否
通过网址日志咱们可能直接的服务器响应代码看出咱们的页面哪些有问题,哪些畸形的。个别情况下返回的状况码是200的话说明畸形,呈现404的话,说明页面呈现问题。
第
四、 搜查引擎对站点的友爱水平
从网站日志,咱们可能直接的看出蜘蛛来咱们站点的爬行次数,爬行次数越多说明蜘蛛对咱们的站点越友爱。
通过上图咱们可能直接的看出蜘蛛对咱们站点的爬行次数了,然而这里面的爬行次数里面也存在冒牌的蜘蛛,所以咱们还须要通过客户ip进行确认哪些是真正的蜘蛛,哪些是冒牌的。这个可能参阅《略懂网站日志剖析,网站更保险》里面有图文教程,介绍如何差别虚实蜘蛛,这里就不再介绍了。
通过上面三点的理解,皇冠网hg-seo.com小编对以上四点进前进一步的探知:
针对上面第
一、咱们可能直接的查看哪些页面被爬行抓取了,哪些不。随着算法的一直更新,新站的考察期越来越长了,甚至于好多新站长更新的文章通过site:域名,查收录都不显示。这大局部是因为搜查引擎滞留了不迭时开释。
针对上面第
二、咱们可能通过客户ip辨别站点保险信息及文章内容品质怎么
依据不同的IP咱们可能剖析网站是个怎么的状况,以下常见的百度蜘蛛IP:
1、123.125.68.常来,别的来的少,那么站点进入沙盒,或被者降权的可能性十分高。
2、220.181.68.每天只增加不减少,则是进入沙盒或者被降权的前兆。
3、220.181.7.、123.125.66. 搜查引擎开端要抓取货色。
4、121.14.89.解脱了新站考察期。
5、203.208.60.站点开端不畸形。
6、210.72.225.这个ip段不间断巡逻各站。
7、220.181.108.高品质文章内容页或首页抓取。
个别胜利抓取返回代码都是 200 0 0返回,若返回状况显示304 0 0代表网站没更新,蜘蛛来过,但没抓取。假如是 200 0 64,那么也别担心,这只不过是一些动态页面的抓取。
针对上面第
三、假如服务器返回状况,比方200 表示畸形拜访。404 表示页面不存在。304代表网页还没更新。这些都可能通过网站日志里面的代码直接看出来的。假如大量的呈现404的话,那么十分有必要对这些404的页面进行采取办法。咱们可能用robots.txt协定来屏蔽这些页面,不让搜查引擎来爬行这个页面。
针对上面第
四、真的蜘蛛来的次数越多越好!
好了,对网站日志就介绍里面。网站日志可能通过以下两种方法获得:
1、 ftp空间log文件夹
2、 登入你站点的服务器,通常网站日志位置C:WINDOWS-system32-LogFiles
尊敬,注明,你就是在为互联网环境沾染做出自己的一份尽力。