分析网站日志有什么作用?如何分析网站日志中的内容?

如果你是独立个人博客或网站的站长,如果连原始访问日志是什么都不知道,或者对其根本不屑一顾,我只能说你是一个不称职的网站站长,一旦网站出问题,必定是束手无策,即便掌握了SEO基础知识也要善于分析网站日志

很多新手SEO站长可能觉得不去分析网站日志也无关紧要,相信大家都在自己的网站上安装了网站统计的代码。这些工具可以统计网站的流量,但是这些统计工具都不能统计主机上资源的原始访问信息。

绝大多数收费主机都提供原始访问日志,网站服务器会把每一个访客来访时的一些信息自动记录下来,保存在原始访问日志文件中,如果主机不提供日志功能,建议到期后还是换主机吧。日志中记录了网站上所有资源的访问信息,包括图片、CSS、JS、FLASH、HTML、MP3等所有网页打开过程载入的资源,同时记录了这些资源都被谁访问了、用什么来访问以及访问的结果是什么等,可以说原始访问日志记录了主机的所有资源使用情况。

分析网站日志有什么作用?

1、我们可以比较准确的定位搜索引擎蜘蛛来爬行我们网站的次数,可以屏蔽伪蜘蛛(此类蜘蛛多以采集为主,会增加我们服务器的开销)。

2、通过分析网站日志,我们可以准确定位搜索引擎蜘蛛爬行的页面以及时间长短,我们可以依次有针对性的对我们的网站进行微调。

3、http返回状态码,搜索引擎蜘蛛以及用户每访问我们的网站一次,服务器端都会产生类似301,404,200的状态吗,我们可以参照此类信息,对我们出现问题的网站进行简单的诊断,及时处理问题。

如何分析网站日志中的内容?

一、注意那些被频繁访问的资源

如果在日志中,发现某个资源(网页、图片和mp3等)被人频繁访问,那你应该注意该资源被用于何处了。如果这些请求的来源(Referer)不是网站或者为空,且状态码(Http Code)为200,说明这些资源很可能被人盗链了,通过Referer可以查出盗链者的网址,这可能就是网站流量暴增的原因,应该做好防盗链了。

二、注意那些你网站上不存在资源的请求

如果某些请求信息不是本站的资源,Http Code不是403就是404,但从名称分析,可能是保存数据库信息的文件,如果这些信息让别人拿走,那么攻击网站就轻松多了。发起这些请求的目的无非就是扫描网站漏洞,通过漫无目的地扫描下载这些已知的漏洞文件,很可能会发现网站某个漏洞。

三、观察搜索引擎蜘蛛的来访情况

通过观察日志中的信息,可以看出网站被蜘蛛访问的频率,进而可以看出网站是否被搜索引擎青睐,这些都是SEO所关心的问题吧。常见搜索引擎的蜘蛛列表如下:

Google蜘蛛

Baidu蜘蛛

Yahoo蜘蛛

微软Bing蜘蛛

Google Adsense蜘蛛

有道蜘蛛

Soso搜搜博客蜘蛛

Sogou搜狗蜘蛛

Google图片搜索蜘蛛

俄罗斯Yandex搜索引擎蜘蛛

Alexa蜘蛛

四、观察访客行为

通过查看格式化后的日志,可以查看跟踪某个时间段的一系列访问行为,单个访问记录越多,说明网站PV高,用户粘性好,如果单个访问记录少,应该考虑如何将网站内容做得更加吸引人了。通过分析访客的行为,可以为网站建设提供有力的参考,哪些内容好,哪些内容不好,确定网站的发展方向,通过分析访客的行为,看看他们都干了些什么事,可以揣测访客的用意,及时揪出恶意用户。

总结:还有一点要介绍的是当网站遭遇搜索引擎K掉的时候,网站日志可以给我们提供被K掉的原因(我是为站群的朋友考量),并且通过网站日志相关数据,可以看到网站什么时候搜索引擎恢复正常访问,这样我们可以选择继续做或者放弃,虽然很无奈,但却也是不得已而又明智的选择。

👋 感谢您的观看!

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享