当前位置: 沐风博客 >> SEO技术 >>正文

网站日志如何分析,分析网站日志的步骤方法

重点导读:做网站seo,数据分析是日常工作之一,数据分析包括很多方面,在这篇文章里笔者主要跟大家聊聊关于网站原始日志的分析。网站原始日志不仅包括了用户的点击行为,同时也记录了搜索引擎抓取及停留等动作。
发布人:沐风 - 发布时间:2022-02-28 08:08:24 - 地址:http://www.tangmengyun.com/seo/13.html - 浏览:9313

做网站seo,数据分析是日常工作之一,数据分析包括很多方面,在这篇文章里笔者主要跟大家聊聊关于网站原始日志的分析。

网站原始日志不仅包括了用户的点击行为,同时也记录了搜索引擎抓取及停留等动作,下面就以实例来进行网站日志分析,这里针对百度。

第一步:下载网站日志

网站日志需要在服务器下载(通常以logs命名),不懂如何下载的朋友可以咨询技术人员(公司没有专门技术的话可以咨询服务器提供商),另外需要注意的是,有些服务器为了节约空间,没有设置保留网站日志。

网站日志.jpg

第二步:用Notepad++打开日志文件

Notepad++有强大的编辑能力,安装也十分方便,大家可以自行搜索下载,下面是日志打开的截图,一些数据筛选提取将从这里开始。

Notepad++打开文件图.jpg

第三步:筛选出百度蜘蛛轨迹

百度蜘蛛是Baiduspider/2.0,所以我们按Ctrl+F调出查找功能,如图:

搜索查找.jpg

在查找目标量输入Baiduspider/2.0,最后点击“查找所有打开文件”,会在下方得出所有包含Baiduspider/2.0的行,如下图:

搜索结果.jpg

第四步:抽出页面url

1.先将所有查找出来的内容复制到另一个Notepad++窗口中,然后用两次扩展替换,如图:

扩展替换.jpg

扩展替换2.jpg

这里简单的说明,\n是换行的意思,我们通过两次替换将页面的url剥离出来成为一行,然后将所有内容复制粘贴到表格(xls)中,如图:

表格.jpg

接着利用xls的自动筛选功能,筛选出页面url(看具体情况,一次筛选不成可进行多次筛选),如图:

自动筛选.jpg

更多操作,比如说要看看tag页面被抓取了多少,我们可以筛选包含tag的页面,如图:

包含tag的url.jpg

到这里大家应该知道网站日志分析的基本流程和方法了,更多的细节分析大家可以根据具体的需求进行。

另外,知道了哪些页面被抓取了,他们的收录又是怎样的呢?我们可以用Python来批量检测,如图:

python批量查询.jpg

收录结果.jpg

关于网站原始日志的分析(seo方向)就到这里,希望能对大家有所帮助。

评论列表(参与对网站日志如何分析,分析网站日志的步骤方法一文的评论):

1.枫华  2020-08-31 15:08:13 回复该评论
看起来有点复杂,可能是只是SEO小白,还没有到网站日志分析这个阶段,先收藏先,后面再用!
2.029shouji.com  2019-04-29 16:38:02 回复该评论
智能分析个大概,详细攻击方法无从下手啊

沐风SEO博客讲解SEO相关知识,包括解释SEO是什么,SEO有什么作用以及怎么做SEO等!

提醒:SEO更重要的是实战,理论结合实战才能真正掌握SEO,沐风SEO会尽量把SEO的每个细节都讲到,具体掌握多少还得看大家自己的努力! - ICP备案号 湘ICP备2022004497号