蜘蛛爬取情况通过什么方式查看准确
重点导读:想要更加准确知道蜘蛛抓取数据,查看网站日志是最靠谱的,其他的各种工具也都是基于网站日志,提取里面的数据,但这些工具显然没有纯手工那么准确。
发布人:沐风 - 更新时间:2021-10-14 09:54:58 - 地址:http://www.tangmengyun.com/seo/3019.html - 浏览:3360
问题:蜘蛛爬取情况通过什么方式查看准确?
回答:想要更加准确知道蜘蛛抓取数据,查看网站日志是最靠谱的,其他的各种工具也都是基于网站日志,提取里面的数据,但这些工具显然没有纯手工那么准确。
这里有个问题要注意:虽然网站日志里面能够统计到所有的蜘蛛抓取记录,但这里面也有些是伪蜘蛛,并不是真正的搜索引擎蜘蛛,对于这些要过滤掉。但如果“蜘蛛”的ip很多,要识别起来就得费些时间了。
以下是百度搜索提供的鉴别方法:
建议您使用DNS反查方式来确定抓取来源的ip是否属于百度,根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
1、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
$ host 123.125.66.120
120.66.125.123.in-addr.arpa domain name pointer
baiduspider-123-125-66-120.crawl.baidu.com.
host 119.63.195.254
254.195.63.119.in-addr.arpa domain name pointer
BaiduMobaider-119-63-195-254.crawl.baidu.jp.
2 在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
3 在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
关于如何手动分析网站日志的问题,沐风SEO之前写过网站日志如何分析的文章,里面做了详细的介绍,大家可以去看下。
当然也有些工具可以很方便的统计出网站日志的信息,只不过这些工具统计到的没有手动统计的那么详细,大家可以根据具体的情况去选择是利用工具还是手动。但相对来说,手动分析网站日志得到的数据会更加准确。
这里再提醒下:网上有人提到了降权蜘蛛、新站蜘蛛、权重蜘蛛等等,这些纯属胡说八道,大家不要轻易相信这些所谓的大师说法!
分析蜘蛛抓取为网站收录服务的,如果网站收录都正常的话,没有必要频繁的去统计蜘蛛抓取。如果觉得网站收录情况不好,这时候可以去分析网站日子,看看是不是有些页面没有被蜘蛛抓取到。如果没有被抓取,可以通过提交链接、增加站内锚文本链接、外链等方式来提升抓取率,进而提升页面收录。
蜘蛛爬取情况通过什么方式查看准确所属标签蜘蛛抓取 下的相关文章推荐
- 网站频繁更新内容却没有蜘蛛抓取的原因 - 浏览量:2611
- 蜘蛛爬取频次跟什么有关,蜘蛛抓不到内容时会发生什么 - 浏览量:1313
- 蜘蛛抓取跟权重有关系吗,哪些因素影响蜘蛛抓取 - 浏览量:1146
- 搜索引擎不抓取站点的原因,如何解决 - 浏览量:1293
- 搜索引擎蜘蛛抓取页面的依据是什么 - 浏览量:2010
- 蜘蛛抓取页面没有记录是怎么回事 - 浏览量:1942
- 普通用户看不到的页面蜘蛛会抓取收录吗 - 浏览量:1942
- 搜索引擎抓取频率和男女朋友约会频率的相似点 - 浏览量:2220
- 网站是否需要禁止一些不知名的蜘蛛 - 浏览量:2896
- 案例:百度蜘蛛抓取的速度还是挺慢的 - 浏览量:2664
上一篇>> 沐风博客不接文章排名优化的单下一篇>> 网站降权后有哪些表现,网站降权后怎么办
沐风博客最新文章
- 文章断更对网站有什么影响 - 2024-09-14
- 很久没更新,沐风博客首页关键词上来了几个 - 2024-08-28
- 外链优化是什么,外链优化的原则和步骤 - 2024-07-25
- 微信视频号流量池规则和流量算法,分级标准及打开流量池的8大技巧 - 2024-07-24
- 百度搜索对技术性内容有特别的展示机制 - 2024-07-24
- 百度搜索的“普通收录”功能貌似没有作用 - 2024-07-21
- 百度搜索貌似在打击SEO优化 - 2024-07-19
- 抖音新账号播放也能做到10万+ - 2024-07-16
- 抖音直接在手机上发作品貌似没有标题 - 2024-07-08
- 微信视频号点赞的都是好友吗 - 2024-07-08