时间:2020-06-03 点击: 次 来源:网络 作者:佚名 - 小 + 大
最近我一直在观察我的网站日志,发现了很多不常见的蜘蛛频繁抓取我的网站,大量垃圾蜘蛛甚至爬虫访问很影响性能,特别是服务器配置不高的情况下,那么我们该怎样屏蔽掉垃圾蜘蛛呢?
一般来说,屏蔽蜘蛛抓取有三种方法:
但是我们一般都是通过Robots屏蔽这个方法,Robots 协议(也称为爬虫协议、机器人协议等)用来告诉搜索引擎、爬虫哪些页面可以抓取,哪些页面不能抓取。 需要屏蔽的蜘蛛
屏蔽方式在robots.txt目录下添加下面的代码,添加之后在百度站长平台检测一下robots是否正确。
附各大常见蜘蛛名字百度蜘蛛:Baiduspider 谷歌蜘蛛:Googlebot 必应蜘蛛:bingbot 搜狗蜘蛛:Sogou web spider 360蜘蛛:360Spider |
下一篇:独立IP与共享IP有什么区别?