robots.txt文件应该放在网站根目录下,用好robots是很容易为你网站提权的。
robots.txt其实就是个记事本文件,这个文件应该放到网站的根目录
如想让蜘蛛抓取你的所有页面,可以上传一个空的记事本文件命名为“robots.txt”上传到根目录即可
robots是放在服务器根目录下的,所以你想查看的话就在IE上打http://你的网址/robots.txt要是说查看分析robots的话有专业的相关工具
站长工具就可以!
直接网站域名,后面加这个文件名就可以看,比如:网址/robots.txt,浏览器打开就是,
搜索引擎爬去我们页面的工具叫做搜索引擎机器人,也生动的叫做“蜘蛛”
蜘蛛在爬去网站页面之前,会先去访问网站根目录下面的一个文件,就是robots.txt。这个文件其实就是给“蜘蛛”的规则,如果没有这个文件,蜘蛛会认为你的网站同意全部抓取网页。
Robots.txr文件是一个纯文本文件,可以告诉蜘蛛哪些页面可以爬取(收录),哪些页面不能爬取。
举个例子:建立一个名为robots.txt的文本文件,然后输入
User-agent: * 星号说明允许所有搜索引擎收录
Disallow: index.php? 表示不允许收录以index.php?前缀的链接,比如index.php?=865
Disallow: /tmp/ 表示不允许收录根目录下的tmp目录,包括目录下的文件,比如tmp/232.html
登陆网站后台FTP,robots文件就在站点的根目录下面,直接使用查找输入r就可以找到,如果没有找到的话,可能设置的隐藏,强制现实文件即可,还有一种原因就是网站没有robots文件,不是所有的建站系统都自带robots文件的。
你网站的文件放的地方,一般就是网站的根目录。
robots.txt文件查看的话,如果是自己的网站,只要用记事本打开就可以了;如果是别人的网站的robots.txt就需要借助一些工具来查看了。比较推荐火狐的 Searchstatus 这个插件,使用方法可以查看 里面也有下载地址,很方便的
友情声明:本文内容由用户自发奉献,本站文章量较多,不能保证每篇文章的绝对合法性,若您发觉违规/侵权内容,请尽快联系我们删除。