robots.txt是什么?怎么运用

发布时间:2021-07-07 08:46:28 作者:厚德网络 来源:本站 浏览量:(118) 点赞:(108) 收藏:(108)
摘要:菏泽厚德网络专业网站建设,网站设计,网站制作,网页设计,小程序,app开发公司,专注于菏泽企业互联网品牌营销策划,已为上千家服务,专业团队,值得信赖!

作为一个网站建设加优化的公司,是必须要回的就是robots.txt文件,所以我们就来看看这个文件的意思

robots.txt是一个纯文本文件,用于声明该网站中不想被蜘蛛访问的部分,或者指定蜘蛛抓取的部分。不是规定,而是一种约定,需要蜘蛛自觉遵守的一种习俗

当蜘蛛访问一个站点时,它会首先检查该站点是否存在robots.txt

如果找到,蜘蛛就会按照该文件中的内容来确定抓取的范围

如果该文件不存在,那么蜘蛛就沿着链接直接抓取

网站建设

robots.txt的作用

1、防止私密或重要内容被搜索引擎抓取

2、节省服务器资源,从而提高服务质量

3、减少重复抓取,提高网站质量

4、指定sitemap文件位置

robots.txt是什么

User-agent: *

针对哪个搜索引擎蜘蛛

这里的*代表搜索引擎种类,*是通配符

Allow

定义的是允许蜘蛛抓取某个栏目或文件

Allow: /cgi-bin/

这里定义是允许访问cgi-bin目录

Allow:/* .htm$

允许访问以".htm"为后缀的URL

$指的是匹配行结束符

*指的是匹配任何字符

网站建设

Disallow

定义的是禁止蜘蛛抓取某个栏目或文件

Disallow: /admin/

这里定义是禁止抓取admin目录

Disallow: /cgi-bin/*.htm

禁止抓取/cgi-bin/目录下的所有以".htm"为后缀的URL

Disallow: /*?*

禁止抓取网站中所有包含问号 “?”的网址robots.txt是什么

用法:sitemap: http://www.google.com/sitemap.xml

sitemap:URL全称(包含http://部分)

告诉搜索引擎蜘蛛这个页面是网站地图

robots.txt文件主要是限制整个站点或者目录的蜘蛛访问情况,而robots meta标签则主要是针对某个具体的页面

厚德网络微信

扫一扫,加微信



感兴趣吗?

欢迎联系我们,我们愿意为您解答任何有关网站疑难问题!

您身边的【网站建设专家】

搜索千万次不如咨询1次

主营项目:网站建设,营销型网站,手机网站,响应式网站,SEO优化,小程序开发

立即咨询 155-6200-1135