南宫28NG相信品牌的力量
全部
All
当前位置: 首页 > 新闻资讯 > 什么是Robots协议
相关新闻
  • 怎么样使你的网站设计变得灵动有趣

    2026-03-10 14:41:40

    网站设计的风格千变万化,作为一名网站设计师,同样也喜欢尝试不同的风格。谁说扁平化风格的网站设计不能配立体的图,有时候混搭的感觉也不错,只要画面简洁,构成顺眼,也就变成了另一道风景,下面一系列

  • 南宫28NG相信品牌的力量谱写数字中国新“乐章”

    2026-03-09 14:41:40

    首届数字中国建设峰会主题为“以信息化驱动现代化,加快建设数字中国”首届数字中国建设峰会在福建省福州市举办。雪域高原之上,西藏昌都市实验小学的“未来教室”里,老师罗芳给孩子们演示了多媒体动画,

  • 商务网站设计必须注意的10条原则

    2026-03-05 14:41:40

    网购已经是当今生活的一部分,零售商都要转向电商平台。其实除了大家熟知的淘宝、京东们,还有很多大大小小的电商网站开发,特别是一些垂直领域。要吸引访问者首先要注意的是网站开发的设计和布局,要立即

  • 韩都衣舍:利用互联网企业天生优势“以柔克刚”!

    2026-02-20 14:41:40

    新冠肺炎的疫情来势汹汹,这只突然飞来的“黑天鹅”给很多企业在2020开年带来了诸多影响与困难。韩都衣舍作为国内知名的互联网网站开发企业,发挥了天然基因优势,面对疫情,亮出第一招——以柔克刚!

  • 网站设计首屏的关键点

    2026-02-17 14:41:40

    众所周知,在任何网站设计中首屏的位置是最关键的,它可以说是网站的脸面和灵魂,不论是从企业还是从用户角度来说,最关注最重视的一定是网站设计首屏。网站设计{{K}}给大家分析一下网站设计首屏六个

什么是Robots协议

返回列表
发布时间:2026-02-18 14:41:40
Robots协议的全称是“网络爬虫排除标准”(Robots Exclusion
Protocol),网站通过Robots协议让搜索引擎知道哪些页面能抓取,哪些页面不能抓取。


公司网站设计案例


robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,可以创建和编辑它。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。


当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。



Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots
Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots
Meta标签也是放在页面中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。


Robots
Meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。


index指令告诉搜索机器人抓取该页面;


follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;


Robots Meta标签的缺省值是index和follow,只有inktomi除外,对于它,缺省值是index、nofollow。



Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:音乐,视频等,节省服务器带宽;也可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。


Robots协议是网站出于安全和隐私考虑,防止搜索引擎抓取敏感信息而设置的。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神,互联网企业只有遵守这一规则,才能保证网站及用户的隐私数据不被侵犯。Robots协议是维护互联网世界隐私安全的重要规则,如果被破坏,其后果是不可想象的。