robots禁止网站抓取,还会被搜索引擎索引收录吗?

访客4年前黑客工具925

网站优化诊断的其中一项,就是检查有无做robots文件,是否规范。如果网站的robots协议文件禁止了搜索引擎蜘蛛,那么无论你怎么优化都不会被收录。

趁着写这篇文章,给这句话做个纠正,请大家认真阅读并且理解。如下:

如果你的网站添加了robots协议文件,并且设置了禁止搜索引擎蜘蛛的指令,那么你的网站内容将不会被抓取,但有可能会被收录(索引)。

有些人可能会有疑问,搜索引擎蜘蛛爬行url页面,页面需要有内容呈现出来反馈给到蜘蛛,才有可能会被收录。那么,如果内容都被禁止了还会被收录吗?这是什么意思呢?这个问题这里先不解释,大家先看看下面的图片吧。

如图所示,以上是site: *** 域名出现被收录的结果。从site结果里面可以清楚的看到,从site结果里面可以清楚的看到,这里收录了很多 *** 网站的页面,显示收录结果为2亿6159万个页面。但是大家不知道有没有发现一个问题,这些页面抓取的描述内容都是提示了这样一段文字:由于该网站的robots.txt文件存在限制指令(限制搜索引擎抓取),系统无法提供该页面的内容描述

robots禁止搜索引擎蜘蛛后为什么会被收录呢?

这里有个认知上的错误,也可能是惯性逻辑思维的错误思考。大家都认为蜘蛛不能抓取内容就不会收录,实际上爬行、抓取、索引(收录)是不同的概念。很多人学习SEO的时候,经常性的对一些SEO的概念混肴不清,导致在后面的SEO优化过程当中并不能发挥出很好的效果。

还是先来说说robots协议到底是在做什么?既然是协议,那肯定是双方同意、认可的规矩。这个甲乙自然就是网站和搜索引擎(或者说搜索引擎蜘蛛)之间的协议。robots文件会放在根目录下,蜘蛛进入网站会之一时间访问这个文件,然后看看协议里面有没有禁止了那些页面不能抓取,如果禁止了就不会再去抓取。

一个页面想要去搜索引擎索引(收录),收录要有蜘蛛爬行和抓取,既然不抓取,理所当然的就会被认为这个页面是不会被收录。这样的思维是错误的,不抓取也是可以被索引(收录)。如 *** 就是一个典型的案例,网站添加了禁止协议,最后还是被收录。原因在于,百度从其它渠道平台推荐的外部链接了解到这个网站,虽然被禁止抓取,但从标题和推荐链接的数据里还是可以判断出与该页面相应的内容信息。

相关文章

找黑客协助需要多少钱-黑客制作的破解版软件(黑客怎么下载破解版软件

网络黑客种植大户赌鬼援助研究会怎么加入 各种软件破解产业基地(各大论坛vip会员破译) 网络主播如何防黑客入侵 外网地址端口号进攻(网络服务器外网地址端口号怎样开) 新汽车车轱辘上...

怎么看笔记本的配置(不用借助软件查看电脑配

怎么看笔记本的配置(不用借助软件查看电脑配

通常在一般人眼中看到电脑是这样的: 在高手眼中看电脑是这样的: 首先我来统括下,电脑主要几大硬件配置为:cpu,显卡,内存,硬盘,一般买电脑的话我们主要也就看这几大配置,下面我将分别介绍,...

年终总结报告范文(年终工作总结范文6篇)

  年终总结报告范文(年终工作总结范文6篇)   时光飞逝,伴随着比较紧凑又略显紧张的工作节奏,2021年就这样快接近尾声,虽然我来公司时间还不太长,但是时间的脚步依然没有放慢它前行的脚步,经过这一段...

查老公的手机通话清单去营业厅需要什么?能查到

相信现在有很多的朋友们对于国有土地使用证上面写什么有什么作用吗都想要了解吧,那么今天小编就来给大家针对国有土地使用证上面写什么有什么作用吗进行一个介绍吧,希望小编介绍的内容能够为大家起到帮助哦...

微信同步监控是真的吗?怎么开启微信同步监控?

每日要闻我是水果。我的很多朋友工作时都会在电脑上发微信。最近,微信电脑版本已经升级到2.7.1的官方版本。本次更新增加了一些非常实用的功能,使手机微信与电脑微信的连接更加顺畅,提高了微信的使用效率。...

什么动物最容易摔倒?你知道答案吗

什么动物最容易摔倒?你知道答案吗

我到底睡了多久 高二那年高三的高考完后, 上课,西西同桌正在睡觉,班主任突然进来了, 第一句话就是:“你们现在已经高三了!” 同桌被吓得坐了起来, 瞪大了眼望着西西道:“我到底睡了多久?!!...