收录=索引?-论文索引收录什么意思

2023-04-23 23:28:42

 

经常会听到有些人将收录及索引粗暴的混为一谈,那到底这两者之间可以画一个等号吗?

我们来了解下搜索引擎工作原理

首先蜘蛛通过页面上的一些超级链接,不断的发现新的URL并抓取网页,这些网页被蜘蛛抓取之后,如果蜘蛛认为网页里的信息是有价值的,就会进行收录。接着蜘蛛会将收录的网页进行分类,分别放入不同的数据库。最后蜘蛛会将不同数据库里的网页进行排名,用户在搜索结果页看到的便是数据库里网页的相关排名位置。

知道了搜索引擎的工作原理后,就比较方便我们来认识到底什么是收录和索引了。

收录和索引的定义

01

收录

所谓收录,其实就是网站上的内容被抓取,搜索引擎的蜘蛛每天都会来网站爬行抓取,至于来的次数还要看你的更新频率和网站规模,当网站生产出内容,蜘蛛就会爬一遍,它觉得内容有有价值就会拿走,此时这就是一个收录的过程。

02

索引

所谓索引,简言之就是百度蜘蛛对网站抓取完成,并且认为具备一定价值、可以参与搜索结果排名的页面总和。

现在已经知道索引量和收录量是什么了,那它们之间的关系是什么呢?

收录和索引的关系

简言之是包含关系,先收录才可以建索引。网站上的内容被收录以后并不是立刻就参与排名,而是要经过一系列的算法,页面符合建立索引的要求才可以,如果不符合,这个收录会被“踢”出去,所有参与排名的页面都是索引页面,所有索引页面一定是收录页面,所有收录页面一定是你网站上的内容。

上面的解释连贯起来大致就是这样的一个流程:抓取-收录-筛选-索引(这也是百度站长平台官方给出的流程)。也就是网页先被收录,然后搜索引擎将已收录的网页库进行筛选把有价值的页面索引出来呈现给搜索用户。

索引量和site结果的关系

大家应该都知道site命令,这个site命令搜索出来的是什么呢?site出来的结果全部都已经建立了索引,但建立索引的数据不一定会被site出来。

通常site出来的数字是多少下面就可以看到多少,也有一种情况site出来是100条,实际只能看到几十条,这又是什么原因呢?这种情况一般新站比较容易出现,不用慌张,搜索引擎已经收录了,只是还没有释放出来而已,耐心等待一段时间就会被释放出来,如果是老站出现这种情况,说明网站可能是被降权了,需要提高警惕并排查原因。


以上就是关于《收录=索引?-论文索引收录什么意思》的全部内容,本文网址:https://www.7ca.cn/baike/18931.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜