很多SEOer和站长都会很关注一个网站的收录量。说到收录量,通常会用到一个命令:site命令。使用site命令,查出来的一个结果大家都知道,这其实在搜索引擎对你网站能被记录下来或是能被储存下来的页面的总数量,对于绝对收录量来讲通常是指最大收录数值,但并代表每个收录页面都有实际意义。
经常在群里看见一些站长,啪的一下贴出某某网站,快照日期某年某月某天,收录多少多少条,比如说你的网站site出来的是3500条数据,对于这3500个页面,他是否是全都有实际意义的呢?其实不一定,对吗?因为这3500条收录的页面,他不一定有排名,或者是说它一定能带来流量,因此在我们用site命令出来的结果数的时候,我们只能说,他是一个绝对的,而不是一个相对比较有效的收录量。换句说来说就是这3500条收录量它并不会一定能给你带来更高的流量,或是它一定会有更好的排名。这也是为什么在收录量前面加上一个形容词“绝对”。那么我们也明白了一个问题:是不是收录量这个数字越高越代表seo就是好了呢?显然答案不是这样的。
那么,为什么说绝对收录量是没有相对实际意义的呢?
在SERP(Search Engine Results Page的首字母缩写,即搜索引擎结果页面)页面上排名过底的页面,比如说我们有那么多的收录,但是你这条收录对于某个关键词来讲的话,他可能排在了第3页或是更后面。那么对于这条收录量来说,虽然它已经有排名了,但它很难得到流量,也就是说在SERP页面上排名过低的收录页面,对我们的网站意义不是很大。因为它只能排在后面,不能及时的被用户去发现,去浏览。
当页面里的内容不能被很好的读取,那么这条收录也是没有实际意义的,就算被收录了,假如说你这个页面是一个Flash或是一张广告大图,可能说搜索引擎虽然收录了,但是不能读取里面的内容信息,像这样的一个页面,其实也是没有实际意义的,因为这个页面即便是被收录了,但是蜘蛛读不懂,所以根本不可能会有更好的排名。
死链接、错误跳转页面:同样死链接和跳转的页面也会短期内被搜索引擎收录,而这些页面本身对于网站而言已经没有任何内容价值了,所以如果被算到收录量里也是没有意义的。
大量重复页面:当我们的网站收录量数值很庞大的时候,可能会有一些似类的或是一些相关内容的一些重复页面。谷歌有时会收录较多相似的页面,而这些页面原本用户价值都是等同的,原则上不应该被重复收录,所以如果使用绝对收录量的数据也是不能说明什么问题,正如文章开头提到的,网站收录量越大,并不代表SEO做得越好。
缺乏搜索量的内容页面:虽然你这个页面做出来了,收录了,但是他本生是没有用户检索的,也就是说你这个页面没有对用户产生任何的信息帮助,像这样的页面即使你被收录,但是没有一些基础的用户搜索量的时候,这个页面最终也不能给用户带来什么,或是给商家带来转换。
通过以上五点充分说明了,网站页面即便被收录了,在一定的意义上也起不到一个健康流量的作用。
既然讲了绝对收录量,那么所谓的有效收录量是什么呢?
有效收录量的核心就是在那么多的收录量中,到底能产生流量,和被用户检索到的收录量有多少?那么我们该如何去统计一个网站的有效收录量呢?统计的逻辑又是什么呢?
第一:流量只是来自于搜索引擎。
收录量和用户的直接访问、推荐访问是不搭界的。收录只存在于搜索引擎上面,所以说流量如果是来自于搜索引擎上面的,那么就表明了这个页面就是被点到了,被点到了一定就是被收录了。
第二:流量所登陆的页面是哪些?
当我们的页面来自于搜索引擎,有这样的一个接口的时候,这个登陆页是什么?如果能找到所有流量的登陆页,如我们也就清楚的知道哪些页面的收录是有实际意义的。
我们可以通过GA来实现这个数据的采样方法是:在高级区分里建立一个新区分,visit>0,且medium=organic。再切换到Content下的landing pages下,右下角下有一个登陆页的数量。这个数据就是大于0的自然流量下的登陆页数量,这就符合我们的有效收录量的需求。随后我们需要算一个有效收录率,就是将这个有效收录量/绝对收录量,数据%越高代表收录率越好。有效收录率在5%以下的基本是不健康,5%-15%亚健康,15%-30%一般,30%-40%较好,超过40%就非常好了。