遇见SEO
关注互联网营销技术

无效收录页的处理方法及404页面设置

网站改版后,留下了许多死链接。为了不让百度收录这些页面,设置了404个页面。但后来发现,百度仍收录了大量404页,并多次向百度提交死链接,仍没有改善。有人说这是百度的问题,很多人都遇到过这种情况。如果这样的问题属于一个比较小的网站,可能很难感受到影响,但是一旦网站规模比较大,死链接比较多,就会对网站本身产生影响,包括权重、排名、流量。

我们都知道404页面的一些基本规则,但是很少有人关注它。即使我们发现了这些问题,我们也不会继续研究,因为我们觉得问题不大。但是,如果任由这样的问题存在,久而久之会给网站带来很大的麻烦,因此笔者建议作为站长,任何微妙的问题都应该有奋力追赶的动力。下面将404页面的一些知识分享给大家。

404页面设置方法
 

404页面收录问题

在这个问题上,没有达成共识。有人说404页会被收录。404本身告诉搜索引擎和访问者这个页面已经不存在了。请绕道或转到其他页面。已经收录的页面删除后设置成404页面后还是会被收录。

404页面收录的危害

404页面收录的一个功能就是已经设置了404页面,百度仍然放出来,可以检索,但是快照没有更新。

收录少量404页面,或者你的站点本身没有很多404页面,就不会感觉到更大的危害。而对于那些建立时间长、发展迅速的网站来说,在庞大的数据下,必然会出现大量的死链接和错误链接。此时,您无法避免收录404页的问题。让我们来看看404页的一些危害:

1.页面对搜索引擎没有价值

对于搜索引擎来说,一个URL就是一个页面,一般来说,网站的404个页面都是相同的设置,所以一旦搜索引擎蜘蛛抓到这些页面,就会出现大量内容相同的页面。可以想象,搜索引擎会如何处理你的网站。

2.影响其他页面的收录和权重,进而影响流量

网站的权重会影响蜘蛛的爬行时间和次数,因此一个网站能获得多少蜘蛛和爬行多少次是相对固定的。换句话说,蜘蛛在一段时间内抓取你网站的数据是有限的。假设蜘蛛在这404个页面中浪费了资源,那么在网站中爬行真正有价值的页面的数量就会减少。404页面中99%因为没有价值而不被收录,这将影响网站的收录和网站流量。

如果需要删除收录的页面应该怎么做?

1.页面少,可设置为404页。404页的状态码必须是404(未找到),这样搜索引擎就会认为该页无效,并从搜索结果中删除该页。

2.如果收录的页面数量很大,考虑到网站的权重,可以设置301重定向来传递权重,但这也需要小心。

3.如果大量收录的页面需要从“收录的结果”页面中删除,该页面可以使用robots.txt文件,禁止蜘蛛爬行这些网址。

赞(0)
如需转载请注明出处:遇见seo » 无效收录页的处理方法及404页面设置