遇见SEO
关注互联网营销技术

搜索引擎蜘蛛不爬取网站的原因?

很多站长在SEO诊断的过程中经常遇到这样的问题。有些网页内容质量很高,用户也可以正常访问。然而,搜索引擎的蜘蛛蜘蛛无法访问和抓取,导致搜索结果的覆盖不足,这对百度搜索引擎和网站来说都是一种损失。百度称这种情况为“抢夺例外”。对于大量内容无法正常捕获的网站,百度搜索引擎会认为网站存在用户体验缺陷,降低对网站的评价。它的爬行、索引和排名都会受到一定程度的负面影响,最终影响到从百度获得的网站流量。下面,笔者总结了搜索引擎蜘蛛爬行不畅的一些常见原因,供大家参考。

服务器链接异常

服务器链接异常有两种情况:一种是站点不稳定,百度皮德在尝试链接时暂时无法链接到您的网站服务器;另一种是百度皮德已经无法链接到您网站的服务器。

服务器链接异常的原因通常是您的网站服务器太大和过载。也有可能是你的网站运行不正常。请检查网站的web服务器是否安装和运行正常,使用浏览器检查主页是否可以正常访问。您的网站和主机也可能会阻止空间或购买CDN服务。

搜索引擎蜘蛛不爬取网站的原因
 

DNS异常

当百度pider无法解析您网站的IP地址时,会发生DNS异常。可能是你的网站IP地址不对,或者域名服务商已经禁止百度pider。请使用whois或主机检查您的网站的IP地址是否正确和可解析。如果没有,请联系域名注册人更新您的IP地址。

IP封禁

IP阻塞是限制网络的导出IP地址,禁止IP段的用户访问内容。在这里,它具体指的是屏蔽百度piderip。当您的站点不希望Baidupider访问时,此设置是必需的。如果你想百度piderip。也有可能是你网站的空间服务提供商屏蔽了百度IP。此时,您需要与服务提供商联系以更改设置。

UA封禁

UA是用户代理,服务器通过UA识别访问者。当一个网站访问一个指定的UA并返回到一个异常页面(如404500)或跳转到其他页面时,称为UA阻塞。只有当您的网站不想让Baidupider访问您的网站时才需要此设置;如果您希望百度蜘蛛访问您的网站,请检查Baidupiderua是否在usragent的相关设置中,并及时修改。

死链

页面不再有效,不能为用户提供任何有价值的信息是死链接,包括协议死锁和内容死锁。协议死锁是指页面的TCP协议状态和HTTP协议状态明确表示的死链,如404、403、502状态等;内容死锁是指与原始内容无关的信息页面的死链,如不存在、已删除或需要权限等,服务器返回正常状态,但内容已变为与原始内容无关的信息页死链。

对于死链,我们建议站点使用协议死锁,并通过百度站长平台——死链工具提交给百度,这样百度就能更快地找到死链,减少死链对用户和搜索引擎的负面影响。

异常跳转

假设网络请求点到另一个位置是跳转,异常跳转是指以下情况。

1、当前页面是无效页面(内容已被删除、死链等),直接跳转到上一个目录或首页。百度建议站长删除入口超链接的无效页面。

2、跳转到错误或无效的页面。(注:对于长期跳转到其他域名,如网站域名变更,百度建议使用201跳转协议设置。)

其他异常

1、对于百度引用异常:网页从百度返回与正常内容不同的行为供参考。

2、针对BaiduUA异常:返回BaiduUA的网页行为与页面原始内容不同。

3、JS跳转异常:网页加载了百度无法识别的JS跳转代码,这使得用户通过搜索结果进入页面后跳转。

4、意外禁播导致压力过大:百度会根据网站规模、访问量等信息自动设置合理的压力值。但在异常情况下,如压力控制异常,服务器会根据自身负载进行保护性意外闭锁。在这种情况下,您将在一段时间后再次尝试获取链接。如果站点空闲,则会成功爬网。

赞(0)
如需转载请注明出处:遇见seo » 搜索引擎蜘蛛不爬取网站的原因?