点击精灵Logo
您的位置:首页 >seo诊断

百度索引量下降?这里有分析和解决方法

来源:精灵SEO 发布时间:2020-09-23

  为一名专业的SEO人员,我们很多的时候都在研究站点中有多少页面可以作为搜索候选结果,也就是一个网站的索引量,所谓网站索引量,就是搜索引擎抓取你网站的数量,这能影响到网站收录率,是一个非常重要的SEO因素。

  索引量是流量的基础,索引量数据的每一个变动都拨动着站长敏感的神经,站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户,页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引,那么,导致百度索引量下降的原因有哪些呢?其解决的方法是什么呢?

百度索引量下降?这里有分析和解决方法

  一、百度官方的原因

  对于导致百度索引量下降的原因,首先我们就要先检查一下是否是因为百度自身导致的结果,简单的来说,马海祥建议你可以从以下2个方面来入手。

  1、配额再分配

  同类数据量接近索引分配总额,配额量再分配,有升的就会有降的。

  解决方法:对于这种情况,只能是想办法超过竞品,争取高额分配。

  2、数据异常错误

  A、错误惩罚

  应对某类作恶行为而新算法上线,但由于蝴蝶效应,导致部分站点被错误惩罚而清除大量索引。

  解决方法:反馈百度方,请求解除惩罚。

  B、地区性数据异常

  部分地区数据抓取或查询异常,导致误判站点情况而清除相应索引数据或输出错误索引量,如百度dns系统升级事件。

  解决方法:反馈百度官方,由百度检查各地蜘蛛执行情况。

  C、接口调用数据错误、数据丢失、数据备份衍生异常

  解决方法:反馈百度官方,由百度检查相关数据情况。

  二、网站本身的原因

  除了百度自身的原因会导致百度索引量下降,还有就是网站自身的原因了,具体来说有以下6点:

  1、内容数据所在的网址url未规范统一

  常规来说,对于这点我们是要分2个方面来分析的:

  (1)、自己站点url规范统一

  多域名都可以200状态正常访问网页内容;一个域名下出现多种url形式可以访问相同内容,如大小写url、url规则变更等。

  解决方法:选择主域名(或主url),其他域名下的所有url都301重定向到主域名或主url(具体可查看马海祥博客《301永久重定向的设置方法大全》的相关介绍),并站长工具提交域名改版(或目录url改版)。

  (2)、外部平台使用己站数据

  A、市场合作,站点数据调用到其他平台上;内容主动外发,推广人员完整转发自有内容到高质量平台——这两个原因都有可能导致搜索引擎收录了外部平台的内容而拒绝了原网站内容。

  解决方法:使用站长平台链接提交工具的主动推送功能,及时提交网站新出现的链接,延迟将内容调用到其他平台的时间。

  B、被镜像,用户通过其他举办主体的域名或url直接可访问己方内容

  解决方法:关注域名解析安全和服务器安全;绑定唯一可解析的域名或唯一可访问的url(具体可查看马海祥博客《如何以SEO的角度来优化网站的URL连接地址》的相关介绍);页面内容中链接使用绝对地址。

  2、站点受青睐度下降

  对于网站因为百度的青睐度下降而导致的索引量下降,我们有可以分为以下4种情况来分析,对此,马海祥也为大家做了一一的介绍:

  (1)、网页内容相关

  A、内容质量度下降

  解决方法:提高内容质量度,详见马海祥博客《提高网站内容质量的7大策略》的相关内容介绍,简单的来说,杜绝简单拷贝,多做整合信息。

  B、更新量及频率下降

  解决方法:稳定的更新频率,视内容发展情况,扩充编辑团队,生产更多新内容,让网站索引避免下降,持续增加(当更新量及频率下降明显,那么配额就会下降,首先表现抓取频次下降,导致索引量下降)。

  C、时效性信息消失

  解决方法:时效性的信息,大部分一般在数据库不会长期保留,所以需要持续挖掘新的时效信息点,整合相关内容。

  D、部分区域出现不良信息

  解决方法:杜绝大量外链软文、恶劣弹窗广告、非法敏感类信息、专门针对搜索引擎作弊的内容等。

  (2)、触犯惩罚算法

  解决方法:关注站长工具消息和百度网页搜索动态,按官方公告说明来整改站点,并进行反馈,然后等待算法更新。

  (3)、特型url不被信任

  解决方法:定制各类url的索引查询规则;定位索引量下降的特型url;排查该类url当日、前一日、本周、历史索引情况;找出未被入库的数据可能存在的问题;处理完后,增强该类url与百度数据沟通(途径有sitemap、批量提交url、数据推送等)。

  (4)、站点被搜索引擎信任度下降

  A、非法投票嫌疑(链接工厂等)

  解决方法:珍惜自己页面的投票权,对于劣质网页坚决不投票,尽量减少站点的导出链接(具体可查看马海祥博客《如何做好网站的高质量链接》的相关介绍)。

  B、主题变动(如从教育领域跨入医疗领域)

  解决方法:将旧领域的网页进行死链处理后向百度进行提交,封禁相关旧url的被访问权,然后再上线新主题相关内容,加强对百度的数据提交。

  C、受牵连

  相同ip下非法站点偏多,同一域名所有人举办的网站大都被惩罚且情况恶劣等。

  解决方法:离开恶邻,获取搜索引擎的各产品的相关反馈方式,请求给予解禁,等待恢复正常索引。

  D、政策性原因

  如香港主机、国外主机站点由于各种你懂的原因,稳定性可能较差。

  解决方法:国内主机备案,合法符合政策经营。

  3、网页模板相关

  从SEO的角度,网站的网页也会影响到百度索引,具体来说有以下3点:

  (1)、主体内容区域对蜘蛛的限制

  解决方法:取消登陆查看信息等限制,让蜘蛛便捷畅快的“采集”到己站数据(具体可查看马海祥博客《搜索引擎蜘蛛的基本原理及工作流程》的相关介绍)。

  (2)、启用了对蜘蛛不友好的技术

  解决方法:对需要蜘蛛识别的内容,不要启用对蜘蛛不友好的技术来调用(具体可查看马海祥博客《抓取网站的搜索引擎蜘蛛是不是越多越好》的相关介绍)。

  (3)、响应式模板干扰蜘蛛识别页面类型(pc、移动)

  解决方法:提交特定的url对应关系(尽量parrten级);meta标记移动版本url及适合浏览的设备;自主适配;增强pc、移动不同模板源码标签的区分度,帮助百度识别页面类型。

  4、源码相关

  源码错误较严重,如编码错误、标签使用错误等;源码改动严重,蜘蛛“采集”数据后重新观察分析;某类url下的TD(网页title、description)变化,如变化比例大、变化页面量大,页面进行更改后会重走建索引库流程,如果页面质量达不到建索引库标准会从线上消失。

  解决方法:校验源码,准确的源码是蜘蛛“采集”数据进行分析的基础;link内链结构、url地址形式、页面主题、页面各区域html标记等尽量维持改动前的情况;逐步、分期更换TD(网页title、description),结合页面主题、用户实际需求来制定合理的TD,不欺骗不误导用户。

  5、已入库的url对蜘蛛状态有变化

  关于这方面,主要有以下4点需要分析的:

  (1)、robots声明,禁止蜘蛛抓取

  解决方法:查看百度站长工具robots及抓取情况(具体可查看马海祥博客《robots协议文件的写法及语法属性解释》的相关介绍)。

  (2)、url规则变化,原有url无法访问

  解决方法:特别是linux和win服务器之间的数据迁移,可能会出现大小写url支持变化,确保各类url规则不变化,url必须重构的时候,做好旧新url的301重定向,站长工具提交改版需求。

  (3)、提示错误页面

  解决方法:由于误删,则可以数据恢复,并维持url对应网页内容的更新变化,提高抓取频次,如果确定要删除,那么提交死链,删除死链后,再robots禁止,马海祥觉得这种情况的索引下降无需担忧。

  (4)、被入侵

  解决方法:防止url对蜘蛛进行非法跳转操作;防止url对应的网页内容对蜘蛛出现内容大变化,特别是一些违法乱纪的内容。

  6、DNS、服务器问题

  最后,导致百度索引量下降的常见原因,还有DNS和服务器的原因,具体来说,有以下几点:

  (1)、DNS问题

  关于DNS问题,主要就是:DNS不稳定;DNS不安全。

  解决方法:选择可靠的DNS服务;沟通强调对蜘蛛的稳定性;防止DNS解析到非正常ip;防止解析的网站ip频繁变动;防止DNS管理漏洞,导致被恶意解析;防止DNS解析挂靠在小代理等技术能力、管理规范、道德法律约束都欠缺的平台上。

  (2)、服务器问题

  A、可访问性差

  解决方法:尽量让目标地区所有运营商来路的用户都能在3秒内打开网站,最佳1秒内;监控网站运行状态,合理设置目标地区的所有运营商监控节点及监控项目、监控频率。

  B、屏蔽百度ua或ip

  解决方法:多利用百度站长工具,查看百度抓取网页的情况。

  C、防刷压力值设定

  解决方法:将蜘蛛解析到专用空间;如出现访问陡增的ip,查看是否为蜘蛛再确定是否禁止访问。

  总结

  对于一个新网站来说,马海祥建议你必须进行定期更新,这样搜索引擎会认为该网站是一个活跃的网站而加以重视,首页的更新可以体现在网站的内容更新或增加、栏目变更、页面排版小变动等多个方面;网站的内容,就以资讯为例,需要大量的信息,如果网站更新不及时,信息过于陈旧,不仅会影响网站的形象,也会降低百度友好度,长期的话,还会直接影响网站权重和流量的攀升以及网站的后续发展。

  此外,网站尽量使用静态页面来表述,这是因为静态页面更利于搜索引擎进行页面内容抓取,而使用数据库技术调用的页面内容不利于搜索引擎抓取。


相关文章内容简介

1 采集来的内容能被百度收录么?百度如何收录采集的文章?

  内容的问题这个就复杂了,为什么说内容的问题很复杂,因为有的内容千篇一律,一旦竞争增加了排名就会下降。内容的问题其实就是要解决采集以及内容价值的问题。你怎么保证内容是不一样的。这个问题你怎么样来解决。怎么样来根据自身行业特色来制定设计内容,又能满足用户的需求,这个问题不解决你去网络采集文章,网站怎么可能会有好的收录,会有好的排名采集不是不可以,但你要保证能够提升页面附加值,在能够解决用户需求的基础上增加受众率(提升点击和阅读量,评论量)。   首先,比如一篇文章被新浪复制了,跟被一般的网站复制了,他的价值都是不一样的,而搜索引擎能够辨别出来。我们现在讲的价值问题,需求问题就是这个问题。就是受众的问题。这个受众的问题其实是非常简单的,也就是说我们页面里面的所有的内容,我们去采集别人的内容。   其次,你采集来的文章要保证有附加值,就是你要保证在这篇文章放到我网站上来时,他的价值是被放大过的,而不是减少的,那我们在弄这样的文章到我们网站上面,他的价值是要增加的,比如在文章专业度上、图文 [阅读全文]

2 WordPress伪静态配置规则与设置方法

  WordPress建站程序中默认链接是参数的形式,也就是常说的动态链接,这种链接对于SEO来说并不是很友好,所以一般我们都会对WordPress中的固定链接格式进行修改,配置成伪静态格式。伪静态与静态的区别就是链接看起来是和静态页面链接一样,但是其实页面还是程序动态生成的,更有利于蜘蛛的抓取以及用户的浏览体验。   比如mod_rewrite模块、伪静态规则的配置,具体可以咨询服务器管理员,另外部分服务器可能不支持中文链接,这个需要注意。   进入WordPress后台设置>固定链接,其中第一个“朴素”就是默认的设置,后面几个是WordPress给出的几个可选项,如果都不是你喜欢的链接格式,那么也可以使用最后一个自定义结构。   1、自定义结构规则   使用自定义结构的话,就需要先了解下有哪些可以设置的参数了。WordPress官方文档列表如下:   %year%基于文章发布年份,比如2007;   %monthnum%基于文章发布月份,比如05;   %day%基于文章发 [阅读全文]

系统提示

登录密码错误!!!