点击精灵Logo
您的位置:首页 >seo中级

探索搜索引擎蜘蛛的抓取规律,外链是否有时效性?

来源:精灵SEO 发布时间:2020-01-14

  探索搜索引擎蜘蛛的抓取规律,外链是否有时效性?做SEO优化的我们都晓得搜索引擎录入页面是靠蜘蛛抓取来录入的,所以了解搜索引擎的改动是必需的。搜索引擎蜘蛛是大家编写出来的机器,一定存在着某种规则。

探索搜索引擎蜘蛛的抓取规律,外链是否有时效性

  一、搜索引擎蜘蛛的抓取规律

  1、优质网站专门分配蜘蛛抓取,及时抓取,及时收录,及时放出供网民搜索;

  2、普通网站,分配一定的蜘蛛抓取资源,爬到一定量就不抓取了;

  根据以上两种抓取原则,在配合两种抓取方法:横向抓取,纵向抓取;

  网页抓取规则:遵循F型抓取规则,从左到右,从商到下的原则抓取。

  一般情况下,一个新上线的网站需要一段时间才会被录入。当搜索引擎录入网站时,一般是从主页收录,接着顺着主页再进入内页。搜索引擎很“花心”,它不是一次性将网站悉数抓取完,而是分不一样的时间段进行抓取,然后核算出蜘蛛在网站的活动时间及时间的长短。

  新站的页面即便被抓取也不会马上被放出来,需要经过搜索引擎重复核算,供认网站的确有必要录入,这时才会把页面放出来,一般新站的网站快照和录入页面都是晚一个星期才会被放出来。

  一定要紧记下面这段话:在搜索引擎蜘蛛抓取网站的时分,千万不能出现网站打不开或许有死链的情况,假设出现这种情况,搜索引擎会连续对网站的抓取,往后什么时分再来就不一定了。有很多人有一个不好的习惯,也有一个不错的猜想,认为域名的年纪越长,越遭到搜索引擎的亲赖。

  有好多人,网站刚刚做完主页,马上上线,主页上的衔接大多数都是死链,搜索引擎蜘蛛进入后,抓取网站内页时进不去,对网站形象大幅度降低,然后减少来抓取网站的次数。假设下次来光临的时候, 网站仍是原样,这样往复几回,搜索引擎蜘蛛就会不友好,觉得是低质网站,毕竟抛弃抓取该网站。

  网站成功上线一段时间后,才会进入安稳时期。baidu和Google会给新站一段时间的查核期,查核期过后,才认为网站是一个长时间的网站,这个时间为3-6个月。处在安稳期的网站,搜索引擎蜘蛛会常常来光临,它们仍是和前期时期一样,从主页进入网站抓取。

  baidu和Google略有不一样,假设baidu发现网站主页的内容没有改动,会马上中止抓取;而Google不是这样,即使发现网站主页没有改动,仍是照常顺着主页的衔接继续抓取,这便是有些网站Google比baidu录入页面多的原因之一。

  当更新网站的内容时,一定要在网站主页中显示出来,否则百度蜘蛛不会录入更新的页面,因为主页没有改动,百度蜘蛛不往内页抓取,所以不晓得有新的页面发作。这也是有的公司网站常常犯的错误之一,主页的内容是死的,不能改动,致使网站的录入量一贯没有改动。安稳时期的网站快照和录入页面一般是近两天内被放出来。。搜索引擎也是一样,它对网站形象好,会常常来,常常更新网站的快照,常常录入页面;假设对网站形象欠好,所以要先养站,只需网站略微有“打擦边球”的嫌疑,被封掉的可能性就会很大。

  二、外链是否有时效性

  早几年在博客中国的博客(可能是因为流量超标在2016年被删除了)早就已经被删了,但是百度依然有快照。今天看了下首页的快照已经没有了,但是文章页面还存在。看快照日期可以看到是2016年,甚至更久的。

  也就是虽然页面被删除了有5年之久,但是百度的快照没有删除,那么你说这里面的链接蜘蛛会不会爬呢?我感觉应该是会爬的,而且我在博客网的这个博客是有一个域名A的链接的,当时只是做了个跳转到博客首页。后来在我启用域名A做博客的时候,立马就获得了一个很好的权重,而且文章很容易被秒收。相信这个5年前的链接起到了不少的作用。

  如果外链所在页面搜索引擎没有了快照,外链是否有效呢?答案可能会出乎很多人的意料,外链所在页面没有了快照依然还可以有效。原因可以查看我在蜘蛛如何抓取链接这篇文章里写的,蜘蛛抓取页面之后,会把内容和链接分开,链接也就是URL会加入一个网址索引库,而蜘蛛抓取是从这个网址索引库出发的。

  先看证据,这个证据来自于谷歌站长工具:这个截屏来自于Google站长工具故障诊断的404报告,以前我在原网站下面架设了个bbs,当然早在N年前已经删除了。可是这个不存在的页面,被Google蜘蛛抓取的来源地址竟然也是不存在的页面。而用Google搜索,是没有这些页面的快照的。那是不是意味着已经404了很久的页面上的导出链接依然有效?

  三、那么外链对于搜索引擎是否有时效性呢?

  很明显应该是有时效性的。那么我就猜测一下外链失效的原因吧,应该会有两个原因:那就是外链所在页面被删或者链接被删。

  1.针对页面被删的情况,搜索引擎应该会继续抓取这个页面上的外链,直到这个页面404一定时间后,会给搜索引擎网址索引库一个命令删除这个外链。

  2.而对于页面更改的情况,搜索引擎应该也会抓取这个外链,直到这个含有这个外链快照在搜索引擎内部彻底删除,会给网址索引库一个命令删除这个外链。因为含有外链的页面根据情况会保存N个时期的快照,这就是为什么有时候搜不同的词,网页快照不同。推荐阅读:seo编辑如何撰写提升排名的站内文章?

相关文章内容简介

1 为什么长尾关键词优化这么重要?

  为什么长尾关键词优化这么重要?在做SEO优化的时候,由于很多行业做优化的网站数量很多,现在很多站长做关键词排名都倍感吃力,同时很多网站流量也达不到想要的效果,因此在做核心关键词优化的同时,长尾词优化也是不可缺少。   用文章做长尾关键词。如果一篇文章有长尾关键词,那么这十篇文章可以有十个长尾关键词。做SEO通常是以写文章为目的,随着时间的积累,当文章越来越多的时候,做长尾关键词就会增多。   很多站长写文章只是为了更新,而不考虑做长尾关键词,如果网站只是为了首页有排名,那没关系。如果你希望你的整个网站有流量,而不仅仅是主页,那就要考虑做长尾关键词。将长尾关键词有效地融入到文章中,然后别人搜索长尾关键词,就有可能来到你的网站。   长尾关键词的威力主要取决于“数量”。如果整个网站只有十几篇文章,就不能显示出它的威力,因为我们不能指望每一个长尾关键词都排名好。刻意优化长尾关键词,会使网站的整体质量逐步提高,也就是网站的权重。长尾关键词有很多很好的排名,而且总量加起来会很不错。所以平时 [阅读全文]

2 搞不懂谷歌的熊猫算法,你还想有网站排名?

  熊猫算法最早在2011年被推出,说来也巧,它原来不叫这个名字,但是主导这个算法的项目工程师叫Biswanath Panda,翻译过来刚好是熊猫,所以就放弃了它本来的名称,从此这个非正式的叫法就一直沿用了下来。我们先大概的描述一下“算法”的概念以及“熊猫算法”在Google SEO中所扮演的角色。   算法:指用于解决特定问题的基于逻辑的逐步过程。对于搜索引擎而言,问题是“如何为这组特定的关键字(或搜索字词)找到最相关的网页。”对于谷歌搜索引擎来说,算法是Google查找,排名和返回相关结果的一种结果运行机制。   有点拗口是不是?那么你简单的把它理解为谷歌的排名系统法则就行了。反正这套原理归根结底也没有哪一个人能够具体解释清楚,因为这是谷歌的命根子,属于绝密级别的,外人甚至是谷歌的高等级工程师也不可能全面了解,涉及的因素和条件甚至是排名的数学模型等同于造一颗原子弹。但正是因为这样的复杂和紧密,才导致谷歌搜索引擎占据了国际上最大的搜索引擎市场份额。(着重提醒百度,不要天天闭门造车,光 [阅读全文]

系统提示

登录密码错误!!!