网站优化中应对蜘蛛抓取基本策略
做最负责任的网络企业服务商
用我们真诚的微笑换取客户对我们服务的满意

网站优化中应对蜘蛛抓取基本策略

作者:网络 / 发布时间:2022-05-02 22:49:50 / 浏览量:5910

  在网站优化中蜘蛛实际抓取网页的过程中,因为网页内容的复杂性(文本、Flash、视频等)和技术实现的多样性(纯静态、动态加载等),为了更高效地利用蛛蛛资源,搜索引擎公司会置顶不同的抓取策略,作为SEO人员,可以参考搜素引擎公司对抓取策略的描述,采用最大化的SEO方法。

  作为国内最大的搜索引擎公司,百度在它的官方文档中是如下这样描述抓取策略的。

  互联网资源具有庞大的数量级,这就要求抓取系统尽可能高效地利用带宽,在有限的硬件和带宽资源下尽可能多地抓取到有价值的资源。这就造成了另一个问题,耗费被抓取网站的带宽造成访问压力,如果程度过大,将直接影响被抓取网站的正常用户访问行为。因此,在抓取过程中要进行一定的抓取压力控制,实现既不影响网站的正常用户访问,又能尽量多地抓取到有价值资源的目标。

  通常情况下,采用的最基本的方法是基于IP的压力控制。这是因为如果基于城名,可能存在一个域名对多个IP(很多大网站)或多个城名对应同一个IP(小网站共享IP)的问题。实际工作中,往往根据IP及域名的多种条件进行压力控制。同时,站长平台也推出了压力反馈工具,站长可以人工调配对自己网站的抓取压力,这时Baiduspider将优先按照站长的要求进行抓取压力控制。

  对同一个站点的抓取速度控制一般分为两类:其一,一段时间内的抓取频率;其二,一段时间内的抓取流量。同一站点不同的时间抓取速度也会不同,例如,夜深人静的时候抓取的可能就会快一些。也视具体站点类型而定,主要思想是错开正常用户访问高峰,不断地调整。对于不同站点,也需要不同的抓取速度。

  上面的描述很简洁,但是从这个描述里面,我们可以得到启发,蜘蛛抓取页面是有压力控制的,对于特别大型的网站来说,不可能指望蜘蛛爬行到一个网站后,会一次性抓取到所有的网站,因此,作为SEO人员来说,尽量减少蜘蛛的压力,对网站的网页收录是有好处的。一般来说,减轻蜘蛛压力有以下两种方法。

  方法一:采用Nofollow(反垃圾链接的标签)的策略,将蜘蛛引导到最有价值的页面。Nofollow标签用来告诉蜘蛛,如果遇到带着此标签的页面或者链接,就不要继续追踪了,这样蜘蛛就可以爬行到其他更加有用的页面。

  方法二:在Sitetap中定义不同页面的权重和更新频率,就是在网站的Sitemap文件中,定义好每个链接的权重和更新的频率,这样,蜘蛛在爬行到这些链接和页面的时候,会识别哪些页面比较重要,可以重点抓取,哪些页面更新比较频繁,需要蜘蛛分配更多的注意力。

  以上就是《网站优化中应对蜘蛛抓取基本策略》的全部内容,仅供站长朋友们互动交流学习,SEO优化是一个需要坚持的过程,希望大家一起共同进步。


热门资讯

  • 网站快速排名是什么技术

    网站快速排名,圈内是指网站的关键词快速排名搜索引擎首页。很多站长朋友和企业老总们总喜欢问:网站快速排名是什么技术实现的,安不安全,是不是排名快的都是快排技术?小编也大致说下。网站快速排名,可以有两种理解,

    2018-09-04
  • 营销型网站制作需要注意的知识点

      互联网的发展给营销型网站制作公司带来春天,营销型网站的最大诱人之处在于比普通网站的转化率优秀。因此获得许多企业的青睐,从此营销型网站制作就火了!众所周知营销型网站能为企业赢得网站流量,进而提高企业

    2022-03-18
  • 2018年搜索引擎搜索给SEO站长们的一些不可磨灭的印象

    回顾一年来做SEO的历程,有过太多的感慨,就小编自身而言,比较大的感慨就是两个词:降权!排名不稳!这两个问题今年就一直围绕在小编的脑海中不曾停止过,经过一年来的实践,

    2018-12-17
  • 搜索引擎自然搜索结果首页不止10个

    今日,小编在使用搜索引擎搜索的时候意外发现,搜索的自然结果数量由默认的10个变成了12个,有的13个,翻页的还是保留原来的默认10个。经过小编仔细查看,发现之所以多出了几个位置,应该是搜索引擎近期做了一些调整

    2019-11-11
  • 中小企业网络推广需要2.0

     企业信息化建设、电子商务解决方案、企业网站建设等各方面意见不一,使中小企业感到困惑,未能深刻揭示大多数中小企业的内在真实需求。面对各种不同的观点,网络推广理论更符合广大中小企业的实际需要。显而易见的

    2019-07-31