Google SEO:如何查看和优化抓取预算?
在前文“Technical SEO: 如何处理Google索引网页的相关问题?”中,我们介绍了GSC中“网页未被编入索引的原因列表”中索引相关的问题及解决方法。事实上,我们都清楚,搜索引擎的工作流程并不是从索引开始的,而是从抓取网页及相关内容开始的。 本文主要介绍GoogleBot的抓取,及抓取预算等相关概念,以及掌握这些技能对我们网站SEO的好处。让我们开始吧! 什么是Googlebot,以及Googlebot是如何抓取网页的? Googlebot是Google用于爬取浩瀚网络中各个网页的一种程序,也叫网络爬虫。事实上,从1993年搜索引擎第一次使用网络爬虫到现在已经走过32年历程。在这30多年中,各大搜索引擎轮番进入大众视野,搜索引擎的运行机制也更加完善,但基本的工作原理却没有大的变化,主要是抓取,索引和排名。 我们所创建的页面对于Google来说是陌生的,它并不知道这些页面的存在,除非Googlebot抓取了我们的URL。Google会根据我们页面的内容、图片、视频等识别URL是新页面,还是已知页面。Google也会从页面上的URL去爬取另一个页面。但是,这样的爬取操作并不是无尽的。 网络爬虫使用算法来确定要抓取的网站、抓取频率以及要从每个网站抓取的网页数量,而Googlebot在我们网站上抓取的最大网页数和时间就叫抓取预算(Crawl Budget)。它由抓取需求(即搜索引擎希望在我们的网站上抓取多少页面)和抓取速率(即它们可以抓取的速度)组成。 懂得搜索引擎工作原理是作为一名SEO的入门课程,这里我们就不详细介绍了。想深入学习的朋友可以阅读这篇文章:In-depth guide to how Google Search works。 这里需要提一下,越多的抓取并不意味着我们排名就越好,但是如果我们的页面不被抓取,就很难索引和排名了。 我们的网站是否需要关注抓取预算? 并不是所有网站都需要关注抓取预算,如果我们是以下类型的网站,那么,我们就需要关注网站的抓取预算了: 如果我们的网站是以上情况之一、或者若干,如果你有很多页面没有按照你想要的频率被抓取或更新,那么你可能想考虑加快抓取速度。我们先看看如何查看网站的抓取预算。 如何查看自己网站的抓取预算? GSC的“设置”->“抓取统计信息”里向我们提供了Google的抓取报告。如下图 这个报告向我们展示了过去两个月Googlebot的抓取情况,包括响应情况、文件类型、目的和Googlebot类型,点击可以查看相关链接。当然,如果你想查看更长时间和更多内容,可以通过工具访问日志文件。 Google如何为网站分配抓取预算? 抓取预算本质上是 Google 愿意花费在抓取你的网站上的时间和资源,每个网站都有不同的抓取预算。 抓取预算 = 抓取需求 + 抓取速率 尽管如此,我们还是可以有针对性地进行抓取预算优化。 如何优化抓取预算? 1、统筹整站页面情况,筛选网站中所有高价值页面。高价值页面是需要参与排名转化的页面。我们要做的是让这些高价值页面快速抓取索引、并优化排名。 2、优化外链结构。Google抓取的页面数量大致与网站权重成正比。我们网站的外链越多,越容易被抓取。 3、优化服务器性能和网站性能。 服务器响应时间和页面加载速度直接影响抓取。服务器和网站性能优化主要包括: 另外 这里需要提一下,谷歌的抓取速率设置工具已经在年初停用。 如果我们遇到Googlebot大量抓取页面导致服务器返回5xx错误,自己又无法通过技术解决此类问题,可以向Google提交特殊请求。 文中所述链接如下: Large site owner’s guide to managing your crawl budget What Crawl Budget […]
Google SEO:如何查看和优化抓取预算? Read More »