搜索引擎的工作方式是使用网络爬虫抓取数十亿个页面。爬虫也称为蜘蛛或机器人,它们在网络上导航并跟踪链接以查找新页面。然后,这些页面会被添加到搜索引擎从中提取结果的索引中。
如果你在做 SEO,了解搜索引擎的运作方式至关重要。毕竟,如果你不知道某件事的运作方式,就很难对其进行优化。
这就是您将在本指南中了解的内容。
第 1 部分
搜索引擎基础知识 #
让我们首先探讨一下什么是搜索引擎、为什么存在以及它们如何赚钱。
什么是搜索引擎? #
搜索引擎是可搜索的网络内容数据库。它们由两个主要部分组成:
- 搜索索引。有关网页的信息的数字图书馆。
- 搜索算法。负责匹配搜索索引结果的计算机程序。
搜索引擎的目的是什么? #
每个搜索引擎都致力于为用户提供最佳、最相关的结果。这也是他们赢得市场份额的方式之一。
搜索引擎如何赚钱? #
搜索引擎有两种类型的搜索结果:
- 来自搜索索引的自然结果。您无需付费即可访问此处。
- 来自广告商的付费结果。您可以付费来到这里。
每次有人点击付费搜索结果时,广告商都会向搜索引擎付费。这就是所谓的按点击付费 (PPC) 广告,这就是市场份额如此重要的原因。用户越多,广告点击次数越多,收入也就越多。

第 2 部分
搜索引擎如何建立索引 #
每个搜索引擎都有自己的搜索索引构建流程。以下是 Google 使用的流程的简化版本。[1]

让我们分解一下。
网址 #
一切都始于已知的 URL 列表。Google 会通过多种方式发现这些 URL,但最常见的三种方式是:
- 通过反向链接。谷歌拥有数千亿个网页的索引。[2]如果有人从已知页面链接到新页面,谷歌就可以从那里找到它。
- 来自站点地图。站点地图会告诉 Google 你认为网站上哪些页面和文件比较重要。[3]
- 通过 URL 提交。Google允许网站所有者在Google Search Console中请求抓取单个 URL 。
爬行 #
抓取是指计算机机器人(称为蜘蛛)访问并下载已知 URL 的过程。Google 的抓取工具是Googlebot。[4]
处理和渲染 #
处理是指 Google 理解和提取抓取到的网页中的关键信息。为此,它必须呈现网页,也就是运行网页代码以了解网页在用户眼中是什么样子。
除了 Google 之外,没有人知道这个过程的所有细节。但这并不重要。我们真正需要知道的是,它涉及提取链接和存储内容以供索引。
索引 #
索引是将抓取的页面中处理过的信息添加到搜索索引中。
搜索索引就是您使用搜索引擎时搜索的内容。这就是为什么在 Google 和 Bing 等主要搜索引擎中建立索引如此重要。除非您出现在索引中,否则用户无法找到您。 你可知道?
Google 占据了 91.43% 的搜索引擎市场。它可以比其他搜索引擎带来更多的流量,因为它是大多数人使用的搜索引擎。[5]
第 3 部分
搜索引擎如何对网页进行排名 #
发现、抓取和索引内容只是难题的第一部分。搜索引擎还需要一种方法来在用户执行搜索时对匹配结果进行排名。这是搜索算法的工作。
什么是搜索算法? #
搜索算法是从索引中匹配和排列相关结果的公式。Google 在其算法中使用了许多因素。
谷歌排名的关键因素 #
没有人知道所有的 Google 排名因素,因为 Google 并未公布这些因素。但我们确实知道一些关键因素。让我们来看看其中的几个。
反向链接 #
反向链接是从一个网站的页面链接到另一个网站的链接。它们是 Google 最重要的排名因素之一。[6]这可能就是为什么我们在对超过十亿个页面的研究中发现链接域和自然流量之间存在很强的相关性的原因。[7]

不过,数量并不重要。质量也很重要。拥有少量高质量反向链接的页面通常比拥有大量低质量反向链接的页面排名更高。你可知道?
您可以在 Ahrefs 中免费检查您网站的反向链接。
注册一个免费的Ahrefs 网站管理员工具帐户,在网站资源管理器中输入你的域名,然后转到反向链接报告。

我们的爬虫是网络上第五活跃的爬虫,[8]因此在这里您可以看到您反向链接的完整视图。
关联 #
相关性是指搜索结果对搜索者的实用性。Google 有很多方法可以确定相关性。最基本的方法是查找包含与搜索查询相同的关键词的页面。它还会查看互动数据,看看其他人是否认为该结果有用。[ 9]
新鲜 #
新鲜度是与查询相关的排名因素。对于需要新鲜结果的搜索,新鲜度更重要。[9]这就是为什么你会看到“new Netflix series”的热门结果,而不是“how to resolve a rubik’s cube”的原因。

页面速度 #
网页速度是桌面和移动设备上的排名因素。[10][11]但它对排名的影响更多的是负面的,而不是正面的。这是因为它对最慢的页面产生负面影响,而不是对速度极快的页面产生正面影响。你可知道?
您可以在 Ahrefs 中免费检查您的页面速度。
注册一个免费的Ahrefs 网站管理员工具帐户,使用 Ahrefs 的网站审核抓取您的网站,然后转到性能报告。一般来说,红色越少越好。

移动友好性 #
自2019 年谷歌转向移动优先索引以来,移动友好性一直是移动设备和桌面设备上的排名因素。[12]
第 4 部分
搜索引擎如何个性化结果 #
Google 会根据每位用户的情况定制搜索结果。它使用用户的位置、语言和搜索历史等信息来实现这一点。[9]让我们仔细看看这些内容。
地点 #
Google 会使用您的位置来个性化具有本地意图的搜索结果。这就是为什么“意大利餐厅”的所有搜索结果都来自或关于本地餐厅。Google 知道您不太可能为了吃午饭而飞越半个地球。
语言 #
Google 知道向西班牙用户显示英文搜索结果毫无意义。因此,它会向使用不同语言的用户排名本地化版本的内容(如果有)。

搜索历史 #
谷歌会保存你做过的事情和去过的地方,以便为你提供更加个性化的搜索体验。[13]你可以选择不这样做,但大多数人可能不会这样做。
关键要点 #
- 搜索引擎由两个主要部分组成:索引和算法。
- 为了建立索引,它会抓取已知页面并跟踪链接来查找新页面。
- 搜索算法的目的是返回最佳、最相关的结果。
- 搜索结果质量对于建立市场份额至关重要。
- 没有人知道 Google 影响自然搜索结果排名的所有因素。
- 关键排名因素包括反向链接、相关性和新鲜度。
- Google 会根据您的位置、语言和搜索历史记录来个性化其搜索结果。
参考 #
- “了解 JavaScript SEO 基础知识”。谷歌。2022年 8 月 16 日检索。
- “组织信息——谷歌搜索的工作原理”。谷歌。2022年 8 月 16 日检索
- “了解站点地图”。谷歌。检索日期:2022 年 8 月 16 日
- “Googlebot”。谷歌。2022 年 8 月 16 日检索
- “全球搜索引擎市场份额”。Statcounter。2022年 8 月 16 日检索
- “Google Q&A+ #March”。YouTube。2022年 8 月 16日检索
- “90.63% 的内容没有从 Google 获得流量。以及如何成为剩下的 9.37%”。Ahrefs。2020年 1 月 31 日。2022 年 8 月 16 日检索
- “ CloudFlare Radar”。CloudFlare。2022年 8 月 16 日检索
- “搜索结果排名——谷歌搜索的工作原理”。谷歌。2022年 8 月 16 日检索
- “在网页搜索排名中使用网站速度”。谷歌。检索日期:2022 年 8 月 16 日
- “在移动搜索排名中使用页面速度”。谷歌。检索日期:2022 年 8 月 16 日
- “移动优先索引最佳实践”。谷歌。检索日期:2022 年 8 月 16 日
- “查找并控制你的网络和应用活动”。谷歌。2022年 8 月 16 日检索
原文来自:https://ahrefs.com/blog/how-do-search-engines-work/