更新时间:2022-07-01 05:45:39
去年 10 月,Google 透露了几个基于 AI 的新功能,其中包含了段落排名。2021 年 2 月,段落排名算法开始在美国正式上线了。
我认为这是影响深远一个排序算法,因为很多信息型搜索和内容站的排名将受到影响,而且长期来看将对内容生态产生影响。
以上是 Google 原文中的排名算法的示例图
对于具体的搜索词,Google 会返回跟搜索词主题最相关的网页,而有一些大而全的网页虽然包含相关的内容,但因为太全面,整个网页的主题宽泛,反而获取不到排名。
Google 段落排名算法,就是对于这批大而全的网页,只要部分段落内容是跟搜索词匹配,网页的排名会有额外的提升。也即是在排名时,颗粒度将细化到段落。
Google 工程师 Martin Splitt 举了个例子:
Google 会识别出每个网页的主题,比如网页 A 是土豆主题,网页 B 是番茄主题。还有个非常丰富的网页 C,包含了土豆和番茄的内容。这个被判断为蔬菜主题。
在搜索排序时,Google 会找到一批主题跟 Query 匹配的网页。比如当用户搜索土豆时,就返回了土豆主题的网页。
因为 Google 无法理解土豆和蔬菜的关联关系,所以并没有出现蔬菜的排名(即便包含土豆的内容),只会出现土豆的排名。
而通过段落算法,Google能识别出这个网页是蔬菜主题,但其中一部分是讲土豆的。因此会把这部分段落内容拿出来,参与到土豆的排名中。
我花了个简单的图:
Google 在 Twitter 宣布:段落排名算法已经于 2021/2/11 在美国+英语范围内上线,后续将在英语的其他地区、其他语言和地区上线。
注:后续上线情况将在博客和公众号保持更新。
上图是 Sensor 的排名监控情况,能看出段落算法上线时排名有明显变化
Google 称,整体上段落排名算法会对 7% 的搜索产生影响。更具体的影响有以下几个方面:
上图是搜索引擎的简单模型,本次段落算法主要影响索引检索器这个部分,不影响索引构建部分
有人会问,Google是否将网页打散为段落,改为段落去索引,然后去排名。
Google 的回应是,并没有对段落单独索引,仍是以网页维度索引和排名。不过段落内容会作为附加的排名因素。
也就是说,Google 主要是做加法,在之前索引和排序的基础上,如果有个网页的段落内容命中了 query,在排名上会有提升。
Google 的建议仍是不需要做什么针对性的改动。只是 Google 可以更好的理解网页的内容,并且可以针对网页的不同部分内容进行打分。
我的建议也是,对于 SEO 编辑来讲,以后可以更专注于内容的生产,不用刻意的对内容进行分割。
怎么才能主动命中段落算法呢?比如文本内容多长才是段落?
Martin Splitt 说这个算法依赖算法和机器学习,所以一直在调整,并没有固定的长度,可能是几个词,也可能是一句话。
另外,能否退出这个段落算法?
答案是否定的。这个排名是搜索结果中的自然排名,并不是插入的排名(Martin Splitt 的原话是,这个是 SERP 的蓝色链接),所以无法退出。