详解推荐链路中的「召回」「粗排」「精排」的含义

互联网 2023-04-06 18:20:07

今天给大家普及一下详解推荐链路中的「召回」「粗排」「精排」的含义相关知识,最近很多在问详解推荐链路中的「召回」「粗排」「精排」的含义,希望能帮助到您。

大家好,我是聊广告的照叔。

本篇文章给大家讲一下在广告推荐链路中会有哪些关键的节点,以及各自都是什么含义。废话不多说,我们直接进入干货环节。

召回

召回是广告投放链路的主要环节,一般是针对某次请求来说,把符合基本条件的广告放在候选队列。那什么叫不符合基本条件呢,例如广告预算不够,或者广告素材类型不支持某种场景等等。

常见的有效做法是根据对业务的理解,增加不同的召回通路。举个例子,比如我清楚地知道新激活用户对于游戏类的广告更感兴趣,那就要在召回的环节对于游戏类广告进行加权。

定向

一般是指广告主可选的投放范围,常见的包括时间定向(什么时候可以投放,下同)、地域定向、性别定向、年龄定向、人群定向(某类特定人群,例如高收入群体/某些机型群体等等)、人群包定向(将一部分符合条件的用户打包起来,只对这部分用户投放)、重定向(针对已经转化的用户进行投放)等。

基本定向不满足要求的广告主,其广告也不会出现在候选集里面。

召回和定向环节,基本可以把千万甚至以亿为单位的候选集缩小到几万的量级,这对于检索效率和服务器成本有很大的好处。

粗排

顾名思义,根据广告基本信息进行粗略的排序,目的是在节省广告资源的情况尽可能估得准。这个时候由于候选集仍有几万的量级,所以节省性能的重要性甚至会大于估得准这一点。

一般来说从性能的角度考虑的话,对于内容型产品在粗排的推荐,更多是基于对内容本身的打分,而不会考虑和用户特征和内容的匹配性。简单说就是只要这个内容本身的质量高,就会排在前面,至于这个特定的用户喜不喜欢则不考虑。

而对于广告来说,则是把后验转化效果好的广告排在前面。那有同学要问了,如果是新创意,没有后验数据怎么呢?那就「往上找」,这个创意没有后验数据,这个广告账户,这个广告主,甚至这个行业总有后验数据吧?当然了,实际操作中,也会将部分新创意接住精排阶段的模型来预估,来尽可能保证粗排阶段的重要性。

粗排过滤完之后,留给精排的结果就只有几百的量级了。

精排

由于在此环节只有几百的量级,所以能根据能拿到的全部信息进行精确的排序,这个时候预估的精准度就是第一优先级了。

对于内容推荐来说,在精排就需要考虑特定的用户到底喜欢什么了,这个时候成千上万的用户特征和偏好就会加到模型里面,和内容本身的特征进行运算处理。

对于广告来说,则需要计算广告的cpm到底会是多少,然后进行从高到低的排序。当然,有些时候除了计算本身的cpm之外,也会考虑其他的一些情况,从而在cpm之外增加一个因子。

精排阶段常见的策略干预包括以下几种:

1.提权/打压。对于优质或者平台需要额外扶持的广告进行提权,例如在双十一期间,平台通常会对电商类广告主进行额外的提权。同理,对于一些负向的广告主,例如高危的医疗类广告主会进行一些打压。

2.过滤和去重。对于某些非常相似的广告,需要进行去重的操作;若某种类型的广告用户之前明确表示过反感,这个时候也需要进行过滤的操作。

3.打散保证多样性。多样性对于平台长期的生态来说非常重要,这是短期的收入无法体现出来的,所以会有一些策略干预来保证候选的内容具备一定的多样性。

4.强插。会有一些运营的规则来保证强插,比如优先出保量的品牌广告。

在精排阶段胜出的就是候选集一般就是个位数了。

混排或重排

有的平台在精排胜出之后,还会加一个排序环节,就是将广告和内容统一成一个量纲进行一次排序。关于混排的内容照叔在之前的文章已经讲过,感兴趣的朋友可以翻看往期内容,这里就不再赘述。

好了,关于广告推荐链路的讲解就为大家讲到这里,感兴趣的朋友可以私信或者评论交流,我们下篇文章再见~