电商的推荐算法「淘宝商品推荐的基础算法」

互联网 2023-03-04 13:14:02

今天给大家普及一下电商的推荐算法「淘宝商品推荐的基础算法」相关知识,最近很多在问电商的推荐算法「淘宝商品推荐的基础算法」,希望能帮助到您。

明天就是国庆 中秋,做过电商的朋友们都知道,国庆一过,就要紧锣密鼓地准备着双十一的布局。

无论淘宝、京东、还是拼多多,一个也不能少,都需要进行精心的产品选择和运营策划。

一个收获丰盛的双十一,对电商来说,有时能达到一年收入的三分之一,如何选对产品和活动,非常重要。

大家一起来抢钱

因为做过一段时间的电商平台开发,所以我打算从算法的角度给广大电商和买家给一些建议。

这次我们一起分享用户画像、推荐算法和选品模型的知识。

电商平台如何进行用户画像

推荐算法的目标是用户,那么对于用户进行画像特别重要。

画像就是画心,有句俗话说“最易变却故人心”,说的就是人心易变。

所以人心是一个模糊的三维实体,不同的场景,不同的时间想法都不一样,并容易捉摸。

用户画像摸拟

电商平台用户上亿,由于海量用户的行为、习惯数量巨大,同时进行分析和推荐是一个海量的运算工作。

因此,为了更好地分析用户的想法,我们采取结构化的方式,所谓结构化就是通过特征化的标签,对用户的某个细分领域的行为进行识别和了解。

通过结构化的方式,降低了计算精度,使用户画像成为可行。

用户画像结构化一般分为4个步骤:

原始数据的采集:在电商平台后端建立强大的用户数据采集系统,在各个环节打点,采集行为,比如注册页面、浏览商品、加入购物框,点击购买,收货评价等。

通过电商平台详细的采集过程,一个用户在平台上的各种行为都会记入原始数据库,有些平台还会顺手抓取你的系统文件以及画片库的内容进行外部因素分析。

数据采集

原始数据的分析和标签化:通过事先定义好的特征提取算法,对每个客户建立静态画像和动态画像

静态画像指的是每个用户的自然属性,如男女,高矮、学历等。

动态画像指的是用户在平台中的各类行为,如点赞、评论、拉黑、投诉等。

模型聚类并加权:因为用户数量巨大,象淘宝平台就有5亿用户,很难对每个用户都进行个性分析和建档,这样运算工作量也大。

可以根据不同的场景需要和行为模式,按照不同的维度,将多个用户汇聚成一类,一个用户也可以加入多个聚类,类似社群概念。

内容和场景训练及调参:当标签和聚类做好之后,我们可能会针对不同类别的客户进行推荐,或者多向推荐。

但是这种推荐不能依靠主观配置,而是通过机器学习算法进行训练学习,以获理更为精确的模型。

所谓机器学习,就是根据某一类,或者多个类别之前的标签-》场景-》行为模式,定义这类用户后续遇到同样场景,大概率会采取哪一类的运作。电商平台的下单率和单位订单金额就是最重要的行为模式。

通过4个步骤的采集-》分析-》聚类-》训练,电商平台获得了一套基本的电商推荐先验模型。

在实际的推荐购买流程中,还会加入实际的后验数据,对模型进行进一步的优化调整,以接近最终结果。

理解电商平台的推荐算法

推荐算法是电商平台最重要的人工智能算法,通过对大数据的分析和训练之后,产生针对单个用户的推荐结果。

由于上面说过的原理,人的心情容易受到时间空间的景响,所以,推荐的算法也需要不停地改进和调优。

商品推荐

一般来说电商的推荐算法,在实际运营时,会有这么几个步骤:

召回策略:所谓的召回策略,就是一种较为强大的后验训练机制。

当双11活动举行时,淘宝平台已经按照系统内置的模型进行了排序和分发。

但是过了一段时间,为了提高效率,需要对当前实施的策略以及实际效果进行一次检验,进而对模型进行调参优化,以便更好地提升推荐的精度和广度。

由于用户和行为数据较大,很难全部召回,所以重要会考察几个类别或产品的样本数据,通过对样本进行抽样分析,来得出适合于大数据的策略调优。

精细排序策略:阿里这几年一直在推广千人千面,所谓的千人千面,其实质就是精细化排序策略。

这种策略,不仅仅依靠一个或几个聚类标签进行商品推荐,而且还会参照用户在不同的时间点,不同场合的行为进行分析,比如根据用户之前的行为,推荐相似性的商品。

混合排序策略:同时在分析时,平台还会组合多个不同维度的数据进行综合分析,混合排序。

比如根据用户的点击率,推测用户对列表每一个商品的点击率,这里应用了不少机器学习的分类模型算法,对人以及人的活动进行进一步的细化,不断对模型进行训练和改进以优化推荐效果。

运营优先策略:另外,在运营中,淘宝也经常会采取一些运营活动,比如钻展,比如直通车,比如双11 会展等。

这些活动因为是付了费的,所以往往也需要进行综合分析,判断一个商家的投入广告经费和实际收入的比例,如果广告费过大,可能就会做一些人为的调整,让运营推荐策略优先于之前所说的排序策略,以便让广告主看到实利。

优惠券活动

可以说,目前的电商平台双11活动,不仅是卖家的狂欢,也是平台数学家以及大量的草根数学家的盛宴,双方都在全力分析投入和产出的比例,力争用最有效的投入获得最好的资源,以及推广效果。

人工智能在商品推荐中发挥出越来越明显的作用。

卖家选品模型

最后我们来聊一下选品模型,目前无论是卖家还是平台,都格外注意活动中的选品,不同的选品方案和报价方案,往往会带来不一样的效果和利润。

关于双11选品和定价的方法和模型很多,我就不一一举例,这里给大家介绍一种最常用到的,利用Excle表格自带的数学模型计算方式来计算你的双11商品类别、数量和利润。

Excel数据模型计算

上图就是Excle中常用的数学模型方法,如果你在淘宝双11钻展中,准备发布多个商品,已知它们的单个利润和成本,如何安排上架才能让你的利润最大化呢。

打开Excle表格,你可以在里面建立3个区域,左上方是你计划推出的商品和数量,注意这个数量是可变项;中间是你的参数,输入每件需要的成本,计算每类商品成本和总成本;下方是你的各类别利润以及总利润;将焦点移到总利润的位置,打开Excle菜单上的数据-》数据分析-》规则求解,弹出上图的对话框规则求解参数;设置目标为希望总利润最大,在下方输入限制条件,依次是采购成本<现金总额;连衣裙最多500,长统袜最多100个,点击确认;系统就会输出最优备货的长统袜和连衣裙的数量。

当然这个销售数量的限制需要有一定的经验,你也可以输入其它一些必要的参数进行计算,比如供货周期,物流最大流量等。

通过这么一个简单的工具,恭喜你,马上就可以将数学模型用到了淘宝上盈利。

复盘和总结

通过以上的描述和学习,我们学习了用户画像分析、商品推荐算法以及卖家的选品模型建立,对电商平台中的人工智能应用和效果有了一定的了解。

电商平台用户画像和推荐流程

我们也了解到平台的推荐流程包括了用户数据采集-》结构化标签-》聚类调参-》商品推荐-》精细化排序、混合反序以及运营反序-》推荐效果-》数据召回重训练等核心模块。

随着人工智能的进一步发展,电商平台的数据化、智能化已经是不可逆转的趋势,哪个商家离数字更近一步,他就更可能拿到成功的钥匙和黄金。

芝麻开门吧

芝麻芝麻开门吧!

祝愿每一位看到我的读者在双11中卖得更欢,买得更爽。

我是一非,一名专业的产品经理,我用科学解析各类场景,科学的尽头是世界的真理,谢谢观看。