搜索电商怎么运营「聚焦爬虫爬取网页的流程」
今天给大家普及一下搜索电商怎么运营「聚焦爬虫爬取网页的流程」相关知识,最近很多在问搜索电商怎么运营「聚焦爬虫爬取网页的流程」,希望能帮助到您。
上一章,大家应该对索引和排序有了初步的了解,本章就继续挖掘一下与这两者息息相关的要素,商品目录(或者叫分类,列表)以及商品标题。同时我们也和大家分享一些站内搜索运营的一些逻辑要点和数据指标。
目录商品目录好比超市的货架、图书馆里的藏书分类,我们去图书馆借书,一般都会去看看藏书的分类,是属于社会类、还是科技类、小说类型还是教辅类。我们都会在对应的分类区域找到自己想要的书籍。
同样,商品目录也是这个作用,它是搜索的物料基础与根基。没有目录作为基础,电商的站内搜索可以说像是一盘散沙,无从做起。
以上说的这些都是铺垫,旨在让读者你能对目录的重要性重视起来。
目录分为前端目录和后端目录。前端目录是展示给消费者看的,后端目录是给供应商和自己看的,前后端目录之间的关系是映射与被映射的关系。
什么意思?
其实前端目录其实就是个空壳子,我们只是给它起了个名字,后端类目才是背后的老板,后端类目将自己的商品信息集合映射到前端,这样前端就有了我们在网站上看到的目录的样子,还是这张图所示:这就是前端类目的样子。
有的读者可能会问(当然没问就当我没说)弄一个类目不就好了么,节省人力方便维护啊。为什么非得弄两个类目这样不累么。
其实,之所以要设置前后端两个类目的原因还是从商家和消费者的角度认知不同导致的。
商家/供应商认知的商品信息往往比我们更加“专业”,所谓专业就是我们作为消费者可能看不懂。而且分类更加细分,小到服装类型,大到房屋布局可能在大型电商网站的后端类目是一个超级商品词典都不为过。
鉴于以上我说的比较虚,那么还是给大家上图可能领会的更加真切一点。拿女士手链举例,一般消费者看类目只会看女士手链,而后台的商品则能仅仅以女士手链这一个维度来分类,这样更加便于商品的维护与整理。往往一个前端类目会有一个或者多个后端类目映射而来,而这个前端类目则是后端类目的代言人。
从维护的便捷性而言,后端类目分的足够清晰和细分,与消费者展示层的前端类目之间有着映射这么一层关系,因此有时在进行后端类目增删改查的操作时,对前端呈现的影响是比较小的。而且一旦后端类目确认之后一般是很少进行删改的(除了新增外),所以稳定性更强。
前端类目由于是对客展示的需要,类目运营会适时对前端类目的层级关系,名称等进行调整,以便于更加精细化的运营。此时只需要对映射关系变动即可。所以就操作和维护成本来说,电商网站维护两个目录确实是有必要且更加便捷省力的。
商家通过电商的后台系统上传自己的商品到数据库中,包含标题、图片、属性等信息,其中最重要的是要在系统中选择自己商品所在的类目。如果此时你选择错误,要是在淘宝会直接予以屏蔽。
类目集合了商品集合的共有参数和信息,也是排序第一步的重要素材。比如我们熟悉的高级筛选项,在搜索裙子,系统会给到尺码,颜色,款型给你选择,这些信息也是类目带来的,同时也是搜索索引的基本面,如下图所示:筛选项下方的细分图片类目也是前端分类的一部分,也是我在第一个章节说的范词搜索时搜索结果页的顶部图片分类选项。便于用户快速定位自己想要的类目,提升详情页转化率。
有一点需要注意的是,在app中所有呈现给消费者的类目信息全部为前端类目,后端类目消费者是看不到摸不着的。
标题说完了目录,我们讲一讲商品的标题,在搜索抓取查询一开始会有一个排序叫初排,也叫初步的排序。就是根据商品的各种文字信息集合并经过初步的计算的一个排序,其理论依据是商品最直观的信息重要性计算规则(听不明白就对了,我瞎起的)。
用人话讲就是哪些位置的文本信息是最能描述商品面貌的且与搜索词想匹配的,初排排序得分就越高。因此我们一步步推敲:
首先类目信息准确是最基本的吧,也叫入门级,试想一下你将裙子商品挂在电脑类目里会怎样呢,肯定是让你排序的资格都不会有。因此类目准确是是否能够排序的先决条件。
其次就是最重要权重最高的商品标题,一般而言国内的商家特别重视商品标题的编写,往往采用关键词叠加的方式来实现,这种做法好处就是能增加曝光,坏处就是句子不通顺可能引起用户反感。当然一般用户不会太在意商品标题的,他们更加在意的是商品主图是否和他们搜索的意图一致。但是搜索则不同,搜索索引是个没有感情的机器,当你的标题里包含关键词,就召回-也就是能被搜索到。
商品标题的编写要有一定的格式和技巧,整体而言一句话:信息全,句子通顺,突出卖点,适当叠加关键词。
还有一句话,别滥用关键词。比如你本来就是杂牌手机,结果你在标题上加了一个iPhone。此种行为很有可能被电商自家的小二给下架或者扣保证金等。
我们以华为p30 pro手机为例,如果是我则会这么写:
华为 品牌英文p30 pro (型号) 颜色 内存 运存 制式(移动,联通,电信 或者三网通4g)4800万像素莱卡三摄 安卓智能手机
那么我们来看下华为在京东的旗舰店是怎么命名的。(事先声明,上面的绝对不是照抄京东的,我在截图之前就没有正经看过京东华为p30的标题)
通过对比我们发现我的标题,和华为小二维护的标题是有部分一致的,但是侧重点不一样。我主要是侧重于其相机的描述,京东多了一样“处理器和屏下指纹”(当然这与我不了解p30 pro的卖点有关)。
这个例子我其实是想说明的问题是:
标题要突出商品的卖点,同时要兼顾常规的描述,适当的叠加同类型的关键词。一般关键词命名都会有一个词库供参考,淘宝有淘宝指数,之前是免费,现在集成在营销工具数据魔方里面(当然现在可能有变动)。京东面向商户的培训网页或者后台网页应该也有对应的词库数据,哪些词的热度高,哪些是长尾词等等。这些词库可以作为标题选词的参考。
除了商品标题之外,还有属性、标签、描述信息也是索引抓取的范围,但是如果用来做排序权重可能没有那么高了。一般而言计初排计算规则从左到右权重逐步递减:
标题*属性(参数)*描述*标签。
不过有些电商可能已经摒弃了初排,由于算法比较靠得住,将初排融入到商品排序中去了。
搜索运营的逻辑以及数据指标搜索运营的逻辑我已经不止在一篇文章里写到了,这里还是老生常谈的给大家简要地啰嗦一下:
以详情页转化为最终指标,将进入到搜索结果页的用户通过各种方法让其点击,且多点击商品,使其能进入到商品详情页。进而形成订单gmv。
其实说白了,搜索运营的重中之重就是运营搜索结果页,让用户留在该页面,减少跳失这才是关键。至于如何运营搜索结果页,我将在后面的章节中专门抽调一章来详细讲解。不要慌!
数据指标方面:我们关注的维度包含如图所示:
这个是我精简之后的数据描述。其实我还有更加变态的数据维度,是我在苏宁易购期间的数据维度,版本比较老了,你们凑活看吧!
以上就是本章的内容,今天就到这吧,佛系结尾!
预告下一期内容:搜索结果页该如何运营才能实现转化最大化。
#专栏作家#作者:王欢,微信:wanghuan314400,运营小灰一枚。
本文由 @王欢 原创发布于人人都是产品经理,未经许可,不得转载。
题图来自Unsplash,基于CC0协议