搜查系统中容易存在头部效应,中长尾的优质商品较难取得充沛的展现时机,如何废弃系统的马太效应,优化展现结果的丰盛性与多样性,助力中长尾商品生长是电商平台搜查系统的一个关键课题。其中,搜查EE系统在坚持排序结果基本稳固的基础上,经过将优质中长尾商品交叉至排序结果中将优质商品灵活展现给用户,优化用户体验与搜查结果丰盛性,是废弃马太效应的一大助力。
本文将从搜查EE近期的全量迭代登程,展现其链路演进的全体头绪,蕴含:EE自顺应灵活探测模型——EE场景建模形式更新——打分与交叉两阶段分歧性更新——探测与人造流量全局联动优化四个阶段,梳理对搜查EE的思索与下一步迭代方向。
一、EE自顺应灵活探测模型
传统EE模型从商品曝光置信度、打分置信度等角度登程,决策EE商品的展现位置以及交叉位置,较少从用户阅读用意与探求志愿的差异化角度,来考量探测力度。其或者造成用户在普遍阅读与筛选商品时,缺少丰盛的商品选择,在决策购置时反而交叉了探求商品的误判情形,影响用户的搜查体验,不能充散施展搜查EE系统的探求和应用(Explore & Exploit)两大才干。
针对以上探测错配状况,可尝试在EE模型中显式建模用户的“逛”、“买”探求偏好,进一步联合偏好,自顺应调整搜查EE的应用与探求力度。关于偏“逛”用户增强EE探求力度,提供更丰盛的探求展现;关于购置志愿清楚的用户,提供更间接的购置选择。经过对用户探求偏好的显式建模,能够在优化用户的转化效率的同时优化搜查结果丰盛性。
相较于原有EE模型,自顺应探求对EE模型的自顺应探求才干启动了更新,关键体如今如下三点:(1)对用户探求偏好启动差异化建模:"逛" "买"用户提供灵活差异化探测力度,在转化效率和搜查丰盛性中取得平衡。(2)以用户阅读深度为子义务建模到EE模型中:以阅读深度作为用户志愿的关键目的,并建模到EE模型中,显式增强模型对用户阅读志愿的感知。(3)优化模型对探求性特色应用性:对探求偏好的显式建模,优化探求性特色在模型中的学习权重,在EE环节中对探求特色启动充沛应用。
为了增强EE模型的自顺应探求才干,针对原有EE模型启动如下更新:
(1)探求偏好网络Explore-Net
在坚持原有的EE模型主网络Exploit-Net基础上,参与了探求偏好网络Explore-Net(图中左下绿色局部),优化模型对用户探求用意的差异化建模。
思索到用户的探求用意只与团体特性、搜查词相关,因此Explore-Net的输入特色仅经常使用用户侧、Query侧中相关特色。
为进一步度量特色与探求偏好的关联性,统计不同阅读深度下各特色的散布差异,剔除了未与阅读深度清楚相关特色,如搜查词长度等,精简特色空间优化预估精度。
EE原模型的输入中蕴含探求性特色,但在启动搜查排序义务中易被其他特色掩盖造成应用率不强,在探求偏好建模中显式构建了探求偏好网络Explore-Net,对用户探求用意启动独立建模构建,增强探求性特色的关键性。
优化后的EE模型具有Exploit-Net与Explore-Net双塔结构,Exploit-Net对商品启动精准化打分,对候选商品启动充沛应用;Explore-Net对用户探求志愿启动建模,依据用户偏好灵活调整探求力度,独特构成商品探求与应用的完零件制。
(2)用户阅读深度回归义务构建
在原有的训练环节基础上,参与了用户阅读深度回归义务(图中左上白色局部),优化模型对用户阅读志愿的感知性,增强EE模型的自顺应探求才干。
阅读深度作为用户阅读志愿的直观表现,表现了用户的探求志愿,因此经常使用阅读深度预估义务作为模型训练的辅佐义务,对用户偏好启动显式建模。
在辅佐义务类型的考量上,综合思索了将阅读深度划分不同区间启动预测的分类义务,以及对阅读深度的回归义务。在试验中分类义务表现出较为清楚的头尾偏向性,输入值散布不平均,通常中最终选择了回归义务作为辅佐义务。
在样本数据剖析中,发现用户的阅读深度差异化极大。为了平衡阅读深度的差异,保证模型输入值的平均性与差同性,对阅读深度标签启动了log平滑放缩,并选择RMSE-loss作为辅佐义务的损失函数对阅读深度义务启动构建。
在模型训练中头尾样本相对较少,对过浅和过深的两类样本预测准确性偏低。为平衡样本间差异,在损失函数的样本权重设计中,对由浅到深相应样本,其权重为先减小后增大的 “凹形”权重,平衡头尾和腰部样本的准确性。
(3)Explore-Net与主网络的二次融合
Explore-Net 和 Exploit-Net 启动了融合(图中中上白色局部),增强模型全体对探求性特色的应用,优化EE隐层embedding丰盛性,对探求偏好较强的用户优化了不确定性打分,优化探求商品的范畴和丰盛度。
因为在用户阅读深度回归义务上对用户的探求偏好启动了显式建模,Explore-Net的输入embedding对探求性特色启动了高维抽取,能够对用户偏好启动自顺应建模。
为让探求偏好特色更好地介入到全体义务训练中,平衡打分的精准性与差异化,将Explore-Net的深层表征与Exploit-Net的深层表征启动拼接融合,优化EE模型隐层embedding的丰盛性和表征才干,优化模型打分才干。
用户的探求偏好与商品的不确定性预估有间接的相关关联。关于探求用意较强的用户,优化商品打分的不确定性,助力更丰盛的商品交叉到搜查结果中,反之亦如此。因此在不确定性预估模块中,设计在探求表征层面启动融合。
在不确定性预估(SVGP)模块中,将阅读深度回归网络输入值与方差预估局部启动了二次融合,关于探求偏好较强的用户,显式强化了商品不确定性打分,优化探求力度。
(1)探求应用成果剖析
在相反的预测集上,统计了平均打分探测力度随阅读深度变动状况
相比原模型,自顺应探求模型的平均探测力度,随阅读深度增大而逐渐增大,表现出session维度的清楚差异化。
②EE试验位下交叉商层次置剖析:
在各试验位下,统计平均插上天位与阅读深度的变动状况。
论断: Test桶结果,随着阅读深度增大,商品的平均插上天位相比原模型有所前移,探求力度增强。
经过以上对探求应用的成果剖析,自顺应探求模型合乎设计预期,在阅读深度较低的session下拔出商品较少,探求力度较弱;在阅读深度较深的session下,EE模型的探求志愿更强,模型探求力度更大,交叉商层次置有所前移。
坚持搜查效率持平的状况下,EE**目的优化清楚并全量上线,流动性、探求成功率优化近 0.5%。
商品建模形式思索:
差异化建模用户探求用意后,EE模块成功了对不同用户自顺应调整探求并取得了必定收益。用户侧建模形式优化后,对商品侧建模形式启动更新变革,将是进一步优化EE探测模型的正当切入点。
二、EE场景建模形式更新
原主网络建模形式为点击率单义务,点击作为转化的前置行为,建模点击行为成功对后劲中长尾的探求助力。同时在通常中,经过样本label进执行态权重调整,隐式建模转化属性,统筹转化效率。
仅建模点击对高转化属性商品并不友好,同时是对题目党行为的潜在激励,和EE模块优化全体生态环境、打造搜查常年价值的初衷有所偏向。因此更新思绪不再局限于仅关注曝光后取得点击这一前置链路行为,而是对全体转化链路启动建模,关注商品的多维度属性。
在原有基础上引入转化行为的显式建模义务,将主网络结构从点击单义务更新为点击转化多义务,以多义务形式增强不同行为的建模品质,成功对商品的更片面、更准确建模。
在EE自顺应探求机制基础上,EE场景建模形式更新对原有模型启动了如下优化与更新:
(1)SVGP模块交互打算设计
原模型中主网络和辅佐模块在SVGP模块中交互,新版打算中辅佐义务能否须要与SVGP模块启动交互? 即随机高斯环节能否须要雷同作用于建模转化义务,是打算设计首要思索的疑问。
详细试验中,发现SVGP会造成收敛后AUC目的在千分位级别降低,即其在引入不确定性性能的同时,会细微降低模型成果。思索到目前SVGP模块已带来所需的探求才干,难以经过多SVGP重叠形式带来收益。因此更新打算选择将辅佐义务构建成污浊义务,其仅建模商品属性而不构建对应的SVGP模块。
(2)多义务网络框架成功
EE探测线上耗时较低,建模形式更新后需间断这一目的。只管干流多义务结构MMOE性能更为优越,但线上耗时将有参与危险,因此选择更轻量级的share bottom形式,在基本不参与线上耗时的状况下成功多义务建模。更新打算把多义务被设计为双义务模型,经常使用低层网络启动表征抽取,在高层维度经常使用两个tower区分建模主义务和辅佐义务。
选择双义务为ctr义务+ctcvr义务,思索到点击样本比订单样本更丰盛, ctr正样本更多,关于须要少量疏导点的SVGP模块更为友好。同时点击相对购置行为的不确定性更高,在点击预测上引入不确定性打分更为正当,因此将ctr作为主义务、ctcvr为辅佐义务启动性能。
前述迭代环节中模型结构如图两边所示,低层网络编码输入消息后经常使用两个浅层tower区分学习不同义务, 该结构潜在缺陷为一方面或者造成低层网络梯度被某个义务主导(例如ctr义务),另一方面下层tower过浅或者造成义务学习不够充沛。
进一步探求仅共享特色、参与义务tower深度的网络结构。在多义务分数融合形式相反的状况下,新结构线上表现更佳,因此最终结构如上图最右所示,经常使用较深的tower head建模各自义务,彼此间仅共享特色。
上述模型在离线目的上取得了不错的收益且线上表现更优,但遇到了大盘效率和EE相关目的不可同时优化的疑问。剖析梳理现有打算试验后,以为目前多义务融合形式相对豪华、存在改善优化空间。
选取带权相加、间接相乘和幂次指数相乘三种形式。因为缺乏适宜的通常量化剖析工具,因此选择从试验结果登程选取最优融合形式和融合系数,为此开发了离线融合寻参模块,将predict时各head打分结果保留后,经过网格搜查形式选取最优参数。
经过在多组数据上遍历寻优确定不同融合形式的最优系数,并基于此展开线上试验选取表现最优形式,最终咱们选取带权相加形式,在EE目的优化的同时坚持大盘效率目的持平。
(1)模型建模更新成果剖析
在相反的预测集上,统计了离线打扩散布状况
散布由橙色线条(原版)变为蓝色线条(更新后版本),全体愈加陡峭,保证不同商品彼此更具有区分度。
统计线上打扩散布状况,对线上探测状况启动剖析
论断: 横轴为曝光数量大于等于N,纵轴为distinct sku数量,下图标明模型更新后在仅探求一次性的dst sku数量上有所降低,缩小偏随机的一次性性探测,但在屡次探求商品上有所优化,标明test更偏向于探求中腰部商品。
(2)线上成果
搜查效率持平状况下,流动性目的、探求成功率优化清楚并全量上线。
链路分歧性思索:
E打分模型优化后,能够必定水平成功探求力度随用户探求志愿的灵活调整。但从全体EE链路上看 (候选集生成 → EE打分 → 灵活展现),EE灵活交叉决策与打分阶段相互独立,其结果由一个xgb回归模型选择,两个阶段的联动相关和分歧性水平弱。如何追随用户阅读志愿,将 EE打分→ 灵活展现 两个环节能够同步、分歧性地调整,是进一步的优化方向。
三、打分与交叉端到端分歧性更新
打分与交叉展现两个阶段分歧性未能对齐,或者造成保守的模型打分不可婚配上丰盛的交叉展现,不可同步加大EE的探测成果。此外,两个阶段区分由两个模型独立控制,也参与了保养和迭代老本。
面对此分歧性疑问,更新了端到端打分与交叉打算。EE模型中建模的用户阅读用意,不只影响EE探测的力度大小,也同时选择灵活交叉展现的战略强弱。两阶段的决策环节端到端成功,将流量启动更正当调配,普遍用意的用户能够到达探测更保守、交叉更多的共振。
1、端到端灵活交叉机制优化点
端到端灵活交叉机制在原有自顺应探求基础上,更新点关键体如今如下三点:
(1)阅读深度预估精准度更新: 在EE探求偏好建模网络Explore-net基础上,优化阅读深度预测精准度。
依据session阅读深度散布,灵活调配各深度下交叉商品量,优化EE交叉商品占比调控可操作性。
(3)模型打分与灵活交叉数量端到端分歧性增强: 驳回EE主模型的阅读深度,映射获取session下交叉商品数量,端到端处置EE交叉商品数量与EE商品打分两个义务,优化两阶段分歧性。
2、打算通常
在EE自顺应探求机制基础上,端到端灵活交叉机制对原有灵活交叉机制启动了如下优化与更新:
(1)灵活交叉机制端到端建模
①阅读深度预估义务优化
阅读深度代表了用户在session下的阅读志愿,是EE流量启动正当调配的基础性目的。在不同阅读深度的session下,婚配适宜数量的EE商品能在保证效率的前提下优化搜查结果丰盛性。
进一步优化了自顺应探求模型中Explore-Net对阅读深度预估子义务的准确性,对其输入的阅读深度预估值启动评价,其准度清楚高于原有xgb模型,可以对原有xgb模型启动交流。
②端到端建模阅读深度与模型打分
自顺应探求试验中经常使用Explore-Net对模型打分启动差异化探求,其中的阅读深度预估义务可以沿用到交叉商品数量义务中,使模型具有端到端建模两个子义务的才干。
(2)正当设计阅读深度与交叉商品数量映射
在准确预估阅读深度的状况下,经过将阅读深度预估值映射到交叉数量中,保证交叉数量与模型打分分歧性,在更深的session下有更多的商品交叉数量和更强的探测力度。
3、更新成果
(1)灵活交叉成果剖析
①阅读深度预测准度剖析:
对比两模型的阅读深度预估准确性,经常使用均方根对数误差(Root Mean Squared Logarithmic Error, RMSLE)目的启动权衡
在雷同的验证集下,Explore-net模型的预估精度清楚优于原模型。
②探求打分、灵活交叉分歧性成果剖析:
审核各阅读深度下base与test两个机制下各阅读深度下预设的拔出商品曲线和交叉商品数量散布图。
(2)线上成果
搜查效率持平状况下,EE**目的有必定优化并全量上线。
流量全体联动优化思索:
在对EE流量启动全体优化后,商品探求力度与EE流量调配能够随用户阅读志愿启动自顺应调整,但从全局商品展现结果中看,EE探测流量与人造流量相互独立,两者之间并未树立充沛的联动与联合。
将视角逐渐放宽到整个排序链路,如何做好EE流量与人造流量的联动,施展EE在搜查排序链路后置位的长处充沛补充与优化人造流量是下一个关心的疑问。
四、感知高低文的品牌店铺维度探测
在搜查链路中,EE处于相对后置的位置,但是原EE系统未充沛应用这一感知长处,对前序排序结果感知才干较弱。在一些强势品牌、店铺主导的关键词下,存在头部品牌、店铺扎堆现象,优质新品、中长尾商品不可显露,马太效应清楚。
对此疑问,尝试跳出仅思索商品维度探测的局限,从更高的品牌、店铺维度视角,对排序结果启动全局性联动优化,树立感知高低文的多维度探测才干。其设计旨在增强对高低文排序结果的感知才干,并在人造流量中对商品散布启动联动优化,系统性缓解排序链路的马太效应。
1、感知高低文的多维度探测机制优化点
感知高低文的多维度探测机制在原有EE探测才干基础上,启动了如下三个方面的优化:
(1)新增EE探测系统对高低文感知才干: 对EE前的排序高低文结果启动充沛的感知,对人造流量下原有搜查排序结果启动自顺应的交叉优化。
除了现有允许的商品粒度探测,从更微观的品牌、店铺等维度视角对排序生态启动优化。
(3)EE流量与人造流量联动全局性优化: 缓解局部词下头部品牌和店铺扎堆现象,优化排序多样性,防止对头部品牌、店铺商品启动更多探测、加剧马太效应。
本次更新在原有的搜查EE交叉机制下启动了如下才干的增强与优化:
(1)新增高低文感知才干
在原有搜查EE交叉机制基础上,新参与高低文感知才干,对搜查词属性和高低文排序结果的商品散布启动计算,指点后续的交叉环节
为保证搜查排序结果正当性,防止发生体验性疑问,感知高低文才干将判别query词能否是品牌词(如:华为)或型号词(如:iphone),选择能否开启品牌维度探测;判别query词能否是精准店铺词,选择能否开启店铺维度探测。
新增高低文排序结果感知才干,经过统计上链路搜查结果排名前k的商品中的品牌和店铺的散布状况,判别能否存在品牌或店铺的集中现象,进而选择能否开启多维度探测才干。
(2)优化原有交叉机制
在感知才干作为多维度探测启动开关基础上,优化了原有的交叉机制,经过EE展现成果与人造流量结果联动优化搜查结果丰盛性与多样性,对搜查结果启动间接高效的影响。
①由感知才干模块判别用户搜查用意和商品散布,选择能否启动多维度探测
对用户搜查用意间接的搜查词灵活开启多维度探测性能,如query为品牌词或型号词则不应启动品牌维度探测,如query为店铺词则不启动店铺维度探测,防止影响搜查结果的准确性。考量搜查结果的前k个商品的品牌/店铺散布,判别能否存在头部品牌/店铺扎堆的疑问,当同一品牌/店铺下商品占比超越p%后,不再拔出该类型EE商品。
如不再拔出该类型EE商品,在候选商品中剔除该类型,其他商品依照EE打分结果拔出到排序结果中,不影响EE交叉环节与交叉数量,保证EE交叉位置和展现成果正当性。
3、更新成果
(1)多维度探测成果剖析
在EE交叉环节中,因为局部EE模型打分较高的头部品牌/店铺的商品在EE候选商品中被剔除,残余商品模型打分稍低造成交叉位置出现后移或不可交叉进排序结果中,为了防止EE交叉曝光占比降低,优化了各阅读深度下EE交叉商品的配额。试验时期EE曝光占比base与test基本持平。
上方对比了多款热词下EE交叉商品状况。
燃气热水器关键词下,前30个商品中美的占13个,海尔9个,其他品牌显露少。 |
base EE机制交叉入5个商品,其中美的3个,万和、苏泊尔各一个,加剧头部集中疑问。 |
test EE机制交叉入6个商品,其中苏泊尔2个,万和、京东京造、奥克斯、阿诗丹顿各一个,搜查结果多样性改善清楚。 |
洗碗机关键词下,前30个商品中美的占15个,其他品牌显露少。 |
base EE机制交叉入5个商品,均为美的产品,加剧头部集中疑问。 |
test EE机制交叉入6个商品,其中华帝、小米各2个,科勒、HYUNDAI各一个,搜查结果多样性改善清楚。 |
在多组query词下,test机制相较于base机制在交叉的环节中缩小了头部品牌/店铺的拔出,增强了展现结果的丰盛性,缓解马太效应;同时留意到test机制因为局部头部品牌/店铺商品被滤除,交叉位置相对有所后移,在排序靠后的位置受配额影响多拔出1-2个商品,全体曝光量与base基本分歧,与剖析一的论断分歧。
(2)线上成果
在坚持搜查效率持平的状况下,多样性目的大幅优化并全量上线。
本文重点论述了在搜查EE机制迭代环节中的思索与演进历程,搜查EE作为优化搜查生态与缓解搜查马太效应的关键工具,在演进环节中也围绕搜查结果丰盛性和体验性启动了系统性优化。
在优化思绪上,始终寻觅EE系统的瓶颈疑问,在自顺应探求机制和建模形式更新提供差异化商品探求力度;将商品打分与交叉商品个数启动联动,端到端优化EE流量调配疑问;之后将视线裁减到全局流量,经过多维度探求机制联动人造流量,使EE流量作为人造流量的相互补充。全体思绪表现出从商品间探求打分优化——EE流量共性化调配——与人造流量全局优化的迭代进程。
搜查EE后续还将面临更多的疑问和应战,后续会继续沿用这样的迭代思绪在更多方面启动探求与深化: