商品召回优化方法及其装置、设备、介质、产品与流程

文档序号:30839364发布日期:2022-07-22 23:58阅读:163来源:国知局
商品召回优化方法及其装置、设备、介质、产品与流程

1.本技术涉及电商信息技术领域,尤其涉及一种商品召回优化方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。


背景技术:

2.电商平台中对商品进行推荐是一类高频应用,广泛服务于商品搜索、商品广告投放、商品筛选等应用场景,可以提升商品匹配效率,使商家用户的商品更易售出,也使消费者用户的需求更容易被满足。
3.应用商品推荐算法时,其中一个关键环节是商品召回环节。商品召回环节中,通过启动多个预设的如召回源,以不同策略或通过不同数据来源渠道获得相应的商品。所召回的商品根据实际情况,可以作为结果使用,也可以进一步排序使用。
4.各个召回源获得的商品数量繁多,各商品对应的信息贡献价值也未实现统一量化,由此,将不同召回源获得的商品笼统综合为最终结果使用,常导致最终获得的结果商品难以达到预期。
5.针对此类问题,传统的处理方法是通过简单调整各个召回源的权重或者匹配基于深度学习的神经网络模型来调节不同召回源中的商品的重要性,但是,由于每个召回源本身存在多种商品,而最终期望获得的商品数量往往较少,因而,这种方式由于信息处理粒度粗糙而导致实际所起作用非常有限,而且,当使用神经网络模型来实施时,其训练成本较高,对于部署为独立站点的线上店铺而言,难以取得成效。
6.有鉴于此,本技术人另辟蹊径,探索实现商品召回优化相对应的新思路,而提本技术。


技术实现要素:

7.本技术的目的在于解决上述问题而提供一种商品召回优化方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品、
8.适应本技术的各个目的,采用如下技术方案:
9.一个方面,适应本技术的目的之一而提供一种商品召回优化方法,包括如下步骤:
10.获取预设的多个召回源相应召回的多个商品数据子集,每个子集中包含被召回的商品及表征该商品被召回的匹配度;
11.根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标;
12.根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分;
13.将所述商品数据子集合并为商品推荐集,其中根据每个商品的实际分值排序,每个商品的实际分值为该商品的匹配度与该商品的召回源的指标评分之积。
14.可选的,根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标,包括如下步骤:
15.获取每个召回源对应的商品数据子集中商品相对应的用户行为数据;
16.根据所述用户行为数据确定每个召回源的各个评价指标相对应的参数值;
17.应用各个评价指标相对应的预设算法及其相应的参数值,计算出各个召回源相对应的评价指标。
18.可选的,根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分,包括如下步骤:
19.根据每个评价指标分别对各个召回源进行排序,获得各个评价指标相对应的召回源排序列表;
20.根据评价指标的数值高低,应用统一的排序分值序列,为每个召回源排序列表中的召回源设定自高至低的相应排序分值;
21.以各个评价指标相应的召回源排序列表的排序分值匹配预设权重求和,获得每个召回源相应的指标评分。
22.可选的,获取预设的多个召回源相应召回的多个商品数据子集的步骤之前,包括如下步骤:
23.响应商品匹配指令,调用多个召回源,基于每个召回源为所述商品匹配指令指定的目标商品匹配出相应的商品数据子集的,所述商品数据子集中的商品与所述目标商品构成特征相似。
24.可选的,将所述商品数据子集合并为商品推荐集的步骤之后,包括如下步骤:
25.根据商品推荐集中商品的实际分值对该商品推荐集进行倒排序;
26.从所述商品推荐集中获取排序靠前的预设多个商品构成商品推荐列表;
27.将所述商品推荐列表推送至目标终端设备。
28.可选的,所述评价指标包括如下任意一项或任意多项:召回率、准确率、调和评分、曲线下面积、用户曲线下面积,所述调和评分根据所述召回率和准确率确定。
29.另一方面,适应本技术的目的之一而提供一种商品召回优化装置,包括数据获取模块、指标确定模块、指标汇总模块,以及数据合并模块,其中:所述数据获取模块,用于获取预设的多个召回源相应召回的多个商品数据子集,每个子集中包含被召回的商品及表征该商品被召回的匹配度;所述指标确定模块,用于根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标;所述指标汇总模块,用于根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分;所述数据合并模块,用于将所述商品数据子集合并为商品推荐集,其中根据每个商品的实际分值排序,每个商品的实际分值为该商品的匹配度与该商品的召回源的指标评分之积。
30.可选的,所述指标确定模块,包括:行为获取单元,用于获取每个召回源对应的商品数据子集中商品相对应的用户行为数据;参数确定单元,用于根据所述用户行为数据确定每个召回源的各个评价指标相对应的参数值;指标计算单元,用于应用各个评价指标相对应的预设算法及其相应的参数值,计算出各个召回源相对应的评价指标。
31.可选的,所述指标汇总模块,包括:排序处理单元,用于根据每个评价指标分别对各个召回源进行排序,获得各个评价指标相对应的召回源排序列表;排序赋值单元,用于根据评价指标的数值高低,应用统一的排序分值序列,为每个召回源排序列表中的召回源设定自高至低的相应排序分值;求和汇总单元,用于以各个评价指标相应的召回源排序列表
的排序分值匹配预设权重求和,获得每个召回源相应的指标评分。
32.可选的,先于所述数据获取模块,包括:召回执行模块,用于响应商品匹配指令,调用多个召回源,基于每个召回源为所述商品匹配指令指定的目标商品匹配出相应的商品数据子集的,所述商品数据子集中的商品与所述目标商品构成特征相似。
33.可选的,后于所述数据合并模块,包括:合并排序模块,用于根据商品推荐集中商品的实际分值对该商品推荐集进行倒排序;列表生成模块,用于从所述商品推荐集中获取排序靠前的预设多个商品构成商品推荐列表;列表推送模块,用于将所述商品推荐列表推送至目标终端设备。
34.可选的,所述评价指标包括如下任意一项或任意多项:召回率、准确率、调和评分、曲线下面积、用户曲线下面积,所述调和评分根据所述召回率和准确率确定。
35.又一方面,适应本技术的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的商品召回优化方法的步骤。
36.又一方面,适应本技术的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品召回优化方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
37.又一方面,适应本技术的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述的商品召回优化方法的步骤。
38.相对于现有技术,本技术具有多方面的优势,至少包括:本技术通过为多个召回源获得的商品数据子集分别确定多个评价指标,根据每个召回源的多个评价指标确定出每个召回源相对应的指标评分,根据指标评分与商品本身的匹配度共同确定商品的实际分值,实现对不同召回源所获得的商品的信息贡献程度的精细粒度的量化,使得根据商品的实际评分能够确定更为精准的最终推荐结果,其实现过程无需使用复杂的数学模型,能以较低的系统开销实现,部署成本较低,特别适于电商平台中的独立站点使用。
附图说明
39.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
40.图1为本技术的商品召回优化方法的典型实施例的流程示意图。
41.图2为本技术的实施例中,确定各个召回源的各个评价指标的过程的流程示意图。
42.图3为本技术的实施例中,确定各个召回源的指标评分的过程的流程示意图。
43.图4为本技术的实施例中,根据商品推荐集获取商品推荐列表的过程的流程示意图。
44.图5为本技术的商品召回优化装置的原理框图;
45.图6为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
46.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终
相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
47.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
48.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
49.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
50.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
51.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
52.本技术的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
53.本技术中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
54.本技术所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本技术的技术方案所调用即可。
55.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
56.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
57.本技术的一种商品召回优化方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本技术的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
58.请参阅图1,本技术的商品召回优化方法在其典型实施例中,包括如下步骤:
59.步骤s1100、获取预设的多个召回源相应召回的多个商品数据子集,每个子集中包含被召回的商品及表征该商品被召回的匹配度;
60.电商平台中,配置有多个召回源,每个召回源提供一种召回策略相对应的商品数据召回服务,从其相应的召回渠道对商品数据进行匹配,获得相应的商品数据子集。所述商品数据子集通常包含多个商品以及各个商品在相应的召回源下获得的匹配该召回源的匹配度。
61.示例而言,一种基于目标商品进行多路召回的应用场景中,预先给定一个目标商品,调用多个用于实现相似匹配的召回源,其中第一召回源根据所述目标商品的商品图片和/或商品描述信息的深层语义特征信息,与第一商品数据池中的各个商品的商品图片和/或商品描述信息的深层语义特征信息进行相似匹配,相应计算出与目标商品构成匹配的商品的匹配度,然后将匹配度高于预设阈值的商品从第一商品数据池中提取出来构成第一召回源相对应的第一商品数据子集。其中第二召回源与第一召回源同理,根据所述目标商品的商品图片和/或商品描述信息的深层语义特征信息,与第二商品数据池中的各个商品的商品图片和/或商品描述信息的深层语义特征信息进行相似匹配,相应计算出与目标商品构成匹配的商品的匹配度,然后将匹配度高于预设阈值的商品从第二商品数据池中提取出来构成第一召回源相对应的第二商品数据子集。所述第一商品数据池可以存储高利润商品,所述第二商品数据池可以存储热销商品。
62.根据以上示例不难理解,本领域技术人员可以预设所述的召回源,为每个召回源预先设定相应的召回策略和/或召回渠道,实现相应的召回服务,提供相应的召回接口,当需要进行商品数据召回时,调用相应的召回源,便可获得其相应的商品数据子集,通过并发调用多个召回源,便可相应获得多个商品数据子集。每个商品数据子集是基于不同的召回策略和/或召回渠道获取的,因而,商品数据子集之间的商品可能存在个别相同的情况,对于相同商品,后续可在合并的阶段进行择优选用。
63.步骤s1200、根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标;
64.针对各个召回源对应获得的各个商品数据子集,可以通过其中各个商品被用户访问所产生的用户行为数据分析每个召回源的实践成效。
65.所述用户行为数据,可以通过在某一商品的商品展示页面中埋点获取,当任意用户访问一个商品展示页面时,便通过该页面相应的埋点代码的而向服务器提交一个相应的用户行为数据,表征该用户针对该商品展示页面对相应的商品执行一次相应的操作,产生相应的操作事件。所述用户行为数据以日志的形式存储于日志数据库中,可根据各个召回源召回的商品,直接从日志数据库中调用预设的一定时间范围内所述商品的用户行为数据,用于确定各个召回源的评价指标。
66.通过对每个召回源获得的商品数据子集中的商品的用户行为数据进行统计,可以获得每个召回源相对应的各个评价指标。所述评价指标,包括如下任意一项或任意多项:召回率、准确率、调和评分、曲线下面积、用户曲线下面积,可由本领域技术人员按需选用。作为示例,本实施例可同时采用以上各个评价指标用于实现对各个召回源的召回成效的评价。
67.所述的准确率precision
single
,在本技术中,定义为每个召回源相应的商品数据子集中被用户访问的商品数量click
single
与该商品数据子集中商品总量amount
single
的比率。公式表示如下:
[0068][0069]
所述的召回率recall
single
,在本技术中,定义为每个召回源相应的商品数据子集中被用户访问的商品数量click
single
占所有召回源相对应的各个商品数据子集的商品总量amount
single
的总和的比率。公式表示为:
[0070][0071]
所述的调和评分f
single
,是精确率和召回率的调和平均,用于权衡准确率和召回率,一般来说准确率和召回率呈负相关,一般来说,精确度和召回率之间是矛盾的,因而可以通过引入调和评分来平衡准确率和召回率的影响,调和评分越大说明模型质量更高。调和评分可以根据以下公式计算:
[0072]
[0073]
其中,β可以根据对召回率的重要性的需求灵活调节,当其等于1时,表示准确率和召回率同等重要;当其小于1时,表示准确率重于召回率;当其大于1时,表示召回率重于准确率。由于本技术重在召回优化,故示例性设定β=1。
[0074]
所述的曲线下面积(auc,area under curve),是用于评价一个召回源的优劣的指标之一,本技术中,采用如下公式定义:
[0075][0076]
其中,unclick
single
为相应的召回源中未被用户访问的商品数量。由此可负了,曲线下面积反映的是召回源召回的整体样本间的一个排序能力。
[0077]
所述的用户曲线下面积gauc,是基于每个用户计算曲线下面积获得的结果。在计算广告领域,实际要衡量的是不同用户对不同广告商品之间的排序能力,因而,实际应该更关注的是同一个用户对不同广告间的排序能力,故可基于单个用户计算曲线下面积。为此,应用如下公式确定:
[0078][0079]
其中(u,p)表示用户和商品的
[0080]
根据以上公式可知:gauc(group auc)实际是计算每个用户的auc,然后加权平均,最后得到gauc,这样就能减少不同用户间的排序结果不太好比较这一影响。实际处理时,所述的权重w
(u,p)
一般可以设为每个用户访问的次数。
[0081]
根据以上关于示例性的各个评价指标的公式的揭示,可以理解,按照预选的一个或多个所述的评价指标公式,当需要基于各个召回源相对应的商品数据子集对各个召回源进行评价时,利用根据所述用户行为数据确定的相关参数值,应用相应的评价指标公式,便可计算出相应的各个评价指标。
[0082]
步骤s1300、根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分;
[0083]
对于每个召回源来说,其各个评价指标相对较为分散,分别从不同角度提供对相应的召回源的评价信息,并不直观,为此,可应用预设的汇总算法,将每个召回源相对应的多个评价指标综合为相对应的单个指标评分,用于综合指示每个召回源的优劣。一个实施例中,直接将以上各个评价指标进行加和获得相应的指标评分。另一实施例中,也可为各个评价指标匹配权重进行汇总,例如,示例性的公式如下:
[0084]
score=w1*precision
single
+w2*recall
single
+w3*f
single
+w4*auc
single
+w5*gauc
single
[0085]
其中,w为预设权重,可由本领域技术人员预先设定。
[0086]
不难理解,通过汇总每个召回源相对应的各个评价指标确定出各个指标评分,实现从不同维度综合评价各个召回源的优劣,将各个召回源的总体表现统一为同一量纲,方便后续指导对所有召回源召回的全量商品排序。
[0087]
除以上方式之外,还可采用其他方式用于确定所述的指标评分,本技术后续的实施例将进一步揭示其他方式的实现,此处暂且不表。
[0088]
步骤s1400、将所述商品数据子集合并为商品推荐集,其中根据每个商品的实际分值排序,每个商品的实际分值为该商品的匹配度与该商品的召回源的指标评分之积。
[0089]
为了实现对所有召回源相对应的商品数据子集中的商品的汇总,可将各个商品数据子集进行合并,获得一个商品推荐集。在合并的过程中,对于不同商品数据子集存在相同商品的情况,可仅保留具有更高的指标评分的召回源相对应的数据记录,实现去重。通过合并获得的商品推荐集,可以直接作为结果集使用,也可推送至预设的排序模型或者应用预设的排序算法,进行排序后再行输出,由本领域技术人员按需实施即可。
[0090]
为了方便对商品推荐集中的商品进行统一排序,可将各个商品在其相应的召回源获得的匹配度与该召回源相应获得的指标评分进行相乘求积,作为该商品相对应的实际分值,后续根据该实际分值便可实现对商品推荐集的排序。
[0091]
根据以上的实施例不难理解,相对于现有技术,本技术具有多方面的优势,至少包括:本技术通过为多个召回源获得的商品数据子集分别确定多个评价指标,根据每个召回源的多个评价指标确定出每个召回源相对应的指标评分,根据指标评分与商品本身的匹配度共同确定商品的实际分值,实现对不同召回源所获得的商品的信息贡献程度的精细粒度的量化,使得根据商品的实际评分能够确定更为精准的最终推荐结果,其实现过程无需使用复杂的数学模型,能以较低的系统开销实现,部署成本较低,特别适于电商平台中的独立站点使用。
[0092]
在以上任意实施例的基础上,请参阅图2,所述步骤s1200、根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标,包括如下步骤:
[0093]
步骤s1210、获取每个召回源对应的商品数据子集中商品相对应的用户行为数据;
[0094]
如前所述,针对每个召回源,从日志数据库中获取一定时间范围内的原始的用户行为数据。然后对原始的用户行为数据进行数据清洗,使得所述用户行为数据可以格式化为统一表达式,其形式示例如下:
[0095]
用户,当前商品,召回商品,匹配度,召回源,访问状态
[0096]
其中,用户指示执行对电商平台中的活动用户,当前商品指示用于触发多个召回源进行召回的目标商品,召回商品指示所述召回源根据所述目标商品召回的对应商品,召回源指示召回该召回商品相对应的召回源,访问状态指示所述用户是否访问所述召回商品,采用二值化标识表征,例如用户访问过所述召回商品表示为1,否则表示为0。
[0097]
在数据清洗过程中,可将用户对所述召回商品的任意访问形式,例如点击相应的链接、将该召回商品添加到购物车、对该召回商品执行下单操作、支付该召回商品相对应的订单等,均归一化为单次访问事实,也即,只标记用户是否以任意形式访问过该召回商品,而不关注用户的访问次数。据此,简化相关计算量和复杂度,提升执行效率。
[0098]
步骤s1220、根据所述用户行为数据确定每个召回源的各个评价指标相对应的参数值;
[0099]
为了方便应用所述各个评价指标相对应的公式,需要基于各个公式,从清洗后的用户行为数据中确定出各个公式的参数所需的参数值,考察本技术示例性的各个公式可知,各个召回源的商品数据子集中的商品分为被访问和未被访问两类,将被访问的商品视为召回源的正样本,将未被访问的商品视为召回源的负样本,由此,可以获得每个召回源的混淆矩阵,根据该混淆矩阵可以统计出各个相应的参数值。
[0100]
示例而言,根据数据清洗后的用户行为数据,对各个召回源的商品数据子集中被用户访问的商品进行进行统计,可获得其中被访问商品的商品数量click
single
,而每个召回源未被访问的商品数量unclick
single
也可相应统计而得,由此便确定了各个评价指标相对应的参数值。
[0101]
步骤s1230、应用各个评价指标相对应的预设算法及其相应的参数值,计算出各个召回源相对应的评价指标。
[0102]
确定了各个评价指标的参数值例如被访问和未被访问的商品数量后,便可应用本技术示例性的各个引用该些参数值的评价指标公式,对各个评价指标进行相应的计算,最终获得各个评价指标相应的结果数值。
[0103]
根据以上实施例可以理解,在用户行为数据的基础上,可以快速统计出各个评价指标所需的参数值,根据用户行为数据确定出各个召回源的评价指标,可以对各个召回源的优劣实施同一标准的评价。
[0104]
在以上任意实施例的基础上,请参阅图3,所述步骤s1300、根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分,包括如下步骤:
[0105]
步骤s1310、根据每个评价指标分别对各个召回源进行排序,获得各个评价指标相对应的召回源排序列表;
[0106]
针对每个评价指标,可以分别对所述召回源进行排序,相应获得一个召回源排序列表,例如以上示例的五个评价指标,可以相应获得五个召回源排序列表。为便于理解,此处对于每个召回源排序列表,按照其相应的评价指标由高到低对各个召回源进行排序。
[0107]
步骤s1320、根据评价指标的数值高低,应用统一的排序分值序列,为每个召回源排序列表中的召回源设定自高至低的相应排序分值;
[0108]
预先设定一个排序分值序列,例如,设存在n个召回源,n为大于2的自然数,于是可以预设排序分值序列如下:
[0109]
[1,2,
……
n]
[0110]
然后,对于每个召回源排序列表,按照评价指标高低,自高至低适配排序分值序列中的排序分值,例如,评价指标最高的召回源被匹配排序分值n,评价指标最低的召回源被匹配排序分值1,其他同理。
[0111]
步骤s1330、以各个评价指标相应的召回源排序列表的排序分值匹配预设权重求和,获得每个召回源相应的指标评分。
[0112]
每个召回源通过其对应各个评价指标确定的排序分值,实现将不同评价指标的量纲转换至用于表示排序分值的同一数值空间,因此,可以每个召回源对应其不同评价指标的预设权重,对每个召回源对应不同评价指标的排序分值进行加权求和,其求和结果即可作为每个召回源相对应的指标评分。
[0113]
示例而言,使用如下公式表示:
[0114]
score
source
=w1*rank
precision
+w2*rank
recall
+w3*rankf+w4*rank
auc
+w5*rank
gauc
[0115]
其中,rank
precision
、rank
recall
、rankf、rank
auc
、rank
gauc
分别为所述准确率、召回率、调和评分、曲线下面积、用户曲线下面积等评价指标相对应的排序分值,source为召回源。w为预设权重,可由本领域技术人员预先设定。示例性的权重配置方案中,曲线下面积与用户曲线下面积可以维持相同最高权重,召回率和调和评分可以维持相同最低权重,准确率可
以为两者之间的折衷权重。
[0116]
根据以上实施例可知,通过借助排序分值为中间量纲,实现将各个评价指标相对应的同等分析,方便通过预设权重来对各个评价指标的作用进行标准化的调节,从而有助于调节最终获得的指标评分,以便迅速获取客观有效的评价结果。
[0117]
可选的,获取预设的多个召回源相应召回的多个商品数据子集的步骤之前,包括如下步骤:
[0118]
响应商品匹配指令,调用多个召回源,基于每个召回源为所述商品匹配指令指定的目标商品匹配出相应的商品数据子集的,所述商品数据子集中的商品与所述目标商品构成特征相似。
[0119]
示例性的应用场景中,用户在电商平台的独立站点的线上店铺触发商品匹配指令并发送到服务器,在该商品匹配指令中包含指定的目标商品,以便实现相似商品匹配,为此,服务器响应该商品匹配指令而启用相应的召回源进行商品的召回,据此而获得各个召回源根据所述目标商品检索其相似商品而获得的商品数据子集。
[0120]
一个实施例中,每个召回源为目标商品检索其相似商品时,可以基于从商品的商品信息中预先提取的深层语义信息,计算其与召回源相对应的商品数据池中的商品预先提取的深层语义信息之间的数据距离,从而确定两者的相似度,然后,根据预设阈值,从所述商品数据池中检索出相似度高于所述预设阈值的商品构成为相应的商品数据子集,作为召回结果即可。在所述商品数据子集中,可以关联存储各个商品相对应的相似度,以所述相似度作为其相应的商品与所述目标商品的匹配度。
[0121]
根据以上实施例可以理解,本技术可以通过前置步骤响应用户指令,实现用户交互,根据终端设备的指令而执行相应的召回,然后可在此基础上确定出与目标商品相匹配的商品推荐集。
[0122]
可选的,请参阅图4,将所述商品数据子集合并为商品推荐集的步骤之后,包括如下步骤:
[0123]
步骤s1500、根据商品推荐集中商品的实际分值对该商品推荐集进行倒排序;
[0124]
如前所述,由各个召回源的商品数据子集合并而成的商品推荐集中,其中各个商品均获得了其相应的实际分值,该实际分值由于已经在各个召回源的评价指标的基础上经过量纲转换和权重匹配,能够有效统一表征各个商品的信息贡献价值,因此,可直接根据该实际分值对所述商品推荐集中的各个商品进行倒排序,获得自大到小的排序结果。
[0125]
步骤s1600、从所述商品推荐集中获取排序靠前的预设多个商品构成商品推荐列表;
[0126]
通常,对于某些具体应用场景,例如商品相似匹配、广告商品投放等,基于目标商品进行召回获得商品推荐集后,商品推荐集中的商品数量是较多的,例如上百或上千,但实际应用时,通常只需展示信息贡献价值较高的部分商品即可,据此,可以按照预设数量,对排序后的商品推荐集中的商品进行截尾,保留预设数量的排序靠前的部分商品,去除其后的其他商品,由此获得一个商品推荐列表。
[0127]
步骤s1700、将所述商品推荐列表推送至目标终端设备。
[0128]
最后,根据实际场景,将该商品推荐列表推送至驱动商品召回的终端设备,例如提供所述目标商品的用户的终端设备,使所述商品推荐列表得以在该终端设备的图形用户界
面解析展示即可。
[0129]
根据以上实施例可以看出,本技术以较低的运算量,快速获得商品推荐列表,能够满足诸如商品相似匹配、广告商品投放等需求,特别适于部署在基于独立站点实现的电商平台的线上店铺中,其部署成本低廉,但所获得的召回结果精准而高效。
[0130]
请参阅图5,适应本技术的目的之一而提供一种商品召回优化装置,是对本技术的商品召回优化方法的功能化体现,该装置包括数据获取模块1100、指标确定模块1200、指标汇总模块1300,以及数据合并模块1400,其中:所述数据获取模块1100,用于获取预设的多个召回源相应召回的多个商品数据子集,每个子集中包含被召回的商品及表征该商品被召回的匹配度;所述指标确定模块1200,用于根据每个商品数据子集中商品相对应的用户行为数据确定每个召回源的多个评价指标;所述指标汇总模块1300,用于根据每个召回源相应的各个评价指标分别汇总确定每个召回源的指标评分;所述数据合并模块1400,用于将所述商品数据子集合并为商品推荐集,其中根据每个商品的实际分值排序,每个商品的实际分值为该商品的匹配度与该商品的召回源的指标评分之积。
[0131]
可选的,所述指标确定模块1200,包括:行为获取单元,用于获取每个召回源对应的商品数据子集中商品相对应的用户行为数据;参数确定单元,用于根据所述用户行为数据确定每个召回源的各个评价指标相对应的参数值;指标计算单元,用于应用各个评价指标相对应的预设算法及其相应的参数值,计算出各个召回源相对应的评价指标。
[0132]
可选的,所述指标汇总模块1300,包括:排序处理单元,用于根据每个评价指标分别对各个召回源进行排序,获得各个评价指标相对应的召回源排序列表;排序赋值单元,用于根据评价指标的数值高低,应用统一的排序分值序列,为每个召回源排序列表中的召回源设定自高至低的相应排序分值;求和汇总单元,用于以各个评价指标相应的召回源排序列表的排序分值匹配预设权重求和,获得每个召回源相应的指标评分。
[0133]
可选的,先于所述数据获取模块1100,包括:召回执行模块,用于响应商品匹配指令,调用多个召回源,基于每个召回源为所述商品匹配指令指定的目标商品匹配出相应的商品数据子集的,所述商品数据子集中的商品与所述目标商品构成特征相似。
[0134]
可选的,后于所述数据合并模块1400,包括:合并排序模块,用于根据商品推荐集中商品的实际分值对该商品推荐集进行倒排序;列表生成模块,用于从所述商品推荐集中获取排序靠前的预设多个商品构成商品推荐列表;列表推送模块,用于将所述商品推荐列表推送至目标终端设备。
[0135]
可选的,所述评价指标包括如下任意一项或任意多项:召回率、准确率、调和评分、曲线下面积、用户曲线下面积,所述调和评分根据所述召回率和准确率确定。
[0136]
为解决上述技术问题,本技术实施例还提供计算机设备。如图6所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品搜索类目识别方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本技术的商品召回优化方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图6中示出的结构,仅
仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0137]
本实施方式中处理器用于执行图5中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的商品召回优化装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
[0138]
本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本技术任一实施例的商品召回优化方法的步骤。
[0139]
本技术还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述方法的步骤。
[0140]
本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等计算机可读存储介质,或随机存储记忆体(random access memory,ram)等。
[0141]
综上所述,本技术实现对不同召回源所获得的商品的信息贡献程度的精细粒度的量化,使得根据商品的实际评分能够确定更为精准的最终推荐结果,其实现过程无需使用复杂的数学模型,能以较低的系统开销实现,部署成本较低,特别适于电商平台中的独立站点使用。
[0142]
本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
[0143]
以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1