本发明涉及互联网应用,特别地涉及一种基于所述知识图谱的商品语义向量生成方法及装置和商品召回方法及系统。
背景技术:
1、随着互联网应用及物流行业的发展,越来越多的商家与消费者倾向于在电子商业平台完成相应的交易。在电商平台上聚集了大量的商家及商家提供的商品。相应地,二手电商平台也逐渐发展起来,成为人们处理闲置物品的一种好的方式。为了提高用户体验及销量,大多数电商平台依据用户的行为以及兴趣画像向用户推荐商品。
2、目前的推荐系统大致可分为运用各种协同过滤算法的推荐系统、基于内容的推荐系统和混合推荐系统。随着知识图谱的应用日益广泛,也有一些方案将知识图谱作为辅助信息融合到推荐系统中。在电商领域,用于推荐系统的知识图谱通常是以商品作为节点,以商品之间的相同属性作为节点之间的连接关系。推荐系统基于商品知识图谱建模进而得到对应的商品向量(embedding),通过对比两个商品的向量距离以确定商品的相似度,根据商品的相似度召回商品。对于前述基于知识图谱的推荐系统,首先,由于二手平台出售的商品多数为唯一的一件孤品,如果知识图谱仅使用常规的一些属性,如品牌、型号等来作为节点的连接关系,则很难区分出二手商品,因而召回的商品准确率不高;如果在知识图谱中应用一些特殊的属性作为节点连接关系,虽然可以提高召回商品的准确率,但是召回商量数量将大大减少,难以满足一些推荐场景。其次,基于现有知识图谱得到的商品向量是一种综合了多种属性关系的向量,在进行商品向量距离计算时,得到的是一个综合信息的相似性,并不能准确到某些具体属性。
3、基于上述分析可见,以知识图谱作为辅助信息的现有推荐系统中,商品向量对二手商品的表征不够,不能准确到具体属性,因而推荐效果还有待提高,流量利用率低。
技术实现思路
1、针对现有技术中存在的技术问题,本发明提出了一种商品语义向量生成方法及装置和商品召回方法及系统,使商品语义向量能够充分表征商品的属性,并在商品召回时提高召回的准确率和召回量,以满足不同场景的应用。
2、为了解决上述技术问题,根据本发明的一个方面,本发明提供了一种商品语义向量生成方法,其包括以下步骤:基于二手电商平台的全量商品及其属性信息构建知识图谱,所述知识图谱三元组中的头节点为商品,尾节点为属性值,节点关系为头节点商品具有对应尾节点属性值的属性;利用trans系列中的任一种模型,基于知识图谱三元组得到知识图谱中各个节点的向量;以及组合头节点商品的多个尾节点向量以构成头节点商品的语义向量。
3、本发明还提供了一种商品召回方法,包括以下步骤:根据目标商品从向量库中获取与其对应的商品语义向量,其中,所述向量库中存储有根据前方法得到的构成商品语义向量的尾节点向量组合及其向量加权值;以构成目标商品语义向量的尾节点向量或其组合为约束条件检索向量库得到多个待定商品;以及对所述多个待定商品进行排序,按照召回商品数量阈值或比例阈值确定排序在前的多个待定商品作为召回商品。
4、根据本发明的另一个方面,本发明还提供了一种基于知识图谱的商品语义向量生成装置,其中包括知识图谱构建模块、向量生成模块和向量组合模块,其中,所述知识图谱构建模块基于全量商品及其属性信息构建知识图谱,其中所述知识图谱三元组中的头节点为商品,尾节点为属性值,节点关系为头节点商品具有对应尾节点属性值的属性;所述向量生成模块与所述知识图谱构建模块相连接,经配置以利用trans系列中的任一种模型,基于知识图谱三元组得到知识图谱中各个节点的向量表示;所述向量组合模块与所述向量生成模块相连接,经配置以组合头节点商品的多个尾节点向量以构成所述头节点商品的语义向量。
5、本发明还提供了一种商品召回系统,其中包括商品向量获取模块、向量检索模块和排序模块,所述商品向量获取模块根据目标商品从向量库中获取目标商品的商品语义向量,其中,所述向量库中存储有根据前述方法得到的构成商品语义向量的尾节点向量组合及其向量加权值;所述向量检索模块以构成目标商品语义向量的尾节点向量或其组合为约束条件检索所述向量库得到多个待定商品;所述排序模块与所述向量检索模块相连接,经配置以对得到的多个待定商品进行排序,并按照召回商品数量阈值或比例阈值确定排序在前的多个商品为召回商品。
6、本发明基于知识图谱生成商品语义向量,在商品语义向量中包括了多种商品属性向量及商品间的关联,能够充分表征二手商品。在基于前述的商品语义向量进行商品召回时,不但能够精确到具体的商品属性,提高商品召回的准确度,而且还能够灵活控制商品的召回量以满足不同的应用场景。
1.一种基于知识图谱的商品语义向量生成方法,其中包括:
2.根据权利要求1所述的方法,其中所述作为节点关系的属性包括通用属性和特定属性;所述通用属性包括商品在二手电商平台中的最小分类类目、新旧成色、使用时长、交易地点和完好程度中的一者或多者;所述特定属性为与商品分类类目对应的特定属性。
3.根据权利要求1所述的方法,其中所述知识图谱中的商品节点之间还包括共现关系,用于表达所述两个商品对应于同一用户的操作行为。
4.根据权利要求3所述的方法,其中构成头节点商品语义向量的尾节点向量为属性值向量或/和与头节点商品共现的商品节点向量。
5.根据权利要求4所述的方法,其中进一步包括:根据商品属性种类或共现次数确定尾节点向量权重。
6.根据权利要求5所述的方法,其中进一步包括:计算构成一个商品语义向量的多个尾节点向量的向量加权值。
7.一种商品召回方法,其中包括:
8.根据权利要求7所述的方法,其中在以所述尾节点向量或其组合为约束条件检索向量库时,按照尾节点向量的权重从大到小的顺序依次进行检索,其中在以起始权重的尾节点向量进行检索时,以向量库中的全量商品作为检索范围,此后每次检索的检索范围为上一次检索得到的商品群。
9.根据权利要求8所述的方法,其中在按照尾节点向量的权重从大到小的顺序依次进行检索得到的商品数量小于阈值时,以前一次起始权重的下一个权重作为起始权重、以向量库中的全量商品作为检索范围重新进行检索,直到得到的商品数量大于或等于阈值。
10.根据权利要求8所述的方法,其中进一步包括:获取目标用户的偏好数据,根据所述用户的偏好数据修正目标商品语义向量中尾节点向量的权重。
11.根据权利要求7所述的方法,其中在以构成目标商品语义向量的尾节点向量或其组合为约束条件检索向量库得到多个待定商品后进一步包括:
12.根据权利要求11所述的方法,其中在按照相同尾节点向量数量从大到小的顺序对所述多个待定商品排序时,在两个或多个待定商品中的与目标商品相同的尾节点向量数量相同时,计算所述两个或多个待定商品中与目标商品相同的尾节点向量加权值;按照所述向量加权值从大到小的顺序对所述两个或多个待定商品排序。
13.根据权利要求7所述的方法,其中在以构成目标商品语义向量的尾节点向量或其组合为约束条件检索向量库得到多个待定商品后进一步包括:
14.一种基于知识图谱的商品语义向量生成装置,其中包括:
15.根据权利要求14所述的装置,其中所述知识图谱构建模块包括:
16.根据权利要求15所述的装置,其中所述知识图谱构建模块还包括:
17.根据权利要求16所述的装置,其中所述知识图谱构建模块还包括行为种类识别单元,经配置以识别同一用户行为数据中对应同一用户行为种类的两个或多个商品;对应地,所述商品对构建单元将同一用户行为数据中同一用户行为种类的两个或多个商品构成一个或多个商品对,所述图谱构建单元将商品对对应的行为种类确定为共现关系种类。
18.根据权利要求16所述的装置,其中所述知识图谱构建模块还包括权重单元,经配置以根据商品属性种类或商品对共现次数确定尾节点向量权重。
19.根据权利要求18所述装置,其中所述向量组合模块包括:
20.一种商品召回系统,其中包括:
21.根据权利要求20所述的系统,其中所述排序模块包括:
22.根据权利要求20所述的系统,其中所述排序模块包括:
23.根据权利要求22所述系统,其中还包括向量计算单元,其与所述向量对比单元相连接,经配置以计算每个待定商品中与目标商品相同的尾节点向量加权值;对应地,所述第二排序单元按照所述向量加权值从大到小的顺序对所述多个待定商品排序;或者,在一个或多个待定商品中的与目标商品相同的尾节点向量数量相同时,所述向量计算单元计算所述两个或多个待定商品中与目标商品相同的尾节点向量加权值;对应地,所述第二排序单元按照所述向量加权值从大到小的顺序对所述两个或多个待定商品排序。
24.根据权利要求22所述系统,其中还包括权重修正模块,经配置以获取目标用户的偏好数据,根据所述偏好数据修正目标商品语义向量中的尾节点向量的权重。