基于知识图谱深度学习的电子商务推荐方法及系统与流程

文档序号:32475622发布日期:2022-12-07 08:57阅读:209来源:国知局
基于知识图谱深度学习的电子商务推荐方法及系统与流程

1.本发明涉及电子商务技术领域,具体涉及一种基于知识图谱深度学习的电子商务推荐方法及系统。


背景技术:

2.目前,纺织品电子商务平台属于行业电商平台,多采用线上展览与线下交易相结合的b2b电商模式,商品种类繁多,顾客数量庞大。为了提升顾客的浏览效率和体验,需要开发一个商品推荐系统,根据顾客的偏好为其主动推荐商品。现有的推荐系统一般都是基于注册用户来进行组合推荐,但是在纺织品电子商务平台中顾客以未注册游客为主,其评价和交易记录稀缺,其偏好表现局限于浏览记录。这就为推荐系统的构建带来了顾客难标识、偏好特征难提取和推荐性能难保障等挑战。因此,设计一种能够进行顾客准确标准,提升推荐准确率的方案成为本领域技术人员亟待解决的技术问题。


技术实现要素:

3.针对所述缺陷,本发明实施例公开了一种基于知识图谱深度学习的电子商务推荐方法,其能够及时捕获顾客对商品的偏好特征,支持基于地址信息的个性化推荐,提升顾客对电子商务平台的商品浏览效率。
4.本发明实施例第一方面公开了基于知识图谱深度学习的电子商务推荐方法,包括:接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型中采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;将所述浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
5.作为一种可选的实施方式,在本发明实施例第一方面中,在所述接收应用接口端传输的浏览信息之后,还包括:对所述浏览信息进行数据清洗操作以对浏览日志中的非商品浏览记录以及商品字段缺失浏览记录进行过滤操作;所述非商品浏览记录包括展会浏览信息、店铺浏览信息和通知浏览信息;对经过过滤操作的浏览信息进行有效性判断,当对一顾客对同一商品的浏览次数或者浏览时间超过第一设定值时,则确定该商品对顾客有效,否则对相应的浏览信息进行过滤。
6.作为一种可选的实施方式,在本发明实施例第一方面中,所述商品关系图谱模型通过如下步骤构建完成:获取相应电子商务平台处的历史浏览信息;从所述历史浏览信息中提取多个商品实体、商品属性以及店铺实体,并确定所述多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系;基于多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系构建商品关系图谱模型。
7.作为一种可选的实施方式,在本发明实施例第一方面中,在从所述历史浏览信息中提取多个商品实体、商品属性以及店铺实体之后,还包括:从历史浏览信息中基于顾客商品的浏览关系以确定商品之间的浏览邻接关系;所述浏览邻接关系为在一个会话周期内若浏览多个商品,则多个商品之间互为浏览邻接关系;当互为浏览邻接关系次数达到第二设定值时,则确定该商品之间存在浏览邻接关系。
8.作为一种可选的实施方式,在本发明实施例第一方面中,所述商品关系图谱模型还包括如下步骤:若当前商品推荐图谱构建过程不是首次商品关系图谱模型构建过程,则将所述多个商品实体和所述多个商品实体之间的关系融合至上一商品关系图谱模型中以得到当前商品关系图谱模型的多个商品实体以及多个商品实体之间的关系。
9.作为一种可选的实施方式,在本发明实施例第一方面中,所述推荐算法模型包括预测函数模型,其中预测函数模型为:,其中,u为顾客信息,u为顾客矩阵,且u={u1,u2,

,um},v为商品信息,v为商品矩阵,且v={ v1,v2,

,vn },即函数f的参数集,为u和v的浏览预测值;所述推荐算法模型通过如下步骤构建得到:通过随机初始化向量或者trans嵌入表示算法对商品关系图谱模型中的实体和关系表示为d维嵌入向量;通过领域信息传播和聚合器来修正实体和关系的嵌入向量以得到最终领域表示vu;其中,利用邻居信息的线性组合来刻画商品的领域信息;基于顾客信息u和最终领域表示vu定义浏览概率预测函数,并通过交叉熵函数来进行模型计算直至满足设定条件以完成推荐算法模型的构建,所述交叉熵函数为:,其中,yi表示顾客商品交互矩阵y中(u,v)对实际的浏览关系,为预测的(u,v)对浏览概率,u为顾客信息,v为商品信息。
10.作为一种可选的实施方式,在本发明实施例第一方面中,所述推荐算法模型为ripplenet推荐模型、kgcn推荐模型、kgat推荐模型、ckan推荐模型中的任意一种;且各个推荐模型均保存有相应的神经网络参数;和/或,所述聚合器为求和聚合、拼接聚合和邻居聚合中的任意一种;和/或,所述推荐方法采用离线计算的方式来进行推荐操作,根据预先构建完成的知识图谱和推荐算法模型进行后台计算,一次性生成所有顾客的离线推荐列表,并将结果存储为文本文件;和/或,在所述推荐方法中商品关系图谱模型和推荐算法模型均部署于一gpu深度学习服务器中,所述应用接口部署在一web服务器中。
11.本发明实施例第二方面公开一种基于知识图谱深度学习的电子商务推荐系统,包括:接收模块:用于接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;实体抽取模块:用于将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;推荐模块:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
12.本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于知识图谱深度学习的电子商务推荐方法。
13.本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于知识图谱深度学习的电子商务推荐方法。
14.与现有技术相比,本发明实施例具有以下有益效果:本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
附图说明
15.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1是本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法的流程示
意图;图2是本发明实施例公开的对浏览信息进行过滤操作的流程示意图;图3是本发明实施例公开的商品关系图谱模型构建的流程示意图;图4是本发明实施例公开的推荐算法模型构建的流程示意图;图5是本发明实施例公开的推荐系统的技术框架图;图6是本发明实施例公开的商品知识图谱的本体模型图;图7是本发明实施例公开的kgcn模型的结构图;图8是本发明实施例公开的kgcn模型的信息传递图;图9是本发明实施例公开的kgcn模型的一阶聚合过程示意图;图10是本发明实施例公开的推荐原理示意图;图11是本发明实施例公开的电子商务推荐系统的部署图;图12是本发明实施例公开的纺织品电商知识图谱示例图;图13是本发明实施例公开的算法推荐准确率随学习迭代次数的变化曲线图;图14是本发明实施例公开的auc有无浏览邻接关系对比图;图15是本发明实施例公开的acc有无浏览邻接关系对比图;图16是本发明实施例提供的一种基于知识图谱深度学习的电子商务推荐系统的结构示意图;图17是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
17.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
18.需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
19.经典推荐算法可分为内容过滤、协同过滤和模型过滤三类。三类经典算法均需要显式的顾客交易评分记录,对于缺乏评分记录的纺织品电商平台而言,需要将浏览日志转换为评分记录,如根据浏览次数或时长进行转换,而实际上浏览对顾客偏好的反映远远弱于交易和评分记录,从浏览到评分的转换将会引入大量噪声而导致推荐性能不佳。对于纺织品电子商务推荐而言,仍有以下问题需要解决:非注册游客的标识问题;适合于深度学习的知识图谱构建问题;支持多算法的深度学习框架设计问题。本发明实施例公开了基于知识图谱深度学习的电子商务推荐方法、系统、电子设备及存储介质,通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
20.本发明实施例的基于知识图谱的推荐方法不仅能根据历史浏览日志,还能结合商品关系进行推荐,是目前推荐技术的发展趋势。按照技术可以分为基于路径编码和基于深度学习两类推荐算法。基于路径编码的推荐算法依赖于人的经验,基于顾客和商品之间的关系设置推荐路径,然后以顾客访问的商品为起点,沿着推荐路径计算商品相似度,再基于相似度进行推荐。基于路径编码的推荐方法因依赖人的经验而推广性不足。
21.基于深度学习的推荐方法以知识图谱和顾客交互记录为输入,通过深度学习来预测未知的顾客对商品的浏览概率,丰富了顾客到商品的推荐路径,能缓解评分记录缺失的影响,可视为基于内容和基于协同过滤的混合算法。目前主要包括三个经典模型:ripplenet、kgcn(knowledge graph convolutional networks)和 kgat(knowledge graph attention network)及其衍生系列。ripplenet 利用项目连接的多跳关系加强对节点的嵌入表示,kgcn通过对图谱关系进行加权实现更精准的推荐,kgat在知识图谱中引入顾客-商品交互矩阵并对图谱关系进行加权实现推荐。ckan(collaborative knowledge-aware attentive network)模型是一种新型的衍生知识图谱推荐算法,相比于上述三个经典模型而言,主要改进了顾客的初始表示,它用交互过的商品集来表达顾客,这样,只要顾客与商品有交互记录就可以进行推荐,不需要重新学习,提升了适用范围,减少了学习的频次。
22.纺织品电子商务平台属于行业电商平台,多采用线上展览与线下交易相结合的b2b电商模式,商品种类繁多,顾客数量庞大,有着强烈的推荐需求。但顾客以未注册游客为主,评价和交易记录缺乏,其偏好特征提取只能依赖浏览记录。顾客偏好关联信息稀缺导致传统的基于顾客-商品评价矩阵的顾客协同过滤、商品协同过滤、奇异值分解等推荐算法效果不佳。本发明实施例提供了一个基于知识图谱深度学习的纺织品电子商务推荐系统,根据b2b电商顾客浏览端稳定性的特点,以浏览端ip地址标识顾客,解决未注册顾客的标识问题;通过商品属性和被浏览特征建立商品之间的相互关联,弥补顾客偏好关系信息的不足;通过建立一个支持多种知识图谱深度学习推荐算法的系统框架来保障推荐性能。系统包括:知识图谱构建、深度学习、应用接口等三大模块,知识图谱构建模块基于纺织品电子商务平台的商品属性、店铺属性和浏览日志,经数据抽取、转换和加载后,构建了反映商品、店铺、顾客等实体关系的知识图谱。特别地,基于浏览日志定义商品之间的浏览邻接关系,建立了商品之间的直接关联。深度学习模块则在知识图谱关系三元组的基础上,构建统一的深度学习数据集和评价指标体系,并提供了ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法,基于知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果。应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成。本推荐系统能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
23.实施例一请参阅图1,图1是本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法的流程示意图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的
本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。如图1所示,该基于知识图谱深度学习的电子商务推荐方法包括以下步骤:s101:接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;在本步骤主要是为了获取到基础的浏览数据。具体的,应用接口主要为应用程序提供推荐功能调用,以http服务的形式提供,服务程序根据应用请求检索深度学习获得的离线推荐文档,并将检索结果以json格式响应推荐结果。接口详情设计如下:接口协议为http get;请求参数为userid(用户标识)、model(模型名称)、code(返回码)、msg(返回消息)和data(返回数据),其中,模型在{ ripplenet,kgcn,kgat,ckan,

}中枚举;返回码:同http定义,如200表示成功;返回消息:查询成功,或失败原因,如顾客不存在;返回数据:(商品id, 顾客浏览概率) 列表,以json对象输出。
24.更为优选的,图2是本发明实施例公开的对浏览信息进行过滤操作的流程示意图,如图2所示,在所述接收应用接口端传输的浏览信息之后,还包括:s1011:对所述浏览信息进行数据清洗操作以对浏览日志中的非商品浏览记录以及商品字段缺失浏览记录进行过滤操作;所述非商品浏览记录包括展会浏览信息、店铺浏览信息和通知浏览信息;s1012:对经过过滤操作的浏览信息进行有效性判断,当对一顾客对同一商品的浏览次数或者浏览时间超过第一设定值时,则确定该商品对顾客有效,否则对相应的浏览信息进行过滤。
25.顾客-商品浏览关系主要基于浏览日志构建,假定浏览日志中包含浏览器端ip地址、浏览时间、浏览商品id等信息,则用浏览器端ip地址作为顾客实体标识,浏览关系的形式则表示为(顾客ip,浏览,商品id),这样就构建了顾客-商品之间的关系。通过上述方式解决了非注册用户信息对应的问题。
26.为了增强浏览关系的有效性,这里增加一个有效浏览的判定,只有顾客对商品浏览次数超过2次,才认为是顾客对商品的有效浏览,否则,认为是顾客对商品的无意浏览,对推荐而言价值不大。首先在浏览日志中过滤掉无效浏览,然后对有效浏览生成三元组(顾客ip,浏览,商品id)。通过上述步骤来实现对顾客的更加精准的推送操作。
27.s102:将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型中采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;在本发明实施例中纺织品电子商务平台以线上展示,线下交易的模式进行,注册顾客稀疏,交易数据和评分数据稀缺,基于数据的可获取性考虑,推荐系统主要构建在店铺、商品、浏览日志等数据基础上,商品与店铺是归属关系,商品之间通过属性实体相关联,并没有直接关系。
28.本模块首先从纺织品电子商务平台数据接口抽取店铺、商品、浏览日志等数据,然
后对数据进行清洗,过滤掉浏览日志中的非商品(展会、店铺、通知等)浏览记录和商品id字段缺失的浏览记录。再将店铺、商品、浏览等对象加载到程序中进行实体转换。
29.知识图谱中的实体主要包括:店铺、商品、商品属性(如成分、织法、用途等)、顾客等。店铺和商品对象直接转换为知识图谱中的店铺和商品实体,对于商品属性而言,每类属性为一类实体,该类属性值域内的每一个离散值即可转换为商品属性实体,如成分属性,可以抽取出:棉、羊毛、桑蚕丝、牛仔布等实体。
30.特别地,对于顾客实体的抽取,因为主要是非注册的游客,不能像一般电商系统一样从顾客会员注册表中提取信息,这里从浏览日志中间接提取。因为b2b的交易特性,纺织品电商平台的顾客主要是服装加工企业的采购员,一个服装加工企业可能有多个采购员,但是他们浏览商品的目的均是为企业采购物料,并且主要通过企业网络访问电商平台,在浏览日志中记录的浏览端ip较为稳定。在此,将顾客定义为一个服装加工企业的采购员群体而非单个采购员,采用浏览日志中的浏览端ip进行标识,一个ip即表示一个顾客实体。
31.更为优选的,图3是本发明实施例公开的商品关系图谱模型构建的流程示意图,如图3所示,所述商品关系图谱模型通过如下步骤构建完成:s1021:获取相应电子商务平台处的历史浏览信息;s1022:从所述历史浏览信息中提取多个商品实体、商品属性以及店铺实体,并确定所述多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系;s1023:基于多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系构建商品关系图谱模型。
32.商品属性关系构建的过程具体如下,将商品、店铺、商品属性值视为实体对象,从加载的商品信息出发,构建商品属性关系和商品与店铺的归属关系,商品和店铺均用唯一性的id作为实体标识,其关系的表示则采用rdf标准进行描述,rdf(resource description framework,资源描述框架)是一种资源描述语言,采用(头实体,关系,尾实体)或者(实体,属性,属性值)的形式描述对象关系和属性。
33.对于商品属性关系,商品是头实体,关系则为具体属性,如纺织品的商品属性主要有:产品分类、成分、织法、用途、颜色、弹力、适用范围、制造工艺等,每一个属性均是一类关系,尾实体则是属性值,每一个属性实体赋一个唯一性的id标识。经处理后,商品属性关系将表示为(商品id,属性关系,属性值id)的三元组形式。商品与店铺的归属关系是一对多的关系,即一家店铺有多种商品,而一种商品只归属于一家店铺,将转换为(商品id,归属于,店铺id)的三元组形式。
34.顾客-商品浏览关系构建的过程,顾客-商品浏览关系主要基于浏览日志构建,假定浏览日志中包含浏览器端ip地址、浏览时间、浏览商品id等信息,则用浏览器端ip地址作为顾客实体标识,浏览关系的形式则表示为(顾客ip,浏览,商品id),这样就构建了顾客-商品之间的关系。为了增强浏览关系的有效性,这里增加一个有效浏览的判定,只有顾客对商品浏览次数超过2次,才认为是顾客对商品的有效浏览,否则,认为是顾客对商品的无意浏览,对推荐而言价值不大。首先在浏览日志中过滤掉无效浏览,然后对有效浏览生成三元组(顾客ip,浏览,商品id)。
35.更为优选的,在从所述历史浏览信息中提取多个商品实体、商品属性以及店铺实
体之后,还包括:s1021a:从历史浏览信息中基于顾客商品的浏览关系以确定商品之间的浏览邻接关系;所述浏览邻接关系为在一个会话周期内若浏览多个商品,则多个商品之间互为浏览邻接关系;s1021b:当互为浏览邻接关系次数达到第二设定值时,则确定该商品之间存在浏览邻接关系。
36.为了增强商品之间的直接联系,基于顾客-商品浏览关系再派生出商品之间的浏览邻接关系,即顾客u在一个会话周期内(如60分钟)浏览了va、vb、vc三种商品,则va、vb、vc互为浏览邻接关系。为了减少偶发性浏览邻接关系,进一步设立过滤规则,即互为浏览邻接关系的次数达到一定阈值(如2次)才确定两商品之间存在浏览邻接关系。浏览邻接关系体现了商品之间的潜在组合关系,比如一顾客有一个牛仔裤的订单,他就会在商城反复浏览牛仔布面料、铜纽扣、皮饰等,他一次浏览过的商品很可能就能组合为一批服装,但是可用的数据中没有商品之间的组合关系,而通过浏览邻接关系的衍生则可弥补这一不足。基于以上的关系构建,可归纳出纺织品电商知识图谱的本体模型,如图6所示。
37.浏览邻接关系是本发明根据浏览日志扩展出的一种商品之间的关系,它实现了商品间的直接连接,采用kgcn算法,对比有无浏览邻接关系时的推荐性能。auc和acc指标分别如图14和图15所示。图中有浏览邻接关系标识为with no-consequence relationship,无浏览邻接关系标识为without no-consequence relationship。通过上述内容以及图14和图15,可以看出,有浏览邻接关系的auc和acc均明显优于无浏览邻接关系,这也可以验证本发明实施例提出的浏览邻接关系的有效性。
38.更为优选的,所述商品关系图谱模型还包括如下步骤:若当前商品推荐图谱构建过程不是首次商品关系图谱模型构建过程,则将所述多个商品实体和所述多个商品实体之间的关系融合至上一商品关系图谱模型中以得到当前商品关系图谱模型的多个商品实体以及多个商品实体之间的关系。
39.通过上述步骤来实现商品关系图谱模型的不断更新优化以构建更加精准的图谱关系模型来进行更加精准的数据推荐。
40.s103:将所述浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
41.如图5所示,深度学习模块包括深度学习数据集构建、深度学习推荐算法库配置、深度学习任务启动和推荐结果导出等功能子模块。本发明实施例的方案基于ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法的共性特征,对商品关系文档和浏览关系文档中的内容进行进一步处理,使其能适应深度学习算法的训练。
42.首先对深度学习数据集进行如下定义:(1)顾客-商品交互矩阵y:假定纺织品电商推荐场景中包含m个顾客u={u1,u2,

,um}和n个商品v={ v1,v2,

,vn },根据知识图谱构建模块导出的浏览关系文档,可获得顾客-商品交互矩阵,对于,当u与v之间存在浏览关系三元组,则,否则。需要注意的是,,并不意味着顾客u对商品v不感兴趣,也许是因为u未能发现v。
43.(2)知识图谱g:把知识图谱中的顾客、店铺、商品及其属性值(如具体的商家、产品成分、用途等)统称为实体集e,把商品属性关系和顾客-商品浏览关系统称为关系集r,则知识图谱可表示为。(h,r,t)即关系三元组,如{针织提花千鸟格,商家,特丽龙}表示商品“针织提花千鸟格”的商家为“特丽龙”,因为商品和商家名称存在重复,在实际的三元组表达中,实体均用id标识。通过商品知识图谱,商品之间实现路径可达,如“特丽龙”的另一类商品“彩云纱”,通过{彩云纱,商家,特丽龙},与“针织提花千鸟格”形成路径可达。注意在图遍历过程中,关系组成的边视为双向边。
44.深度学习数据集构建模块主要按照数据集定义,将浏览关系文档内容转换为顾客-商品交互矩阵y,将浏览关系文档和商品关系文档内容转换为商品知识图谱g。
45.基于上述数据集,顾客-商品推荐问题可抽象为顾客-商品交互关系的预测问题,即给定y和g,以及,预测。而推荐算法的任务即要构建一个如式(1)所示的预测函数模型。
46.式中, 即u与v的交互关系(即浏览)预测值,即函数f的参数集。
47.深度学习推荐算法库配置,ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法是式(1)中函数f的生成程序,它们由带参数集的神经网络组成,每一算法有一个特定的神经网络结构,并通过深度学习获得参数集。
48.本模块主要对这些算法运行时所需的上下文参数进行统一配置。包括:训练数据路径,即商品关系文档和浏览关系文档的访问路径;训练结果输出路径;各算法的超参数,包括:学习率、神经网络层数、各层神经元节点数等,以及各算法的个性化参数。深度学习任务启动和推荐结果导出,根据需要按照一定的调度策略(如每周一次)启动深度学习任务,学习任务完成后,即生成了一个新的顾客-商品浏览概率预测函数f,基于此函数即可计算出y中任意(u,v)对的浏览概率,越大表示顾客u对商品v的潜在兴趣越大。对于每一个顾客u而言,按照对商品v进行排序,并过滤掉y
uv
=1的商品,则排在前面的k个商品即可视为u的推荐商品集。
49.因为顾客和商品规模数量较大,两者组合数量会超过10亿,在线计算会有明显延时,所以采用离线计算的方式进行推荐,即根据函数f进行后台计算,一次性生成所有顾客的离线推荐商品列表,并将结果存储为文本文件,内容格式如:顾客1:商品11,商品12,商品13,

,商品1k;顾客2:商品21,商品22,商品23,

,商品2k;顾客3:商品31,商品32,商品33,

,商品3k;更为优选的,所述推荐算法模型包括预测函数模型,其中预测函数模型为:,其中,u为顾客信息,u为顾客
矩阵,且u={u1,u2,

,um},v为商品信息,v为商品矩阵,且v={ v1,v2,

,vn },即函数f的参数集,为u和v的浏览预测值;图4是本发明实施例公开的推荐算法模型构建的流程示意图,如图4所示,所述推荐算法模型通过如下步骤构建得到:s1031:通过随机初始化向量或者trans嵌入表示算法对商品关系图谱模型中的实体和关系表示为d维嵌入向量;s1032:通过领域信息传播和聚合器来修正实体和关系的嵌入向量以得到最终领域表示vu;其中,利用邻居信息的线性组合来刻画商品的领域信息;s1033:基于顾客信息u和最终领域表示vu定义浏览概率预测函数,并通过交叉熵函数来进行模型计算直至满足设定条件以完成推荐算法模型的构建,所述交叉熵函数为:,其中,yi表示顾客商品交互矩阵y中(u,v)对实际的浏览关系,为预测的(u,v)对浏览概率,u为顾客信息,v为商品信息。
50.在本发明实施例中,为了进一步阐述深度学习算法在系统框架中的工作机理,这里以kgcn(knowledge graph convolutional networks)深度学习算法为例,阐述基于知识图谱深度学习的推荐算法计算过程。
51.在本发明实施例中kgcn深度学习所需的数据集顾客-商品交互矩阵y和知识图谱g已构建,kgcn的基本思想是:采用随机初始化向量或trans系列图嵌入表示算法,将g中的实体(包括顾客、商品、店铺、商品属性等所有实体)和关系表示为d维嵌入向量(d由人工设定),然后通过邻域信息传播和聚合来修正实体和关系的嵌入向量。以下如无特别说明,参与计算的实体和关系符号均为其嵌入向量。上述算法主要有如下两个特点:可以通过聚合邻居信息,更好地捕捉局部邻域结构并储存在各个实体中;邻居实体之间的聚合权重取决于特定的顾客u和关系r,既表征了g的语义信息又体现了顾客对关系的个性化兴趣。
52.其算法结构如图7所示。如式(1)所示,kgcn的前向计算过程的输入为一个顾客-商品对(u,v),以及顾客-商品交互矩阵y、知识图谱g和算法参数集,输出为顾客u对商品v 的浏览概率。
53.具体的,首先定义顾客u与关系r的偏好得分函数,如式(2)所示,用于刻画顾客对商品关系的偏好程度,如纺织品电商平台中,顾客有的偏好材质,有的偏好用途;则具体偏好公式如下:式中,表示u对r的偏好得分,g为偏好函数,一般选择内积函数,即计算u和r的嵌入向量内积,两者越相似,则内积值越大,偏好得分越高。
54.然后利用邻居信息的线性组合来刻画商品v的邻域信息,定义为式(3):
式中r
ve
表示商品v和顾客实体e之间的关系,这里的实体g中实体,包括商品本身,还有店铺、顾客、商品属性实体等,表示所有和v直接相连的实体的集合。为的归一化表示,计算如式(4)所示;为了避免某个结点v存在过多邻居而导致邻域信息计算压力过大,可以在输入参数中增加一个超参数k,如果v的邻居数超过k,则只选取k个邻居进行计算,而不是其全部邻居,使得每个批次的计算模式保持稳定。
55.此时v的邻域表示记作,且满足如式(5)所示的条件。
56.kgcn层最后一步是将商品节点v的向量表示及其邻域表示聚合为单个向量,这里的v的向量就是在前一轮迭代更新产生的向量,可以从以下三种聚合器选择一个来进行计算。
57.求和聚合(sum),将两个表示向量相加,然后进行非线性变换,如式(6)所示,拼接聚合(concat),将两个表示向量拼接,如维度都为d的两个向量,拼接后维度为2d,然后进行非线性变换,如式(7):邻居聚合(neighbor),将商品v的邻域表示作经非线性变换后输出,如式(8):上式中σ()是非线性激活函数,如relu,sigmoid,w就是线性变换矩阵,b是偏置项,是gcn一个全连接层的基本元素,也是算法参数集的组成部分,其需要通过学习获取。
58.对于上面的计算过程,有如图8所示的示例。
59.上图中假定k= 2,在kgcn模型中知识图谱g中的关系的表示都为无向边,图中蓝色
结点为商品实体v,h = 1为其一阶邻居,h = 2为其二阶邻居,蓝色箭头为信息传递的方向,训练的过程就是商品v不断聚合其h阶邻居信息的过程,其一阶聚合如图9所示。
60.设k = 4,绿圈为邻域表示,蓝圈为聚合后的表示。在迭代的过程中,比如对于第 h+1 次迭代,就是用第h次迭代时得到的实体e的向量表示作为初始值,再更新计算当前商品v的邻域表示,再与第h次的邻域表示进行聚合,得到第 h+1 次v的邻域表示,以下假定v的最终邻域表示为向量vu。最后,则基于u和vu定义浏览概率预测函数,这里采用sigmoid函数作为预测函数,如式(9)所示:在模型学习中,损失函数定义为交叉熵函数,如式(10):式中,yi表示交互矩阵y中(u,v)对实际的浏览关系,有为1,没有为0, 为预测的(u,v)对浏览概率,log为对数函数。
61.具体的算法的学习过程可描述为:input :知识图谱g,评分矩阵y ,模型学习参数的集合;output:预测函数 ;
ꢀꢀꢀꢀ
while kgcn未收敛 do # 模型没有收敛一直训练;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
for in y do # 将评分矩阵中的信息输入到模型中;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
# 得到 的邻域;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
get-receptive-field();for h = 1,

,h do # 迭代次数;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
for
ꢀꢀ
do
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
# 计算邻域的表示;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
# 将自身表示和邻域表示聚合;

; # 得到的最终表示;; # 求预测值;
ꢀꢀꢀꢀ
return ;
ꢀꢀꢀꢀ
function get-receptive-field()
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
# 以逐层迭代的方式计算的领域;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
for h = h-1,

,0 do
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
for
ꢀꢀ
do
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
return
ꢀꢀ
更为优选的,所述推荐算法模型为ripplenet推荐模型、kgcn推荐模型、kgat推荐模型、ckan推荐模型中的任意一种;且各个推荐模型均保存有相应的神经网络参数;和/或,所述聚合器为求和聚合、拼接聚合和邻居聚合中的任意一种;和/或,所述推荐方法采用离线计算的方式来进行推荐操作,根据预先构建完成的知识图谱和推荐算法模型进行后台计算,一次性生成所有顾客的离线推荐列表,并将结果存储为文本文件;和/或,在所述推荐方法中商品关系图谱模型和推荐算法模型均部署于一gpu深度学习服务器中,所述应用接口部署在一web服务器中。上述知识图谱构建、深度学习、应用接口等三个模块可以独立部署在不同的服务器上,根据计算特点,建议前两个模块部署在一台gpu深度学习服务器中,应用接口部署在一台web服务器中,部署如图11所示。
62.如图10所示,顾客u1浏览了i1,i2,i3这三件产品,u2浏览了i3,i4这两件产品,u3只浏览了i5这一件产品。如果采用商品协同过滤推荐算法,那么i4这件产品会被推荐给u1,而i5则不会被推荐。由图蓝色虚线框中可以看到u1浏览的i3和没有浏览过的i5的关系r3都指向e2,从推荐角度上看,i5应该有一定的推荐价值。但是由于没有知识图谱的嵌入,基线算法忽略了较多的辅助信息,推荐效果不太合理。
63.kgcn模型结合了知识图谱的辅助特性,在个性化推荐上有较不错的效果。该模型会根据顾客对于每个关系的关注度赋予一个权重,它会根据这个权重有偏向性地进行邻居聚合。如上图所示,由于u1浏览了i1,i2,i3这三件产品中,前两件产品有共同关系(r2),第三个产品则单独一个关系(r3),那么可以认为u1更加在意产品的主要用途,那么完全可以给顾客推荐一些以e1为属性的产品,如图中的产品i4,推荐概率大。在产品的r3,r4这两个
关系上相对而言顾客可能没那么在乎,那么会推荐如图中的产品i5,但是相比推荐力度会小。对于完整知识图谱而言,产品之间的关系丰富,预测得分的计算流程也会更加复杂,最终的推荐产品也会更加多样化。
64.因为纺织品电子商务平台中店铺、商品、浏览日志在动态更新,为了保证推荐的有效性,建立数据更新策略,定期同步顾客、商品和浏览日志,定期学习,如每周学习一次,更新顾客离线推荐商品列表。
65.基于轻纺网数据,运行知识图谱构建模块,实现了商品属性关系构建和顾客-商品关系构建,导出了实体关系rdf三元组文件。为了实现知识图谱的可视化呈现,利用工具将rdf三元组导入到neo4j图数据库实例中,再利用neo4j图形展示工具浏览知识图谱,示例如图12所示。
66.在深度学习服务器中部署了ripplenet,kgcn,kgat,ckan等知识图谱深度学习算法,按照数据集构建、推荐算法库配置、任务启动和推荐结果导出的逻辑进行运行,最终获得推荐结果,并计算出了个算法的性能,表1展示了各算法的最终推荐性能。图13展示了各算法推荐准确率(acc)随学习迭代次数(epoch)的变化曲线。
67.表1 深度学习算法的推荐性能从表1可以看出,深度算法之间的总体性能有差异,如kgat算法的acc比ckan算法高出0.0584,说明采用多种推荐算法是有必要的。从曲线中可以看出各算法的收敛速度,kgat虽然收敛速度较慢,但能得到良好的结果。
68.采用用户协同过滤(user-cf)、商品协同过滤(item-cf)和奇异矩阵分解模型(biassvd),以顾客-商品交互矩阵y为输入进行学习,所得的acc指标如表2所示。
69.表2 传统算法的推荐性能从表中可以看出,三种传统算法的推荐准确率非常低,与深度学习算法差距巨大。表明仅依赖信息稀疏的浏览日志无法实现有效的推荐,而通过知识图谱构建商品信息关联,并据此进行深度学习,是解决信息稀疏推荐问题的有效途径。
70.本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
71.实施例二请参阅图16,图16是本发明实施例公开的基于知识图谱深度学习的电子商务推荐
系统的结构示意图。如图16所示,该基于知识图谱深度学习的电子商务推荐系统可以包括:接收模块21:用于接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;实体抽取模块22:用于将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;推荐模块23:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
72.本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
73.实施例三请参阅图17,图17是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是手机、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。如图17所示,该电子设备可以包括:存储有可执行程序代码的存储器510;与存储器510耦合的处理器520;其中,处理器520调用存储器510中存储的可执行程序代码,执行实施例一中的基于知识图谱深度学习的电子商务推荐方法中的部分或全部步骤。
74.本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于知识图谱深度学习的电子商务推荐方法中的部分或全部步骤。
75.本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于知识图谱深度学习的电子商务推荐方法中的部分或全部步骤。
76.本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于知识图谱深度学习的电子商务推荐方法中的部分或全部步骤。
77.在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
78.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
79.另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是
各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
80.所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
81.在本发明所提供的实施例中,应理解,“与a对应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。
82.本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(read-only memory,rom)、随机存储器(random access memory,ram)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子抹除式可复写只读存储器(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
83.以上对本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法、系统、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1