基于事件序列的商品推荐方法、系统、设备及存储介质与流程

文档序号:33123378发布日期:2023-02-01 04:25阅读:33来源:国知局
基于事件序列的商品推荐方法、系统、设备及存储介质与流程

1.本发明涉及推荐技术领域,具体涉及基于事件序列的商品推荐方法、系统、设备及存储介质。


背景技术:

2.现有的商品推荐算法,在搜集和统计用户基础属性和行为数据之后,可以给用户推荐其可能短期内需求的商品和服务。然而,这些推荐算法需要用户更新行为记录才能跟进用户可能存在的购物需求。如果用户长期没有使用过产品或者没有更多有分析价值的交互行为,推荐算法就不能准确的跟踪用户的真实需求。当用户较长时间没有打开平台,例如3个月或3个月以上时间,上述推荐算法对用户认知仍旧停留在之前的阶段,不能有效推荐商品以满足用户真实需求,甚至此类推荐算法中的部分计算会随时间衰退,使得算法预测准确性大大降低,降低了商品推荐成功率,无法满足用户的真实需求。


技术实现要素:

3.因此,本发明提供了基于事件序列的商品推荐方法、系统、设备及存储介质,能够在更长尺度上连续给用户提供高相关性的商品,提高商品推荐的有效性,满足用户的真实需求,提升用户的体验感,以解决上述背景技术中提出的问题。
4.为达到上述目的,本发明提供如下技术方案:第一方面,本发明实施例提供一种基于事件序列的商品推荐方法,包括:基于电商平台内用户操作行为及运营策略确定锚点商品权重信息和行为权重信息;通过获取电商平台内用户对锚点商品的历史操作行为数据,来构建事件序列;对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据;将训练数据、锚点商品权重信息和行为权重信息输入神经网络模型进行训练,并将训练好的模型参数保存;将用户对锚点商品预设时间段内的操作行为数据输入训练好的神经网络模型,得到商品推荐列表;将商品推荐列表与电商平台的业务逻辑和运营策略进行融合,得到最终商品推荐列表,并对列表中商品进行推荐。
5.可选地,操作行为数据,包括:用户信息、商品信息、用户行为及上下文信息;用户信息,包括:用户名称、用户年龄、用户生命周期价值、用户消费金额和用户留存时间;商品信息,包括:商品名称、商品类目、商品价格和关联推荐商品类目;用户行为,包括:购买、搜索、浏览和加购物车;上下文信息,包括:时间、用户设备和网络信息。
6.可选地,标准化处理,包括:通过哈希处理使数据统一;通过分段/分桶处理使数据分布均匀;通过log变换对异常数据进行处理。
7.可选地,对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据的过程,包括:选取事件序列s中任一用户n操作行为数据,记为sn=[x1,x2,x3,
···
,xi],其中,xi为事件序列中用户n的一条操作行为数据;根据事件序列中操作行为的前后关系,构建训练数据t={history_action, next_action},其中,history_action为当前已执行的操作行为,next_action为下一待操作行为,则训练数据t为:t1={history_action=[x1], next_action=x2}t2={history_action=[x1, x2], next_action=x3}t3={history_action=[x1, x2, x3], next_action=x4}
···
t
i-1
={history_action=[x1,x2,x3,
···
,x
i-1
], next_action=xi}。
[0008]
可选地,神经网络模型,包括:输入层、嵌入层、加权处理层、特征拼接层及输出层,其中:嵌入层对输入层输入的训练数据、锚点商品权重信息和行为权重信息进行转化得到嵌入特征向量,嵌入特征向量分别进入加权处理层和特征拼接层,通过特征拼接层获得所有嵌入特征向量,并通过输出层输出商品推荐列表。
[0009]
可选地,加权处理层,包括:多个依次连接的激活函数层、权重层、加权嵌入层及累加池化层,其中:进入激活函数层的数据为操作行为数据中商品信息和行为权重信息经嵌入层转化处理后嵌入特征向量,通过权重层进行加权处理,得到权重高的嵌入特征向量保存至加权嵌入层,再通过累加池化层保留所有权重高的嵌入特征向量。
[0010]
可选地,嵌入特征向量,用于查询事件序列对应的嵌入特征向量,当神经网络模型训练好时,以键值对key-value形式保存到数据库中。
[0011]
第二方面,本发明实施例提供一种基于事件序列的商品推荐系统,包括:权重信息获取模块,用于电商平台内用户操作行为及运营策略确定锚点商品权重信息和行为权重信息;事件序列构建模块,用于通过获取电商平台内用户对锚点商品的历史操作行为数据,来构建事件序列;训练数据构造模块,用于对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据;模型训练及保存模块,用于将训练数据、锚点商品权重信息和行为权重信息输入神经网络模型进行训练,并将训练好的模型参数保存;推荐列表获得模块,用于将用户对锚点商品预设时间段内的操作行为数据输入训练好的神经网络模型,得到商品推荐列表;
推荐模块,用于将商品推荐列表与电商平台的业务逻辑和运营策略进行融合,得到最终商品推荐列表,并对列表中商品进行推荐。
[0012]
第三方面,本发明实施例提供一种计算机设备,包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行本发明实施例第一方面的一种基于事件序列的商品推荐方法。
[0013]
第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行本发明实施例第一方面的一种基于事件序列的商品推荐方法。
[0014]
本发明技术方案,具有如下优点:本发明提供的基于事件序列的商品推荐方法、系统、设备及存储介质,方法包括:基于电商平台内用户操作行为及运营策略确定锚点商品权重信息和行为权重信息;通过获取电商平台内用户对锚点商品的历史操作行为数据,来构建事件序列;对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据;将训练数据、锚点商品权重信息和行为权重信息输入神经网络模型进行训练,并将训练好的模型参数保存;将用户对锚点商品预设时间段内的操作行为数据输入训练好的神经网络模型,得到商品推荐列表;将商品推荐列表与电商平台的业务逻辑和运营策略进行融合,得到最终商品推荐列表,并对列表中商品进行推荐。本发明能够在更长尺度上连续给用户提供高相关性的商品,提高商品推荐的有效性,满足用户的真实需求,提升用户的体验感。
附图说明
[0015]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]
图1本发明实施例中提供的基于事件序列的商品推荐方法的流程图;图2本发明实施例中提供的神经网络模型的结构示意图;图3本发明实施例中提供的加权处理层的结构示意图;图4本发明实施例中提供的基于事件序列的商品推荐系统的模块组成图;图5本发明实施例中提供的计算机设备一个具体示例的组成图。
具体实施方式
[0017]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分的实施例,不是全部的实施例,而并非要限制本发明公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要的混淆本发明公开的概念。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0018]
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构
成冲突就可以相互结合。
[0019]
实施例1本发明实施例提供一种基于事件序列的商品推荐方法,如图1所示,该方法包括以下步骤:步骤s1:基于电商平台内用户操作行为及运营策略确定锚点商品权重信息和行为权重信息。
[0020]
具体地,在电商系统中,由于商品持续增加,其种类、名称和各种标签数据也随之不断变化,此背景下无法有效收敛数据范围,不利于数据处理和数据抽象,更不利于算法模型学习和识别,故引入锚点商品来简化模型复杂度,加强模型学习性能。
[0021]
锚点商品是行业专家人工标注的一批常见的、电商系统中占比重、分类标签等元数据完备的特定商品列表。行业专家通过平台数据,如商品收藏、加购、回购等行为数据选出具体品类里的top k的商品,并依据实际商品平台运营策略确定锚点商品。例如,对于酱油这个品类的商品,海某酱油-味极鲜就可以确定为一个锚点商品,依据的是与其相似的商品,包括:某李记味极鲜、老字号味极鲜及其他同类商品,在收藏、加购、回购等行为数据上都略逊色于它,故海某酱油-味极鲜为锚点商品,仅作为举例说明,不以此为限。
[0022]
锚点商品可以有效刻画用户购买商品的偏好,其权重信息如下表所示:其中,上述表格统计记录了商品平台内锚点商品相关信息,包括:细分品类、推荐商品品类(需说明的是该品类下的所有商品都属于锚点商品的相关推荐商品)、对应事件序列中时间及锚点商品的权重信息,以上仅作为举例说明,依据实际电商平台做适应性修改。
[0023]
以锚点商品1为例,其对应行为权重信息如下表所示:
其中,上述表格主要统计记录商品平台内锚点商品对应用户不同行为类型的权重信息,依据实际电商平台内的用户消费变化做适应性修改。
[0024]
步骤s2:通过获取电商平台内用户对锚点商品的历史操作行为数据,来构建事件序列。
[0025]
本实施例中,操作行为数据,包括:用户信息、商品信息、用户行为及上下文信息。其中,用户信息,包括:用户名称、用户年龄、用户生命周期价值、用户消费金额和用户留存时间;商品信息,包括:商品名称、商品类目、商品价格和关联推荐商品类目;用户行为,包括:购买、搜索、浏览和加购物车;上下文信息,包括:时间、用户设备和网络信息。
[0026]
步骤s3:对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据。
[0027]
本实施例中,标准化处理,包括:通过哈希处理使数据统一;通过分段/分桶处理使数据分布均匀;通过log变换对异常数据进行处理。具体地,通过上述标准化处理后,有助于简化模型输入数据量及优化模型训练。
[0028]
一具体实施例中,对操作行为数据的标准化处理如下表所示:
其中,上述表格主要记录了输入神经网络模型中输入数据的标准化处理的相关信息,包含不同操作行为数据的处理方式和模型中字段表示等内容,仅作为举例说明,不以此为限制。
[0029]
本实施例中,对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据的过程,包括:选取事件序列s中任一用户n操作行为数据,记为sn=[x1,x2,x3,
···
,xi],其中,xi为事件序列中用户n的一条操作行为数据;具体地,xi为上述操作行为数据的标准化处理表格中任一条行数据。
[0030]
根据用户操作行为时间上的先后顺序,可知用户n在事件序列[x1]发生后,发生行为x2,事件序列[x1,x2]发生后,发生行为x3,以此类推,得到事件序列对应前后关系为[x1,x2,x3,
···
,x
i-1
]≥xi;根据事件序列中操作行为的前后关系,构建训练数据t={history_action, next_action},其中,history_action为当前已执行的操作行为,next_action为
下一待操作行为,则训练数据t为:t1={history_action=[x1], next_action=x2}t2={history_action=[x1, x2], next_action=x3}t3={history_action=[x1, x2, x3], next_action=x4}
···
t
i-1
={history_action=[x1,x2,x3,
···
,x
i-1
], next_action=xi}。
[0031]
具体地,训练数据为t1,t2···
t i-1
,对所有用户都进行分片处理得到总的训练数据。
[0032]
步骤s4:将训练数据、锚点商品权重信息和行为权重信息输入神经网络模型进行训练,并将训练好的模型参数保存。
[0033]
本发明实施例提供的神经网络模型的结构,如图2所示,包括:输入层、嵌入层、加权处理层、特征拼接层及输出层。其中,嵌入层对输入层输入的训练数据、锚点商品权重信息和行为权重信息进行转化得到嵌入特征向量,嵌入特征向量分别进入加权处理层和特征拼接层,通过特征拼接层获得所有嵌入特征向量,并通过输出层输出商品推荐列表。
[0034]
具体地,输入层数据包括:标准化处理后的事件序列中的用户信息、商品信息(需要说明的是其中包含商品权重信息)、用户行为(需要说明的是该信息为用户行为的权重信息)及上下文信息。数据经过嵌入层后得到嵌入特征向量,即经嵌入层embedding后得到embedding数据。例如,训练数据中的用户名称(用户id)经标准化处理后为101011,对应的模型结构中嵌入层特征向量为embedding101011;用户年龄为27岁,标准化处理后为5,得到embedding5的嵌入特征向量,由此可以得到所有用户信息特征数据的embedding集合,并对所有embedding进行拼接得到用户信息的特征集合输入特征拼接层。
[0035]
具体地,商品信息,例如用户购买铁锅、收藏酱油的行为序列,可以构建相应的商品embedding信息,通过拼接序列:embedding铁锅+embedding铁锅类目(厨具)+embedding铁锅价格+...,得到商品信息的特征集合。行为权重表中的权重信息参数,例如用户购买铁锅和购买酱油对应购买的行为权重参数分别为4和7,则对应的embedding为embedding4和embedding7的拼接,得到用户行为的特征集合。上下文信息信息,例如用户购买铁锅和购买酱油时上下文信息分别为(20221011-17:55:00,android,wifi)和(20221013-22:15:30,ios,5g),对应的embedding时间、embedding设备信息、embedding网络信息的拼接,得到上下文信息的特征集合。以上仅作为举例说明,不以此为限制。
[0036]
如图3所示,加权处理层,包括:多个依次连接的激活函数层(activation unit)、权重层(weight)、加权嵌入层(embedding)及累加池化层。其中,进入激活函数层(activation unit)的数据为操作行为数据中商品信息和行为权重信息经嵌入层转化处理后嵌入特征向量,通过权重层(weight)进行加权处理,得到权重高的嵌入特征向量保存至加权嵌入层(embedding),再通过累加池化层保留所有权重高的嵌入特征向量。
[0037]
具体地,激活函数层(activation unit)给神经网络模型引入非线性因素,使得神经网络能够很好的解决较复杂问题,提高模型泛化性。具体地,激活函数层(activation unit),包括:修正线性单元(rectified linear unit,relu)激活函数、sigmoid激活函数和tanh激活函数,仅作为举例说明,不以此为限制,依据实际应用场景做适应性修改。权重层(weight)主要包含商品的权重信息和行为权重信息。需要说明的是,如果用户是从购物车
中移除商品,则降低用户在该事件序列的中概率,即调整降低相应权重;此外,统计事件序列中商品的交互概率,如果低于一定值,也降低用户在该事件序列的概率,反之增加;权重会随商品及相关行为的变更而不断迭代变更。
[0038]
一具体实施例中,对商品信息(包含商品权重)和行为权重信息做加权处理,即对于不同商品不同权重,取相似度更高的商品并对其embedding信息进行加权。例如,事件序列中商品铁锅和酱油的购买行为权重分别是5和7,其对应商品权重分别是是1和4,根据铁锅和酱油的相似度,将购买行为权重和对应商品权重进行相乘后得到对乘权重值,以达到对于行为权重和商品权重在特定序列中不同程度的加权效果,由此保留对乘权重值大的商品,即酱油的embedding商品信息并输入累加池化层。对于加权后的embedding商品信息再进行累加池化,用于保留所有权重高的embedding商品信息。
[0039]
本实例中,嵌入特征向量(embedding信息),用于查询事件序列对应的嵌入特征向量,当神经网络模型训练好时,以键值对key-value形式保存到数据库中。
[0040]
本实例中,特征拼接层,用于将嵌入特征向量(embedding信息)和相应的加权处理后的权重高的embedding商品信息统一拼接在一起,输入到神经网络模型中的输出层进行分类预测。如图2所示,输出层,包括:2层dice网络(使用prelu激活函数)及softmax层。其中,dice和softmax均为神经网络中的通用组件,没有做特殊的定制和优化,依据实际需要做适应性修改。
[0041]
综上,将模型构建完成后,通过输入数据,进行训练得到最优的模型。一具体实施例中,训练数据为一个月的用户操作行为数据集,约2000万条记录,通过模型训练,最终拟合后模型的auc曲线为83.2%,准确率acc为93.2%。其中,auc(area under curve)曲线被定义为roc曲线,即受试者工作特征曲线(receiver operating characteristic curve,roc)下与坐标轴围成的面积。在神经网络中,常使用auc值作为模型的评价标准,用于说明哪个分类器的效果更好,对应auc更大的分类器效果更好。auc的取值范围在0.5和1之间,auc越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。需要说明的是,上述模型拟合结果受实际训练数据集数据分布影响,可能会有略有偏差。
[0042]
步骤s5:将用户对锚点商品预设时间段内的操作行为数据输入训练好的神经网络模型,得到商品推荐列表。
[0043]
具体地,商品推荐列表是根据用户近期行为数据、商品权重信息表和行为权重信息,通过训练好的神经网络模型进行模型预估计算,得到模型预估的可能适合推荐的用户偏好的锚点商品概率分布top k商品结果集合。例如,用户近期行为数据是收藏铁锅、购买锅铲和购买食盐,预估其对所有锚点商品的购买概率分布如何,即下一个购买的商品最大概率是什么。此外,在未来某一时刻,不超过整个事件序列的时间长度,无需用户直接交互,也可以给用户推荐事件序列上的相关商品。
[0044]
步骤s6:将商品推荐列表与电商平台的业务逻辑和运营策略进行融合,得到最终商品推荐列表,并对列表中商品进行推荐。
[0045]
本实施例中,根据模型预估得到的商品推荐列表与商品平台内的相关业务的业务逻辑和运营策略配置等做融合,用以综合优化推荐列表。例如,对于用户a的事件序列为加购某拖鞋、购买某食用油和购买某李记蚝油,模型预估结果的锚点商品是海某酱油-味极鲜,根据业务逻辑和运营策略配置的海某酱油-味极鲜相应的推荐结果是某李记酱油和福
某辣椒酱,则最终商品推荐列表为某李记酱油和福某辣椒酱。综上,业务逻辑和运营策略配置会随商品变更而不断迭代变更,均属于正常业务流程。
[0046]
需要说明的是,以上仅作为举例说明本发明实施例提供的推荐方法的实现流程,不以此为限。
[0047]
通过本发明实施例提供的基于事件序列的商品推荐方法,增加了推荐算法的维度,能够在更长尺度上连续给用户提供高相关性的商品,提高整体推荐成功率,满足用户的真实需求,提升用户的体验感。
[0048]
实施例2本发明实施例提供一种基于事件序列的商品推荐系统,如图4所示,包括:权重信息获取模块,用于电商平台内用户操作行为及运营策略确定锚点商品权重信息和行为权重信息;此模块执行实施例1中的步骤s1所描述的方法,在此不再赘述。
[0049]
事件序列构建模块,用于通过获取电商平台内用户对锚点商品的历史操作行为数据,来构建事件序列;此模块执行实施例1中的步骤s2所描述的方法,在此不再赘述。
[0050]
训练数据构造模块,用于对标准化处理后的事件序列中每个用户的操作行为数据做分片处理得到训练数据;此模块执行实施例1中的步骤s3所描述的方法,在此不再赘述。
[0051]
模型训练及保存模块,用于将训练数据、锚点商品权重信息和行为权重信息输入神经网络模型进行训练,并将训练好的模型参数保存;此模块执行实施例1中的步骤s4所描述的方法,在此不再赘述。
[0052]
推荐列表获得模块,用于将用户对锚点商品预设时间段内的操作行为数据输入训练好的神经网络模型,得到商品推荐列表;此模块执行实施例1中的步骤s5所描述的方法,在此不再赘述。
[0053]
推荐模块,用于将商品推荐列表与电商平台的业务逻辑和运营策略进行融合,得到最终商品推荐列表,并对列表中商品进行推荐。此模块执行实施例1中的步骤s6所描述的方法,在此不再赘述。
[0054]
通过本发明实施例提供的基于事件序列的商品推荐系统,能够提高商品推荐的有效性,推荐用户更感兴趣的商品,通过实现个性化推荐满足用户的真实需求,提升用户的体验感。
[0055]
实施例3本发明实施例提供一种计算机设备,如图5所示,包括:至少一个处理器501,至少一个通信接口503,存储器504和至少一个通信总线502。其中,通信总线502用于实现这些组件之间的连接通信,通信接口503可以包括显示屏和键盘,可选通信接口503还可以包括标准的有线接口、无线接口。存储器504可以是高速易挥发性随机存取存储器,也可以是非不稳定的存储器,还可以是至少一个位于远离前述处理器501的存储装置。其中处理器501可以执行实施例1的基于事件序列的商品推荐方法。存储器504中存储一组程序代码,且处理器501调用存储器504中存储的程序代码,以用于执行实施例1的基于事件序列的商品推荐方法。
[0056]
其中,通信总线502可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。通信总线502可以分为地址总线、数据总线、控制总线等。
为便于表示,图5中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
[0057]
其中,存储器504可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,简称ram);存储器也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flash memory),硬盘(hard disk drive,简称hdd)或固降硬盘(solid-state drive,简称ssd);存储器504还可以包括上述种类的存储器的组合。
[0058]
其中,处理器501可以是中央处理器(central processing unit,简称cpu),网络处理器(network processor,简称np)或者cpu和np的组合。
[0059]
其中,处理器501还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,简称asic),可编程逻辑器件(programmable logic device,简称pld)或其组合。上述pld可以是复杂可编程逻辑器件(complex programmable logic device,简称cpld)、现场可编程逻辑门阵列(field programmable gate array,简称fpga)、通用阵列逻辑(generic array logic,简称gal)或其任意组合。
[0060]
可选地,存储器504还用于存储程序指令。处理器501可以调用程序指令,实现如本发明执行实施例1中的基于事件序列的商品推荐方法。
[0061]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行实施例1的基于事件序列的商品推荐方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read only memory,简称rom)、随机存储记忆体(random access memory,简称ram)、快闪存储器(flash memory)、硬盘(hard disk drive,简称hdd)或固降硬盘(solid state drive,简称ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0062]
显然,上述实施例仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1