信息处理方法、信息处理装置、存储介质和电子设备与流程

文档序号:24502155发布日期:2021-03-30 21:31阅读:89来源:国知局
信息处理方法、信息处理装置、存储介质和电子设备与流程

本发明涉及数据处理技术领域,具体涉及一种信息处理方法、信息处理装置、存储介质和电子设备。



背景技术:

随着计算机技术领域以及互联网技术领域的不断发展,越来越多的用户选择通过线上平台发布自身的需求。以乘车需求为例,用户可以通过线上约车平台上发布乘车需求。线上约车平台通常会通过向用户发放优惠券等信息推荐方式提升用户的使用感受。但现有的信息推荐方式往往无法较好地满足用户的乘车需求,也就是说,信息推荐的准确性不足,且效率不高。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种信息处理方法、信息处理装置、存储介质和电子设备,用于提升信息推荐的准确性以及效率。

根据本发明实施例的第一方面,提供一种信息处理方法,所述方法包括:

获取用户集合中各用户的任务信息;

根据各所述任务信息确定多个标签集合以及各所述标签集合对应的用户分组,各所述标签集合均包括至少一个行为标签;

基于概率预测模型,确定各用户对应的多个用户转化概率,各所述用户转化概率用于表征用户相对于不同标签集合的转化概率;

根据各所述用户转化概率确定各用户分组对应的推荐信息的推荐信息向量。

根据本发明实施例的第二方面,提供一种信息处理装置,所述装置包括:

任务信息获取单元,用于获取用户集合中各用户的任务信息;

分组确定单元,用于根据各所述任务信息确定多个标签集合以及各所述标签集合对应的用户分组,各所述标签集合均包括至少一个行为标签;

概率预测单元,用于基于概率预测模型,确定各用户对应的多个用户转化概率,各所述用户转化概率用于表征用户相对于不同标签集合的转化概率;

第一向量确定单元,用于根据各所述用户转化概率确定各用户分组对应的推荐信息的推荐信息向量。

根据本发明实施例的第三方面,提供一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。

根据本发明实施例的第四方面,提供一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。

本发明实施例根据用户集合中各用户的任务信息确定包括至少一个行为标签的多个标签集合以及各标签集合对应的用户分组,然后基于概率预测模型确定各用户相对于不同标签集合的转化概率,并根据各用户相对于不同标签集合的转化概率确定各用户分组对应的推荐信息的推荐信息向量。本实施例的推荐信息向量根据用户的任务信息确定,因此与用户具有较高的匹配性,从而提升了信息推荐的准确性以及效率。

附图说明

通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:

图1是本发明实施例的硬件系统架构的示意图;

图2是本发明第一实施例的信息处理方法的流程图;

图3是本发明第一实施例的一种可选的实现方式中确定标签集合以及用户分组的流程图;

图4是本发明第一实施例的一种可选的实现方式中确定用户转化概率的流程图;

图5是本发明第一实施例的一种可选的实现方式中确定推荐信息向量的流程图;

图6是本发明第二实施例的信息处理方法的流程图;

图7是本发明第三实施例的信息处理装置的流程图;

图8是本发明第四实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。

此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。

除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。

在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在本发明实施例中,以推荐信息为优惠信息为例进行说明。但是本领域技术人员容易理解,根据应用场景的不同,在推荐信息为其他信息,例如餐品类推荐信息、书籍类推荐信息等时,本发明实施例的方法同样适用。

线上约车平台通常会通过向用户发放优惠券等信息推荐方式提升用户的使用感受以及用户粘度(也即,用户对于品牌或产品的忠诚、新人与良性体验等结合形成的依赖程度和再消费期望程度)。现有的优惠信息推荐方式包括按照预先设定的推荐顺序推荐优惠信息,根据优惠信息的销量、评价等推荐优惠信息,以及根据用户的历史数据推荐优惠信息,例如优先推荐用户购买过/查看过的优惠信息等。第一种方式依赖人工业务经验水平,且若优惠信息列表中优惠信息的数量较多,用户需要自己手动查找合适的优惠信息或者很难找到合适的优惠信息,信息推荐准确性以及效率均较低。第二种方式可以在一定程度上满足大部分用户的需求,但无法较好地满足另一部分用户的需求,因此信息推荐的准确性较低。第三种方式相较于前面两种方式具有更高的准确性,但在优惠信息数量较多或者用户的历史数据较为缺乏的情况下,信息推荐的准确性同样不高。

图1是本发明实施例的硬件系统架构的示意图。图1所示的硬件系统架构可以包括至少一个终端11、至少一个平台侧服务器(下述也即服务器)12以及至少一个终端13,图1以一个终端11、一个服务器12以及一个终端13为例进行说明。终端11以及终端13可以为不同用户的用户终端,也可以为相同用户的用户终端,且终端11以及终端13均可以通过网络与服务器12进行通信连接。用户通过终端11在线上约车平台发布约车需求。服务器12基于线上约车平台获取到用户的约车需求后,可以根据用户的约车需求生成约车订单,并将约车订单分配给至少一个任务处理方(也即,司机)以对用户提供服务。同时,服务器12还可以对用户产生的约车订单的订单信息(也即,任务信息)进行存储,以在后续根据订单信息为用户推荐优惠信息。

在本发明实施例中,服务器12可以获取用户集合中各用户的任务信息,并根据各任务信息确定多个标签集合,以及各标签集合对应的用户分组。在确定多个标签集合以及用户分组后,服务器12可以基于概率预测模型,确定各用户相对于不同标签集合的转化概率,然后根据各用户相对于不同标签集合的转化概率确定各用户分组对应的推荐信息的推荐信息向量。

在确定各用户分组对应的推荐信息的推荐信息向量后,用户在通过终端13向服务器12发送信息推荐指令时,服务器12可以获取该用户的用户向量,并计算目标用户的用户向量与各推荐信息向量的相似度,将相似度满足预定相似度条件的推荐信息确定为目标推荐信息,从而向终端13发送目标推荐信息,以对用户进行信息推荐。

图2是本发明第一实施例的信息处理方法的流程图。如图2所示,本实施例的方法包括如下步骤:

步骤s100,获取用户集合中各用户的任务信息。

用户可以在线上约车平台注册并使用线上约车平台发布约车需求,服务器通过线上约车平台可以获取到用户的约车需求,并根据用户的约车需求生成一个约车订单以为用户提供服务。同时服务器也可以对用户产生的约车订单进行存储,例如存储在预定数据库中。在本实施例中,用户集合可以为对应线上约车平台的全部注册用户组成的集合,也可以为随机或按照预定规则确定的部分注册用户组成的集合,本实施例不做具体限定。

在本步骤中,服务器可以根据各用户标识获取用户集合中各用户的用户信息。任务信息也即用户在预定时间段内产生的至少一个订单的订单信息,具体可以包括各订单的起点位置、起点所属区域、终点位置、终点所属区域、订单发布时刻(也即,用户确认生成订单的时刻)、订单执行时刻(也即,用户开始接受服务的时刻)、日期等信息。

其中,起点所属区域和终点所属区域均指具有一定范围的地理区域,具体可以为行政区域,例如省、直辖市、自治区、自治州、县、乡、镇等,也可以为根据实际需求预先划分的地理区域,例如aoi(areaofinterest,兴趣区域)、poi(pointofinterest,兴趣点)等。aoi和poi均可以用于表征学校、地铁站、住宅区、办公区等地理区域。

在获取到各用户的任务信息后,服务器可以对任务信息进行预处理,包括去除异常值、填充缺失值、去除重复值等,以保证任务信息的准确性。

步骤s200,根据各任务信息确定多个标签集合以及各标签集合对应的用户分组。

任务信息均可以在一定程度上反映出用户在不同时间段产生的行为特征,因此在本步骤中,服务器可以根据各用户的任务信息确定多个标签集合以及各标签集合对应的用户分组。

图3是本发明第一实施例的一种可选的实现方式中确定标签集合以及用户分组的流程图。如图3所示,在一种可选的实现方式中,步骤s200可以包括如下步骤:

步骤s210,根据各任务信息确定用户集合对应的多个行为特征。

在本步骤中,服务器可以分别对各用户的任务信息进行分析,从而确定各用户在预定时间段内产生的行为特征。具体地,服务器可以根据同一用户在预定时间段内产生的部分或全部订单的订单信息确定用户的行为特征,例如确定用户的乘车规律(例如,工作日乘车、早/晚高峰乘车、周一乘车等)等。

例如,用户u1在预定时间段内发布的订单m1的订单信息包括起点位置:p1、起点所属区域:办公区o1、终点位置p2、终点所属区域:住宅区r1、任务发布时刻:18:30,任务执行时刻:18:45,以及日期:12月1日(周一),服务器可以对上述信息进行分析,确定用户u1的行为特征包括晚高峰乘车、周一乘车、工作日乘车以及乘车地人流量较大等。

步骤s220,响应于用户集合中满足行为特征的用户的数量满足预定数量条件,将行为特征确定为一个行为标签。

在本步骤中,服务器可以分别将各行为特征确定为目标行为特征,然后统计出用户集合中满足各目标行为特征的用户的数量,并在用户集合中与目标行为特征匹配的用户的数量满足预定数量条件时,将目标行为特征确定为一个行为标签。

与目标行为特征匹配的用户是指用户在预定时间段内产生过该目标行为特征,例如,目标行为特征为行为工作日乘车,用户u1对应的行为包括晚高峰乘车、工作日乘车以及乘车地人流量,则服务器可以确定用户u1为与目标行为特征匹配的用户。

预定数量条件可以被设置为用户的数量大于第一阈值,或者用户的数量相对于用户集合中用户总数量的占比(也即,用户的数量与用户总数量的比值)大于第二阈值等,本实施例不做具体限定。

例如,预定数量条件被设置为用户的数量相对于用户集合中用户总数量的占比不低于10%,用户集合包括1000个用户,其中与行为特征a1匹配的用户的数量为150人,则与行为特征a1匹配的用户的数量相对于用户集合中用户总数量的占比为15%,满足预定数量条件,因此服务器可以将行为特征a1确定为一个行为标签。

步骤s230,对各行为标签进行组合,确定多个标签集合。

在确定用户集合对应的多个行为标签后,服务器可以对各行为标签进行组合,确定多个标签集合。可选地,服务器可以将一个行为标签确定为一个标签集合,也可以将多个标签集合确定为一个标签集合,在本实施例中,以一个标签行为确定为一个标签集合为例进行说明。

步骤s240,对于各标签集合,分别将与标签集合匹配的至少一个用户确定为对应的用户分组。

行为标签是用户集合在预定时间段内产生的行为特征中的关键行为特征,产生过相同关键行为特征的用户通常具有较高的相似性,因此基于标签集合对用户进行分组可以提升推荐信息分组推荐的准确性。

在确定多个标签组合后,服务器可以根据标签组合对用户集合中的各用户进行分组。和与目标行为特征匹配的用户相似,与标签集合匹配的用户是指在预定时间段内产生过标签集合内包括的各行为标签对应的行为特征(下述也即关键行为特征)。例如,标签集合c1包括标签l1和标签l2,标签l1对应的行为特征为特征a1,标签l2对应的行为特征为特征a2,服务器可以将在预定时间段内产生过特征a1和特征a2,也即与特征a1和特征a2均匹配的用户确定为标签集合c1对应的用户分组。

在另一种可选的实现方式中,服务器可以根据各用户的用户信息确定用户集合对应的多个行为特征。并对各行为特征进行组合,得到多个标签集合。进而对于各标签集合,若用户集合中与标签集合中的行为特征匹配的用户的数量满足预定数量条件,服务器可以将该行为特征确定为该标签集合中的一个行为标签。从而对于各标签集合,服务器可以将与该标签集合中的各行为标签均匹配的至少一个用户确定为该标签集合对应的用户分组。

容易理解,由于不同标签集合中可能包括相同的行为标签,或者部分用户与多个标签集合均匹配,不同用户集合中可能包括相同的用户。

步骤s300,基于概率预测模型,确定各用户对应的多个用户转化概率。

在本实施例中,用户转化概率用于表征用户相对于不同标签集合的转化概率。用户相对于不同标签集合的转化概率是指对于各标签集合,在用户产生该标签集合中的关键行为特征的情况下,用户选择该标签集合的概率,也可以理解为,用户与各标签集合的匹配概率。

图4是本发明第一实施例的一种可选的实现方式中确定用户转化概率的流程图。如图4所示,在一种可选的实现方式中,步骤s300可以包括如下步骤:

步骤s310,获取各用户的用户信息。

在本步骤中,服务器可以根据用户标识获取各用户的用户信息。容易理解,在本实施例中,服务器可以同时获取各用户的用户信息以及任务信息,也可以分别获取各用户的用户信息以及任务信息,本实施例不做具体限定。用户信息可以包括用户的注册时间、用户终端的型号、年龄、性别等。

步骤s320,根据各用户信息以及各标签集合确定各用户的用户向量。

在本步骤中,服务器可以确定各标签集合对应的标签向量,然后将各用户信息与各标签向量进行拼接,得到各用户相对于各标签集合的用户向量。

标签向量可以通过one-hot(独热)向量来表示。具体地,服务器可以首先根据各行为标签确定标签列表,然后根据标签列表中各行为标签的排列顺序,将各标签集合的标签向量中行为标签对应的元素确定为1,并将其他元素均确定为0。

例如,标签列表包括100个行为标签,排列顺序为标签l1、标签l2、标签l3,…,标签l100,标签集合c2包括标签l10,则服务器可以确定标签集合c2的标签向量为(0,…,0,1,0,…,0),其中1为标签l10对应的元素,且1前0的数量为9个,1后0的数量为90个。

在确定各标签集合对应的标签向量后,服务器可以分别将各用户信息与各标签向量进行拼接。例如,用户u2的用户信息包括注册时间:2019.3.10,年龄:32,性别:女,则服务器可以将用户u2的用户信息与标签集合c2的标签向量进行拼接,得到用户u2的一个用户向量为(0,…,0,1,0,…,0,2019.3.10,32,1),其中用户向量为103维向量,前100维为标签向量,后3维为用户信息,用户向量的最后一个元素1用于表征用户u2的性别。

步骤s330,基于概率预测模型,根据各用户向量确定各用户相对于各标签集合的转化概率。

在本实施例中,概率预测模型可以为决策树、贝叶斯分类器、神经网络等,并根据样本集合训练获得。用于训练概率预测模型的样本集合包括多个用户的历史用户信息、标签集合以及各用户相对于不同标签集合的历史用户转化概率。可选地,在本步骤中,服务器可以不确定各用户相对于对应标签集合的转化概率,对应标签集合是指用户所属用户分组对应的标签集合。

其中,历史用户信息与用户信息相对应,也就是说,历史用户信息与用户信息包含相同的信息。历史用户转化概率可以根据用户在历史时间段内的操作记录确定,若用户在历史时间段内购买了任一标签集合对应的优惠信息,则服务器可以确定用户相对于该标签集合的历史转化概率为1,反之可以确定用户相对于该标签集合的历史转化概率为0。

在本实施例中,以概率预测模型为神经网络为例进行说明。神经网络全称人工神经网络(artificialneuralnetwork,ann),是由大量处理单元互联形成的信息处理模型。常见的人工神经网络包括卷积神经网络(convolutionalneuralnetwork,cnn)、循环神经网络(recurrentneuralnetwork,rnn)等。ann具有非线性(适于处理非线性信息)、非局限性(也即,一个系统的整体状态取决于处理单元间的相互作用)、非常定性(也即,具有自适应、自组织、自学习能力,能够在处理信息的过程中不断进行自我学习)和非凸性(模型的激活函数具有多个极值,这使得模型具有多个较为稳定的平衡态,从而使得模型的变化是多样的)的特点,因此能够广泛地应用于各种领域,进行较为准确的数据预测。

由此,在确定各用户相对于各标签集合的用户向量后,为了使得服务器可以以各用户相对于各标签集合的用户向量为概率预测模型的输入,确定各用户相对于各标签集合的转化概率。

步骤s400,根据各用户转化概率确定各用户分组对应的推荐信息的推荐信息向量。

在确定各用户相对于不同标签集合的用户转化概率后,服务器可以根据各用户转化概率确定各用户分组对应的推荐信息的推荐信息向量,以使得各用户分组对应的推荐信息向量可以更好地匹配该用户分组中的各用户。

图5是本发明第一实施例的一种可选的实现方式中确定推荐信息向量的流程图。如图5所示,本实施例的方法包括如下步骤:

步骤s410,根据同一用户分组对应的各用户转化概率确定各用户分组对应的多个分组转化概率。

在本步骤中,服务器可以确定目标用户分组以及目标标签组合,具体可以分别将用户分组确定为目标用户分组,并将各标签组合确定为目标标签组合。对于目标用户分组,服务器可以计算各用户相对于目标标签集合的用户转化概率的统计值,并将计算得到的统计值确定为目标用户分组相对于目标标签集合的分组转化概率。在本实施例中,用户转化概率的统计值可以为各用户转化概率的均值、中位数、众数等,本实施例不做具体限定。

例如,目标用户分组包括用户u1、用户u2、用户u3、用户u4和用户u4,目标标签集合为集合c2,用户u1相对于集合c2的用户转化概率为80%,用户u2相对于集合c2的用户转化概率为85%,用户u3相对于集合c2的用户转化概率为81%,用户u4相对于集合c2的用户转化概率为90%,用户u5相对于集合c2的用户转化概率为86%。在统计值为均值时,服务器可以计算用户u1、用户u2、用户u3、用户u4和用户u4相对于集合c2的用户转化概率的均值为84.4%,并将目标用户分组相对于集合c2的分组转化概率确定为84.4%。

步骤s420,对于各用户分组,根据对应的各分组转化概率确定对应的非目标标签集合。

为了保证推荐信息不仅可以覆盖到对应用户分组中用户的基本需求(也即,对应用户分组中包含的行为标签),还可以覆盖到对应用户分组中至少部分用户的更多需求,提升优惠信息与用户的匹配度,在本实施例中,优惠信息还可以根据至少一个分组转化概率满足预定概率条件的非目标标签集合确定。

在本实施例中,预定概率条件可以被设置为用户分组相对于不同行为标签的分组转化概率排序在最大的前n(n为大于等于1的预定整数)位。例如,用户分组为分组g1,分组g1对应的标签集合包括行为标签“周一早高峰出行”,在分组g1相对于不同标签集合的分组转化概率中,“周一晚高峰出行”“周二早高峰出行”以及“周五晚高峰出行”对应的分组转化概率排序在最大的前三位,则服务器可以将“周一晚高峰出行”“周二早高峰出行”以及“周五晚高峰出行”确定为分组g1对应的非目标标签集合。

步骤s430,调整各用户分组中预定用户的用户向量。

预定用户是指用户分组中与非目标标签集合匹配的用户,预定用户的用户向量为根据对应标签集合生成的用户向量。在本步骤中,服务器可以将预定用户的用户向量中,非目标标签集合对应的元素调整为1,并保持其他元素不变,以对用户向量进行调整。

例如,用户u2为分组g1中的一个预定用户,分组g1对应的标签集合为集合c2,非目标标签集合包括标签l9,用户u2的用户向量为(0,…,0,1,0,…,0,2019.3.10,32,1),则服务器可以将用户u2的用户向量中l9对应的元素调整为1,并保持其他元素不变,也即调整为(0,…,1,1,0,…,0,2019.3.10,32,1)。

步骤s440,根据同一用户分组对应的调整后的用户向量确定对应的推荐信息向量。

在本步骤中,服务器可以确定一个用户分组为目标用户分组,然后计算目标用户分组中预定用户对应的调整后的用户向量以及非预定用户对应的未调整的用户向量的统计值向量,然后将统计值向量确定为目标用户分组对应的推荐信息的推荐信息向量。在本实施例中,统计值向量可以为各用户向量的均值向量、中位数向量、众数向量等,本实施例不做具体限定。容易理解,类似地,在本步骤中,用于计算推荐信息向量的用户向量为根据对应标签集合生成的用户向量。

例如,目标用户分组为分组g1,分组g1包括用户u1、用户u2和用户u3,其中用户u1的用户向量为(0,…,0,1,0,…,0,28,1),用户u2的用户向量为(0,…,1,1,0,…,0,32,1),用户u3的用户向量为(0,…,1,1,0,…,0,30,2)。以均值向量为各用户向量的均值为例,服务器可以确定分组g1对应的推荐信息的推荐信息向量为(0,…,0.66,1,0,…,0,30,1.66)。

在确定各用户对应的用户向量以及各用户分组对应的推荐信息的推荐信息向量后,服务器可以对上述向量进行存储。且用户信息是在不断变化更新的,因此本实施例可以以第一周期(例如,每天)对用户向量进行更新,并以第二周期(例如,每周)对各用户分组对应的推荐信息的推荐信息向量进行更新,以保证信息推荐的准确性。

本实施例根据用户集合中各用户的任务信息确定包括至少一个行为标签的多个标签集合以及各标签集合对应的用户分组,然后基于概率预测模型确定各用户相对于不同标签集合的转化概率,并根据各用户相对于不同标签集合的转化概率确定各用户分组对应的推荐信息的推荐信息向量。本实施例的推荐信息向量根据用户的任务信息确定,因此与用户具有较高的匹配性,从而提升了信息推荐的准确性以及效率。

图6是本发明第二实施例的信息处理方法的流程图。如图6所示,本实施例的方法包括如下步骤:

步骤s100’,获取用户集合中各用户的任务信息。

在本实施例中,步骤s100’的实现方式和步骤s100的实现方式相似,在此不再赘述。

步骤s200’,根据各任务信息确定多个标签集合以及各标签集合对应的用户分组。

在本实施例中,步骤s200’的实现方式和步骤s200的实现方式相似,在此不再赘述。

步骤s300’,基于概率预测模型,确定各用户对应的多个用户转化概率。

在本实施例中,步骤s300’的实现方式和步骤s300的实现方式相似,在此不再赘述。

步骤s400’,根据各用户转化概率确定各用户分组对应的推荐信息的推荐信息向量。

在本实施例中,步骤s400’的实现方式和步骤s400的实现方式相似,在此不再赘述。

步骤s500’,响应于接收到信息推荐指令,获取目标用户对应的目标用户向量。

目标用户在通过用户终端(也即,目标用户终端)登陆线上约车平台,或者查看推荐信息页面等时,目标用户终端可以向服务器发送信息推荐指令。信息推荐指令通常带有目标用户终端的终端标识或者目标用户的用户标识,因此服务器在接收到目标用户终端发送的信息推荐指令后,可以根据终端标识或者用户标识获取目标用户对应的目标用户向量。在本实施例中,目标用户向量是指根据对应标签集合生成的用户向量。容易理解,目标用户可能属于多个用户分组,因此服务器可以获取目标用户对应的多个目标用户向量。

步骤s600’,确定目标用户向量与各推荐信息向量的相似度。

在本实施例中,服务器可以计算各目标用户向量与各推荐信息向量的余弦相似度、欧式距离、闵可夫斯基距离(minkowskidistance)、曼哈顿距离(manhattandistance)等作为目标用户向量与各推荐信息向量的相似度。

步骤s700’,将相似度满足预定相似度条件的推荐信息确定为目标推荐信息。

在本实施例中,根据相似度的计算方式不同,预定相似度条件也可以被设置为不同的条件,例如,在目标用户向量与各推荐信息向量的相似度为余弦相似度时,预定相似度条件可以被设置为大于(或不低于)第三阈值,或者被设置为相似度排序在最大的前m(m为大于等于1的预定整数)位,或者被设置为上述两种条件的组合;在目标用户向量与各推荐信息向量的相似度为欧式距离时,预定相似度条件可以被设置为小于(或不高于)第四阈值,或者被设置为相似度排序在最小的前i(i为大于等于1的预定整数)位,或者被设置为上述两种条件的组合。

在任一推荐信息的推荐信息向量与目标用户向量的相似度满足预定相似度条件时,可以认为该推荐信息与目标用户的匹配度较高,目标用户有较大的可能会选择该推荐信息,因此服务器可以将该推荐信息确定为目标用户对应的目标推荐信息。

步骤s800’,向目标用户终端发送目标推荐信息。

在本步骤中,服务器可以根据终端标识或者用户标识向目标用户终端发送目标推荐信息,以使得目标用户终端可以对目标推荐信息进行展示。

本实施例根据用户集合中各用户的任务信息确定包括至少一个行为标签的多个标签集合以及各标签集合对应的用户分组,然后基于概率预测模型确定各用户相对于不同标签集合的转化概率,并根据各用户相对于不同标签集合的转化概率确定各用户分组对应的推荐信息的推荐信息向量。后续,在服务器在接收到目标用户终端发送的信息推荐指令后,获取目标用户的目标用户向量,并计算目标用户向量与各推荐信息的推荐信息向量的相似度以确定目标推荐信息,从而向目标用户终端发送目标推荐信息。本实施例的推荐信息向量根据用户的任务信息确定,因此与用户具有较高的匹配性,从而提升了信息推荐的准确性以及效率。

图7是本发明第三实施例的信息处理装置的流程图。如图7所示,本实施例的装置包括任务信息获取单元71、分组确定单元72、概率预测单元73和第一向量确定单元74。

其中,任务信息获取单元71用于获取用户集合中各用户的任务信息。分组确定单元72用于根据各所述任务信息确定多个标签集合以及各所述标签集合对应的用户分组,各所述标签集合均包括至少一个行为标签。概率预测单元73用于基于概率预测模型,确定各用户对应的多个用户转化概率,各所述用户转化概率用于表征用户相对于不同标签集合的转化概率。第一向量确定单元74用于根据各所述用户转化概率确定各用户分组对应的推荐信息的推荐信息向量。

进一步地,所述装置还包括第二向量确定单元75、相似度确定单元76、推荐信息确定单元77和推荐信息发送单元78。

其中,第二向量确定单元75用于响应于接收到信息推荐指令,获取目标用户对应的目标用户向量。相似度确定单元76用于确定所述目标用户向量与各所述推荐信息向量的相似度。推荐信息确定单元77用于将所述相似度满足预定相似度条件的所述推荐信息确定为目标推荐信息。推荐信息发送单元78用于向目标用户终端发送所述目标推荐信息。

进一步地,所述分组确定单元72包括特征确定子单元、标签确定子单元、集合确定子单元和分组确定子单元。

其中,特征确定子单元用于根据各所述任务信息确定所述用户集合对应的多个行为特征。标签确定子单元用于响应于所述用户集合中与所述行为特征匹配的用户的数量满足预定数量条件,将所述行为特征确定为一个行为标签。集合确定子单元用于对各所述行为标签进行组合,确定多个所述标签集合。分组确定子单元用于对于各所述标签集合,分别将与所述标签集合匹配的至少一个用户确定为对应的所述用户分组。

进一步地,所述概率预测单元73包括用户信息获取子单元、第一向量确定子单元和概率预测子单元。

其中,用户信息获取子单元用于获取各所述用户的用户信息。第一向量确定子单元用于根据各所述用户信息以及各标签集合确定各用户的用户向量。概率预测子单元用于基于所述概率预测模型,根据各所述用户向量确定各用户相对于各所述标签集合的转化概率。

进一步地,所述第一向量确定单元74包括概率确定子单元、特征确定子单元、向量调整子单元和第二向量确定子单元。

其中,概率确定子单元用于根据同一用户分组对应的各所述用户转化概率确定各用户分组对应的多个分组转化概率,各所述分组转化概率用于表征对应用户分组相对于不同所述标签集合的转化概率。特征确定子单元用于对于各所述用户分组,根据对应的各所述分组转化概率确定对应的非目标标签集合,所述非目标标签集合为与对应标签集合不匹配的标签集合。向量调整子单元用于调整各所述用户分组中预定用户的用户向量,所述预定用户为所述用户分组中与所述非目标标签集合匹配的用户。第二向量确定子单元用于根据同一用户分组对应的调整后的所述用户向量确定对应的所述推荐信息向量。

进一步地,所述转化概率确定子单元包括分组及集合确定模块、统计值确定模块和概率确定模块。

其中,分组及集合确定模块用于确定目标用户分组以及目标标签集合。统计值确定模块用于对于所述目标用户分组,计算各用户相对于所述目标标签集合的所述用户转化概率的统计值。概率确定模块用于将所述统计值确定为所述目标用户分组相对于所述目标标签集合的所述分组转化概率。

进一步地,所述第二向量确定子单元包括分组确定模块、向量计算模块和向量确定模块。

其中,分组确定模块用于确定目标用户分组。向量计算模块用于计算各所述调整后的用户向量以及各未调整的所述用户向量的统计值向量。向量确定模块用于将所述统计值向量确定为对应的所述推荐信息向量。

进一步地,所述概率预测模型基于样本集合训练获得,所述样本集合包括多个用户的历史用户信息、标签集合以及各用户相对于不同标签集合的历史用户转化概率。

本实施例根据用户集合中各用户的任务信息确定包括至少一个行为标签的多个标签集合以及各标签集合对应的用户分组,然后基于概率预测模型确定各用户相对于不同标签集合的转化概率,并根据各用户相对于不同标签集合的转化概率确定各用户分组对应的推荐信息的推荐信息向量。后续,在服务器在接收到目标用户终端发送的信息推荐指令后,获取目标用户的目标用户向量,并计算目标用户向量与各推荐信息的推荐信息向量的相似度以确定目标推荐信息,从而向目标用户终端发送目标推荐信息。本实施例的推荐信息向量根据用户的任务信息确定,因此与用户具有较高的匹配性,从而提升了信息推荐的准确性以及效率。

图8是本发明第四实施例的电子设备的示意图。图8所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器81和存储器82。处理器81和存储器82通过总线83连接。存储器82适于存储处理器81可执行的指令或程序。处理器81可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器81通过执行存储器82所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线83将上述多个组件连接在一起,同时将上述组件连接到显示控制器84和显示装置以及输入/输出(i/o)装置85。输入/输出(i/o)装置85可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(i/o)装置85通过输入/输出(i/o)控制器86与系统相连。

其中,存储器82可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。

上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应理解,流程图和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

同时,如本领域技术人员将意识到的,本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此,本发明实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外,本发明的方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪速存储器)、光纤、便携式光盘只读存储器(cd-rom)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。

用于执行针对本发明各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如java、smalltalk、c++、php、python等;以及常规过程编程语言如“c”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(lan)或广域网(wan)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1