用户行为特征实时处理方法、装置、存储介质及电子设备与流程

文档序号:23386142发布日期:2020-12-22 13:51阅读:105来源:国知局
用户行为特征实时处理方法、装置、存储介质及电子设备与流程

本公开涉及计算机技术领域,尤其是一种用户行为特征实时处理方法、装置、计算机可读存储介质及电子设备。



背景技术:

为了预测各个用户的行为对平台价值产生的影响,目前常用的方法是在离线的状态下提取用户过去一段时间的特征数据,利用这些特征数据进行平台价值预测。但在离线数据导入的时间段内,平台上产生的数据会有大幅度的波动,直接影响企业决策,所以需要实时统计用户在多端(app、pc和m站等)发生的多种行为数据,根据统计的行为数据计算出用户实时特征,同时可以横向统计在某个行为下所有用户的实时特征。能够在用户行为发生微小变化时,实时捕捉到用户行为变化,从而为平台运营提供精准的数据支持,同时为搜索推荐等场景提供及时的优化目标和实时的策略评估。



技术实现要素:

本公开的实施例提供了一种用户行为特征实时处理方法、装置、计算机可读存储介质及电子设备。

本公开的实施例提供了一种用户行为特征实时处理方法,该方法包括:接收表征用户的实时行为的实时用户行为数据;基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新,其中,时间滑动窗口对应于第一预设时长的历史时间段,历史用户特征数据是在对历史时间段内接收的用户行为数据进行统计得到的;将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

在一些实施例中,历史用户特征数据包括第一历史用户特征数据和第二用户历史特征数据,其中,第一用户历史特征数据是目标历史时间点之前统计的数据,第二用户历史特征数据是目标历史时间点之后统计的数据;相应的,将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,包括:在目标历史时间点将第一用户历史特征数据输入用户需求预测模型,得到第一预测用户需求数据,以及响应于接收到实时用户行为数据,实时地将第二用户历史特征数据输入用户需求预测模型,得到第二预测用户需求数据。

在一些实施例中,基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新,包括:响应于从预设的延迟队列中接收到过期用户行为数据,将历史用户特征数据中的与过期用户行为数据相对应的数据删除。

在一些实施例中,用户需求预测模型包括预测子模型和计算子模型;将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,包括:将历史用户特征数据输入预测子模型,得到每个用户在未来的第二预设时长内发生预设类型的行为的概率;将概率输入计算子模型,得到预测用户需求数据。

在一些实施例中,在接收表征用户的实时行为的实时用户行为数据之后,该方法还包括:从实时用户行为数据中确定非有效用户行为数据并将非有效用户行为数据清除;对清除后剩余的实时用户行为数据进行用户标识归一化处理,得到用于计入时间滑动窗口的实时用户行为数据。

在一些实施例中,用户需求预测模型预先基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本用户特征数据,以及对样本特征数据进行标注的实际用户需求数据;将训练样本集合中的训练样本包括的样本用户特征数据作为输入,将与输入的样本用户特征数据对应的实际用户需求数据作为期望输出,训练得到用户需求预测模型。

在一些实施例中,将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,包括:确定历史用户特征数据对应的业务线;从预设的至少一个用户需求预测模型中,选择与业务线对应的用户需求预测模型;将历史用户特征数据输入选择的用户需求预测模型,得到预测用户需求数据。

在一些实施例中,该方法还包括:将预测用户需求数据进行可视化输出。

根据本公开实施例的另一个方面,提供了一种用户行为特征实时处理装置,该装置包括:接收模块,用于接收表征用户的实时行为的实时用户行为数据;更新模块,用于基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新,其中,时间滑动窗口对应于第一预设时长的历史时间段,历史用户特征数据是在对历史时间段内接收的用户行为数据进行统计得到的;预测模块,用于将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

在一些实施例中,历史用户特征数据包括第一历史用户特征数据和第二用户历史特征数据,其中,第一用户历史特征数据是目标历史时间点之前统计的数据,第二用户历史特征数据是目标历史时间点之后统计的数据;相应的,预测模块包括:第一预测单元,用于在目标历史时间点将第一用户历史特征数据输入用户需求预测模型,得到第一预测用户需求数据;第二预测单元,用于响应于接收到实时用户行为数据,实时地将第二用户历史特征数据输入用户需求预测模型,得到第二预测用户需求数据。

在一些实施例中,更新模块进一步用于:响应于从预设的延迟队列中接收到过期用户行为数据,将历史用户特征数据中的与过期用户行为数据相对应的数据删除。

在一些实施例中,用户需求预测模型包括预测子模型和计算子模型;预测模块进一步用于:将历史用户特征数据输入预测子模型,得到每个用户在未来的第二预设时长内发生预设类型的行为的概率;将概率输入计算子模型,得到预测用户需求数据。

在一些实施例中,该装置还包括:数据清除模块,用于从实时用户行为数据中确定非有效用户行为数据并将非有效用户行为数据清除;归一化模块,用于对清除后剩余的实时用户行为数据进行用户标识归一化处理,得到用于计入时间滑动窗口的实时用户行为数据。

在一些实施例中,用户需求预测模型预先基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本用户特征数据,以及对样本特征数据进行标注的实际用户需求数据;将训练样本集合中的训练样本包括的样本用户特征数据作为输入,将与输入的样本用户特征数据对应的实际用户需求数据作为期望输出,训练得到用户需求预测模型。

在一些实施例中,预测模块包括:确定单元,用于确定历史用户特征数据对应的业务线;选择单元,用于从预设的至少一个用户需求预测模型中,选择与业务线对应的用户需求预测模型;第三预测单元,用于将历史用户特征数据输入选择的用户需求预测模型,得到预测用户需求数据。

在一些实施例中,该装置还包括:可视化模块,用于将预测用户需求数据进行可视化输出。

根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述用户行为特征实时处理方法。

根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述用户行为特征实时处理方法。

基于本公开上述实施例提供的用户行为特征实时处理方法、装置、计算机可读存储介质及电子设备,通过采用时间滑动窗口的方式,实时更新用于预测平台价值的用户特征数据,再将时间滑动窗口对应的历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,从而可以实现在线实时地预测用户需求,使用户的行为变化可以及时准确反映在实时用户行为数据中,降低预测用户需求和实际用户需求的误差,有助于为平台运营提供数据支持,同时为搜索推荐等场景提供及时的优化目标和实时的策略评估。

下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1是本公开所适用的系统图。

图2是本公开一示例性实施例提供的用户行为特征实时处理方法的流程示意图。

图3是本公开另一示例性实施例提供的用户行为特征实时处理方法的流程示意图。

图4是本公开一示例性实施例提供的用户行为特征实时处理装置的结构示意图。

图5是本公开另一示例性实施例提供的用户行为特征实时处理装置的结构示意图。

图6是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。

还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。

还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。

另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。

还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

申请概述

现有的平台价值计算方法,通常使用用户离线行为数据作为平台价值的特征。现有工作方式的缺点包括以下几方面:

误差大:预测的平台价值与真实的平台价值误差大;

敏感度低:用户的行为变化不能及时准确反映在特征数据中;

稳定性差:使用的离线数据计算出来后,与重新确定的实时用户行为数据存在较大的波动。

示例性系统

图1示出了可以应用本公开的实施例的用户行为特征实时处理方法或用户行为特征实时处理装置的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101,网络102和服务器103。网络102用于在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如购物类应用、房产交易应用、搜索类应用、网页浏览器应用、即时通信工具等。

终端设备101可以是各种电子设备,包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。

服务器103可以是提供各种服务的服务器,例如对终端设备101上传的实时用户行为数据进行统计并预测用户需求的后台数据分析服务器。后台数据分析服务器可以对接收到的实时用户行为数据进行处理,得到处理结果(例如预测用户需求数据)。

需要说明的是,本公开的实施例所提供的用户行为特征实时处理方法可以由服务器103执行,也可以由终端设备101执行,相应地,用户行为特征实时处理装置可以设置于服务器103中,也可以设置于终端设备101中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

示例性方法

图2是本公开一示例性实施例提供的用户行为特征实时处理方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上,如图2所示,该方法包括如下步骤:

步骤201,接收表征用户的实时行为的实时用户行为数据。

在本实施例中,电子设备可以接收产生自图1所示的终端设备的表征用户的实时行为的实时用户行为数据。其中,用户的实时行为可以包括但不限于以下至少一种:浏览、关注、搜索、即时通讯(im)、致电、vr带看(即采用虚拟现实方式查看房屋)、留资(即用户留下个人资料)等。实时用户行为数据可以表征上述实时行为,例如浏览量、关注量、im次数、致电次数等。

通常,用户可以在多种终端(例如网站、app和小程序)进行操作,产生的实时用户行为数据收集到kafka(一种高吞吐量的分布式发布订阅消息系统)后,通过消费kafka来实时接收实时用户行为数据。

在一些可选的实现方式中,在步骤201之后,电子设备还可以执行如下步骤:

首先,从实时用户行为数据中确定非有效用户行为数据并将非有效用户行为数据清除。其中,非有效用户行为数据可以无法正确表示用户行为的数据。例如,可以将未登录用户产生的行为数据确定为非有效用户行为数据,将即时通讯时未及时回复的用户行为确定为非有效用户行为数据。

然后,对清除后剩余的实时用户行为数据进行用户标识归一化处理,得到用于计入时间滑动窗口的实时用户行为数据。其中,用户标识(id)归一化处理是指,将用户在不同终端产生的行为归到同一个用户上,使用设备号、加密手机号等为每个用户分配的用户id来唯一标识同一个用户。

本实现方式通过对接收的实时用户行为数据进行数据清洗和归一化处理,可以使用于预测的用户特征数据能够反映真实的用户行为,提高用户需求的预测准确性,从而进一步准确地反映平台价值。

步骤202,基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新。

在本实施例中,电子设备可以基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新。其中,时间滑动窗口对应于第一预设时长的历史时间段,历史用户特征数据是在对历史时间段内接收的用户行为数据进行统计得到的。

作为示例,第一预设时长可以是过去30天,时间滑动窗口对应于一个用于存储历史用户特征数据的存储区,当接收到最新的实时用户行为数据时,将实时用户行为数据计入统计,并将过期(即超过30天的)的用户行为数据从历史用户特征数据中剔除。

历史用户特征数据可以是对多个用户的行为进行统计得到的,例如,历史用户特征数据可以包括在上述第一预设时长内统计的用户浏览量、搜索次数、致电次数、与客服进行问答的次数等。

作为示例,当本实施例应用到房产交易领域时,历史用户特征数据可以包括聚合特征数据和非聚合特征数据,如下表所示:

以上各种数据可以用向量的形式表示,例如各个数据聚合为一个526维的向量。

步骤203,将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

在本实施例中,电子设备可以将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

其中,用户需求数据用于表征一段时间内,用户的行为对平台产生的价值。例如,用户需求数据可以是未来一段时间(例如7天)内,由多个用户进行的预设类型的行为(例如拨打咨询电话、与客服进行在线问答、vr带看、留资等)的总次数(可以称为商机量),由于上述预设类型的行为可以反映用户的需求,因此可以同时反映平台价值。

上述用户需求预测模型用于表征历史用户特征数据与预测用户需求数据的对应关系。作为示例,用户需求预测模型可以是利用机器学习方法,基于各种结构的初始模型(例如xgboost模型、神经网络模型等)进行训练得到的。

在一些可选的实现方式中,用户需求预测模型可以预先基于如下步骤训练得到:

首先,获取训练样本集合。其中,训练样本集合中的训练样本包括样本用户特征数据,以及对样本特征数据进行标注的实际用户需求数据。

具体地,样本用户特征数据可以是从预设的用户行为日志中获取,对样本特征数据进行标注可以由人工进行,也可以由电子设备自动进行。例如,可以对多个用户中的每个用户分别对应的用户行为数据进行统计,将进行过预设行为的用户标记为1,将未进行过预设行为的用户标记为0,实际用户需求数据可以是所有标记为1的用户进行的预设行为的次数。

然后,将训练样本集合中的训练样本包括的样本用户特征数据作为输入,将与输入的样本用户特征数据对应的实际用户需求数据作为期望输出,训练得到用户需求预测模型。

具体地,电子设备可以利用机器学习方法,将训练样本集合中的训练样本包括的样本用户特征数据作为输入,将与输入的样本用户特征数据对应的实际用户需求数据作为期望输出,对初始模型(例如xgboost、gbdt等)进行训练,针对每次训练输入的样本用户特征数据,可以得到实际输出。其中,实际输出是初始模型实际输出的数据,用于表征实际用户需求数据。然后,上述执行主体可以采用梯度下降法和反向传播法,基于实际输出和期望输出,调整初始模型的参数,将每次调整参数后得到的模型作为下次训练的初始模型,并在满足预设的训练结束条件的情况下,结束训练,从而训练得到用户需求预测模型。需要说明的是,这里预设的训练结束条件可以包括但不限于以下至少一项:训练时间超过预设时长;训练次数超过预设次数;利用预设的损失函数(例如交叉熵损失函数)计算所得的损失值收敛。

本实现方式通过采用机器学习方法训练得到用户需求预测模型,可以充分利用已有的用户特征数据,使训练得到的用户需求预测模型的预测精度更高。

在一些可选的实现方式中,用户需求预测模型包括预测子模型和计算子模型,预测子模型用于根据输入的历史用户特征数据确定每个用户在未来的第二预设时长(例如7天)内发生预设类型的行为的概率,计算子模型用于根据概率,计算得到预测用户需求数据。

其中,预设类型的行为可以反映用户对服务提供者提供的服务感兴趣程度,即如果用户进行了预设类型的行为,则用户进一步向服务提供者提出服务(即产生商机)的可能性较大,因此,可以反映平台价值。作为示例,当服务提供者提供的服务为房产交易服务时,上述预设类型的行为可以包括但不限于以下至少一种:拨打咨询电话、与客服进行在线问答、vr带看、留资等。通常,在模型训练阶段,对样本用户特征数据的标注信息可以分别对应于各个预设类型的行为。例如用户如果进行过在线问答,则对应的概率标注为1,否则标注为0。

基于所得到的概率,可以按照各种方式计算用户需求数据。例如可以将输入的历史用户特征数据表征的各个用户分别对应的概率相加,得到用户需求数据。或者,将大于或等于预设的概率阈值的概率记为1,将小于概率阈值的概率记为0,再将各个1相加,得到预测用户需求数据。

本实现方式通过确定第二预设时长内发生预设类型的行为的概率,再基于概率计算预测用户需求数据,可以使得到的预测用户需求数据能够更加精确地反映平台价值。

在一些可选的实现方式中,电子设备可以将预测用户需求数据进行可视化输出。具体地,可以生成曲线、表格等并在显示器上显示。通过可视化输出预测用户需求数据,可以使预测用户需求数据被直观地监测,为管理服务平台提供参考。

在一些可选的实现方式中,步骤202可以如下执行:

响应于从预设的延迟队列中接收到过期用户行为数据,将历史用户特征数据中的与过期用户行为数据相对应的数据删除。其中,延迟队列用于定时地将过去的某个时间点生成的用户特征数据发送回电子设备,电子设备根据接收的过期用户行为数据,将已统计进历史用户特征数据中的过期用户行为数据删除。

作为示例,假设时间滑动窗口对应的历史时间段为30天,当接收到用户行为数据时,将用户行为数据放入延迟队列,并开始计时,待30天后,延迟队列将上述用户行为数据作为过期用户行为数据发送回电子设备,电子设备根据接收的过期用户行为数据对时间滑动窗口进行更新。

本实现方式通过使用延迟队列,可以准确地设置滑动窗口的时长,并准确地对历史用户特征数据进行更新,从而实现实时地预测用户需求。

在一些可选的实现方式中,历史用户特征数据包括第一历史用户特征数据和第二用户历史特征数据。其中,第一用户历史特征数据是目标历史时间点之前统计的数据,第二用户历史特征数据是目标历史时间点之后统计的数据。目标历史时间点可以是任意设置的时间点,例如,目标历史时间点可以是当天的零点,这样,当天零点之前对应的历史用户特征数据为第一历史用户特征数据,零点之后对应的历史用户特征数据为第二历史用户特征数据。

基于此,步骤203可以如下执行:

在所述目标历史时间点将所述第一用户历史特征数据输入所述用户需求预测模型,得到第一预测用户需求数据,以及响应于接收到所述实时用户行为数据,实时地将所述第二用户历史特征数据输入所述用户需求预测模型,得到第二预测用户需求数据。其中,第一预测用户需求数据是利用过去一段时间统计的第一预测用户需求数据生成的,可以根据某段历史时间段对应的数据进行平台价值预测,反映平台价值的长期趋势,第二预测用户需求数据是利用实时统计的第二预测用户需求数据生成的,可以实时地反映平台价值的趋势。

作为示例,可以通过flink任务把用户每分钟的行为明细,以id和分钟时间戳构造散列rowkey并保存到hbase中,则hbase用于存储第一用户历史特征数据。同时将每分钟内有行为的用户id保存到redis中,即redis用于存储第二用户历史特征数据。

本实现方式通过设置目标历史时间点,将历史用户特征数据分为第一历史用户特征数据和第二用户历史特征数据,利用第一用户历史特征数据进行一次平台价值预测,在目标历史时间点之后,实时地利用第二用户历史特征数据进行平台价值预测,可以实现将一段时间统计的用户历史特征数据作为离线数据进行用户需求预测,又可以利用实时统计的用户历史特征数据进行用户需求预测,从而将离线数据与实时数据结合,提高用户需求预测的准确性。并且得到的用户需求数据可以反映平台价值的长期趋势和实时趋势,从而为平台运营提供详尽的数据支持。

本公开的上述实施例提供的方法,通过采用时间滑动窗口的方式,实时更新用于预测用户需求的用户特征数据,再将时间滑动窗口对应的历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,从而可以实现在线实时地预测用户需求,使用户的行为变化可以及时准确反映在实时用户行为数据中,降低预测用户需求和实际用户需求的误差,有助于为平台运营提供数据支持,同时为搜索推荐等场景提供及时的优化目标和实时的策略评估。

进一步参考图3,示出了用户行为特征实时处理方法的又一个实施例的流程示意图。如图3所示,在上述图2所示实施例的基础上,步骤203可以包括如下步骤:

步骤2031,确定历史用户特征数据对应的业务线。

在本实施例中,电子设备可以确定历史用户特征数据对应的业务线。其中,业务线表征服务提供方提供的某种服务。例如,在房屋交易领域,可以包括新房销售、二手房销售、房屋出租等业务线。

步骤2032,从预设的至少一个用户需求预测模型中,选择与业务线对应的用户需求预测模型。

在本实施例中,电子设备可以从预设的至少一个用户需求预测模型中,选择与业务线对应的用户需求预测模型。其中,每个用户需求预测模型对应于一种业务线,即对于某个平台价值模型,该模型是利用对应的业务线的用户特征数据训练得到的。

步骤2033,将历史用户特征数据输入选择的用户需求预测模型,得到预测用户需求数据。

在本实施例中,电子设备可以将历史用户特征数据输入选择的用户需求预测模型,得到预测用户需求数据。

上述图3对应实施例提供的方法,通过预先设置至少一个用户需求预测模型,可以有区别性地对各种业务线进行用户需求预测,提高用户需求预测的全面性,有助于为平台运营提供更全面的数据支持。

示例性装置

图4是本公开一示例性实施例提供的用户行为特征实时处理装置的结构示意图。本实施例可应用在电子设备上,如图5所示,用户行为特征实时处理装置包括:接收模块401,用于接收表征用户的实时行为的实时用户行为数据;更新模块402,用于基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新,其中,时间滑动窗口对应于第一预设时长的历史时间段,历史用户特征数据是在对历史时间段内接收的用户行为数据进行统计得到的;预测模块403,用于将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

在本实施例中,接收模块401可以接收表征用户的实时行为的实时用户行为数据。其中,用户的实时行为可以包括但不限于以下至少一种:浏览、关注、搜索、即时通讯(im)、致电、vr带看(即采用虚拟现实方式查看房屋)、留资(即用户留下个人资料)等。实时用户行为数据可以表征上述实时行为,例如浏览量、关注量、im次数、致电次数等。

通常,用户可以在多种终端(例如网站、app和小程序)进行操作,产生的实时用户行为数据收集到kafka(一种高吞吐量的分布式发布订阅消息系统)后,通过消费kafka来实时接收实时用户行为数据。

在本实施例中,更新模块402可以基于实时用户行为数据,对当前的时间滑动窗口对应的历史用户特征数据进行更新。其中,时间滑动窗口对应于第一预设时长的历史时间段,历史用户特征数据是在对历史时间段内接收的用户行为数据进行统计得到的。

作为示例,第一预设时长可以是过去30天,时间滑动窗口对应于一个用于存储历史用户特征数据的存储区,当接收到最新的实时用户行为数据时,将实时用户行为数据计入统计,并将过期(即超过30天的)的用户行为数据从历史用户特征数据中剔除。

历史用户特征数据可以是对多个用户的行为进行统计得到的,例如,历史用户特征数据可以包括在上述第一预设时长内统计的用户浏览量、搜索次数、致电次数、与客服进行问答的次数等。

作为示例,当本实施例应用到房产交易领域时,历史用户特征数据可以包括聚合特征数据和非聚合特征数据,如下表所示:

以上各种数据可以用向量的形式表示,例如各个数据聚合为一个526维的向量。

在本实施例中,预测模块403可以将历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据。

其中,用户需求数据用于表征一段时间内,用户的行为对平台产生的价值。例如,用户需求数据可以是未来一段时间(例如7天)内,由多个用户进行的预设类型的行为(例如拨打咨询电话、与客服进行在线问答、vr带看、留资等)的总次数(可以称为商机量),由于上述预设类型的行为可以反映用户的需求,因此可以同时反映平台价值。

上述用户需求预测模型用于表征历史用户特征数据与预测用户需求数据的对应关系。作为示例,用户需求预测模型可以是利用机器学习方法,基于各种结构的初始模型(例如xgboost模型、神经网络模型等)进行训练得到的。

参照图5,图5是本公开另一示例性实施例提供的用户行为特征实时处理装置的结构示意图。

在一些可选的实现方式中,历史用户特征数据包括第一历史用户特征数据和第二用户历史特征数据,其中,第一用户历史特征数据是目标历史时间点之前统计的数据,第二用户历史特征数据是目标历史时间点之后统计的数据;相应的,预测模块403包括:第一预测单元4031,用于在目标历史时间点将第一用户历史特征数据输入用户需求预测模型,得到第一预测用户需求数据;第二预测单元4032,用于响应于接收到实时用户行为数据,实时地将第二用户历史特征数据输入用户需求预测模型,得到第二预测用户需求数据。

在一些可选的实现方式中,更新模块402进一步用于:响应于从预设的延迟队列中接收到过期用户行为数据,将历史用户特征数据中的与过期用户行为数据相对应的数据删除。

在一些可选的实现方式中,用户需求预测模型包括预测子模型和计算子模型;预测模块进一步用于:将历史用户特征数据输入预测子模型,得到每个用户在未来的第二预设时长内发生预设类型的行为的概率;将概率输入计算子模型,得到预测用户需求数据。

在一些可选的实现方式中,该装置还包括:数据清除模块405,用于从实时用户行为数据中确定非有效用户行为数据并将非有效用户行为数据清除;归一化模块406,用于对清除后剩余的实时用户行为数据进行用户标识归一化处理,得到用于计入时间滑动窗口的实时用户行为数据。

在一些可选的实现方式中,用户需求预测模型预先基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本用户特征数据,以及对样本特征数据进行标注的实际用户需求数据;将训练样本集合中的训练样本包括的样本用户特征数据作为输入,将与输入的样本用户特征数据对应的实际用户需求数据作为期望输出,训练得到用户需求预测模型。

在一些可选的实现方式中,预测模块403包括:确定单元4033,用于确定历史用户特征数据对应的业务线;选择单元4034,用于从预设的至少一个用户需求预测模型中,选择与业务线对应的用户需求预测模型;第三预测单元4035,用于将历史用户特征数据输入选择的用户需求预测模型,得到预测用户需求数据。

在一些可选的实现方式中,该装置还包括:可视化模块407,用于将预测用户需求数据进行可视化输出。

本公开上述实施例提供的用户行为特征实时处理装置,通过采用时间滑动窗口的方式,实时更新用于预测用户需求的用户特征数据,再将时间滑动窗口对应的历史用户特征数据输入预先训练的用户需求预测模型,得到预测用户需求数据,从而可以实现在线实时地预测用户需求,使用户的行为变化可以及时准确反映在实时用户行为数据中,降低预测用户需求和实际用户需求的误差,有助于为平台运营提供数据支持,同时为搜索推荐等场景提供及时的优化目标和实时的策略评估。

示例性电子设备

下面,参考图6来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备,该单机设备可以与终端设备101和服务器103进行通信,以从它们接收所采集到的输入信号。

图6图示了根据本公开实施例的电子设备的框图。

如图6所示,电子设备600包括一个或多个处理器601和存储器602。

处理器601可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备600中的其他组件以执行期望的功能。

存储器602可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本公开的各个实施例的用户行为特征实时处理方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如实时用户行为数据等各种内容。

在一个示例中,电子设备600还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如,在该电子设备是终端设备101或服务器103时,该输入装置603可以是鼠标、键盘、麦克风等设备,用于输入实时用户行为数据。在该电子设备是单机设备时,该输入装置603可以是通信网络连接器,用于从终端设备101和服务器103接收所输入的实时用户行为数据。

该输出装置604可以向外部输出各种信息,包括预测用户需求数据。该输出设备604可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图6中仅示出了该电子设备600中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备600还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用户行为特征实时处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用户行为特征实时处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1