用户在场行为预测方法及装置与流程

文档序号:29037595发布日期:2022-02-25 19:29阅读:107来源:国知局
用户在场行为预测方法及装置与流程

1.本文件涉及数据处理技术领域,尤其涉及一种用户在场行为预测方法及装置。


背景技术:

2.随着移动互联网的高速发展和互联网用户的快速增长,越来越多的信息传递、广告投放依赖于移动互联网的各种应用程序,用户可以访问应用程序获得对应的数据信息,在此过程中,产生了海量的带有用户时空属性的数据,通常,可以利用海量的用户数据进行数据处理,从而挖掘潜在的数据规律,为用户提供更优质的服务。


技术实现要素:

3.本说明书一个或多个实施例提供了一种用户在场行为预测方法,包括:根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户。对所述相似用户在目标时间段的在场行为进行预测。按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。基于所述预测得分确定所述目标用户在所述目标时间段的预测在场行为。
4.本说明书一个或多个实施例提供了一种用户行为预测装置,包括:相似度计算模块,被配置为根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户。在场行为预测模块,被配置为对所述相似用户在目标时间段的在场行为进行预测。预测得分计算模块,被配置为按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。在场行为确定模块,被配置为基于所述预测得分确定所述目标用户在所述目标时间段的预测在场行为。
5.本说明书一个或多个实施例提供了一种用户行为预测设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户。对所述相似用户在目标时间段的在场行为进行预测。按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。基于所述预测得分确定所述目标用户在所述目标时间段的预测在场行为。
6.本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户。对所述相似用户在目标时间段的在场行为进行预测。按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。基于所述预测得分确定所述目标用户在所述目标时间段的预测
在场行为。
附图说明
7.为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
8.图1为本说明书一个或多个实施例提供的一种用户在场行为预测方法处理流程图;
9.图2为本说明书一个或多个实施例提供的一种应用于服务推送场景的用户在场行为预测方法处理流程图;
10.图3为本说明书一个或多个实施例提供的一种用户行为预测装置示意图;
11.图4为本说明书一个或多个实施例提供的一种用户行为预测设备的结构示意图。
具体实施方式
12.为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
13.本说明书提供的一种用户在场行为预测方法实施例:
14.参照图1,其示出了本实施例提供的一种用户在场行为预测方法处理流程图,参照图2,其示出了本实施例提供的一种应用于服务推送场景的用户在场行为预测方法处理流程图。
15.参照图1,本实施例提供的用户在场行为预测方法,具体包括步骤s102至步骤s108。
16.步骤s102,根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户。
17.本实施例提供的用户在场行为预测方法中,首先通过对目标用户在目标时间段的在场行为进行预测,若预测获得的预测结果为无法预测,则借助相似用户在目标时间段的预测在场行为确定目标用户的预测在场行为,具体的,在对相似用户在目标时间段的在场行为进行预测的过程中,按照行为相似度对每个相似用户分配权重,并计算预测获得的在场行为属于同行为类别的相似用户的预测得分,进一步基于预测得分确定目标用户在目标时间段的预测在场行为,若预测在场行为属于在场状态,则在目标时间段向目标用户进行服务消息推送。
18.通过引入针对目标用户在目标时间段的在场行为预测,以及利用对相似用户在目标时间段的在场行为预测来完成对目标用户的在场行为预测的联合处理机制,以实现针对目标用户的在场行为预测的高精度和高可靠性,提升预测结果的置信度和时效性。
19.在实际的证件服务推送场景中,用户通过上传身份凭证等证件信息可以进行实名
登记,而往往上传证件信息的操作流程比较繁琐,并且用户在未随身携带证件的情况下,也无法完成上传证件信息的任务,由于用户处于目标场(比如住所)的过程中,一般时间比较自由,在此情况下,若能预测用户处于目标场或者目标路线,则可以针对性地向用户进行服务消息推送,避免数据资源的浪费,提升用户触发服务信息的概率,提升用户的转化效率。
20.本实施例中,所述应用访问数据以及所述行为轨迹数据根据历史访问记录生成,比如用户在t时刻(x,y)位置访问应用程序的过程中上传定位的地理位置信息;所述行为相似度表示两个用户在场行为之间的相似程度;实际应用中,用户在访问应用程序的过程中,可以上传自己的地理位置信息,此处访问应用并上传地理位置信息的用户即历史用户,从历史用户中抽取一定数量的用户作为样本进行行为相似度计算,该一定数量的用户即抽样用户,所述目标用户即需要进行目标时间段的在场行为预测的用户。
21.其中,在场行为包括在场状态或者非在场状态。
22.在服务处理的过程中,在场状态是指用户所处位置满足当前进行服务处理所要求的位置,反之,在用户所处位置不满足当前进行服务处理所要求的位置的情况下,确定用户的在场行为属于非在场状态。比如在服务消息推送过程中,用户处于住所时进行应用访问的频率较高,在这种情况下,消息推送是有效的,因此在场状态包括用户位置处于住所,同时,用户在处于一些特定场所(例如餐厅、下班途中乘坐交通工具)时,访问应用的频率也较高,由此在场状态也包括用户位置处于应用访问频率满足访问条件的场所或者路线。
23.具体实施时,为了提升预测结果的精确度,可以在根据相似用户处于目标时间段的预测在场行为来确定目标用户的预测在场行为的过程中,计算目标用户与抽样用户的行为相似度。本实施例提供的一种可选实施方式中,在计算目标用户与抽样用户的行为相似度的过程中,执行如下操作:
24.从历史用户的应用访问数据以及行为轨迹数据中抽取所述抽样用户;
25.根据所述目标用户的应用访问数据以及行为轨迹数据构造行为特征向量,以及根据所述抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量;
26.将所述目标用户的行为特征向量以及所述抽样用户的行为特征向量输入相似度算法进行行为相似度计算,并输出所述目标用户与所述抽样用户的行为相似度。
27.例如,在确定是否向用户u发送实名登记的过程中,可以通过判断用户u在19:00-22:00时间段是否处于目标场来确定是否向用户u发送服务消息推送,在此情况下,可以根据用户u的应用访问数据以及行为轨迹数据构造的行为特征向量,可以表示为:“ua-features={f1,f2,f3,...,fn}”,根据用户u的抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量,可以表示为:“ubx-features={fx1,fx2,fx3,...,fxn},其中x为抽样用户中各抽样用户的用户编号,x={1b,2b,3b,...,nb}”,将获得的用户u的行为特征向量和抽样用户的行为特征向量输入相似度算法,可以输出用户u与抽样用户的行为相似度。
28.其中,相似度算法可以通过计算目标用户与相似用户的特征向量之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小;也可以通过度量两个特征向量在方向上的差异来衡量目标用户与相似用户的相似性。具体的,在相似度计算的过程中,下述提供三种候选的相似度算法:
29.(1)欧式距离(euclidean distance)
30.例如,构造获得的用户u的行为特征向量为:ua-features={f1,f2,f3,...,fn},
构造获得的任一抽样用户的行为特征向量为:ubx-features={fx1,fx2,fx3,...,fxn},x={1b,2b,3b,...,nb},则欧氏距离即用户u与任一抽样用户之间的行为相似度为:
[0031][0032]
(2)曼哈顿距离(manhattan distance)
[0033]
例如,构造获得的用户u的行为特征向量为:ua-features={f1,f2,f3,...,fn},构造获得的任一抽样用户的行为特征向量为:ubx-features={fx1,fx2,fx3,...,fxn},则曼哈顿距离即用户u与任一抽样用户之间的行为相似度为:
[0034]
(3)余弦距离(cosine)
[0035]
例如,构造获得的用户u的行为特征向量为:ua-features={f1,f2,f3,...,fn},构造获得的任一抽样用户的行为特征向量为:ubx-features={fx1,fx2,fx3,...,fxn},则余弦距离即用户u与任一抽样用户之间的行为相似度为:
[0036]
此外,除了上述提供的采用欧式距离、曼哈顿距离以及余弦距离计算相似度的实现方式,还可以采用其他相似度算法,本实施例在此不作具体限定。
[0037]
由于目标用户的在场行为分为在场状态和非在场状态,所以为了推进预测结果的精确生成,使目标用户的预测在场行为更接近实际的在场行为,有助于后续进行服务消息的针对性推送,上述在根据抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量的过程中,可以将抽样用户进行分类,生成正样本用户和负样本用户,正样本用户即在场样本用户,负样本用户即非在场样本用户。
[0038]
本实施例提供的一种可选实施方式中,在根据抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量的过程中,执行如下操作:
[0039]
从所述抽样用户的应用访问数据以及行为轨迹数据中抽取正样本用户和负样本用户;
[0040]
通过所述正样本用户的应用访问数据以及行为轨迹数据和所述负样本用户的应用访问数据以及行为轨迹数据,提取时间特征元素和在场行为元素;
[0041]
根据所述时间特征元素和所述在场行为元素构造所述抽样用户的行为特征向量。
[0042]
其中,所述时间特征元素包括下述至少一项:工作日、周末、节假日、时间段、日期范围、频次;所述在场行为元素包括在场或者不在场。
[0043]
需要说明的是,上述在提取时间特征元素和在场行为特征元素的基础上,利用时间特征元素生成时间行为特征,以及利用在场行为元素生成在场行为特征,再通过时间行为特征构造时间特征向量,以及通过在场行为特征构造在场行为特征向量,然后综合时间特征向量和在场行为特征向量形成行为特征向量;也可以利用时间特征元素生成时间行为特征,以及利用在场行为元素生成在场行为特征,再综合时间行为特征和在场行为特征形成用户行为特征,将用户行为特征向量化生成行为特征向量;还可以首先综合时间特征元素和在场行为元素形成用户行为元素,再利用用户行为元素生成用户行为特征,然后通过用户行为特征构造行为特征向量。
[0044]
例如,综合时间行为特征和在场行为特征形成的用户行为特征可以为:某抽样用户在周一的21点在场,某抽样用户在周六的12点非在场。
[0045]
同样,在上述根据目标用户的应用访问数据以及行为轨迹数据构造行为特征向量的过程中,可以从目标用户的应用访问数据以及行为轨迹数据中提取时间特征元素和在场行为元素,再根据时间特征元素和在场行为元素构造目标用户的行为特征向量。
[0046]
需要补充的是,除上述通过正样本用户的应用访问数据以及行为轨迹数据和负样本用户的应用访问数据以及行为轨迹数据,提取时间特征元素和在场行为元素,也可以通过正样本用户的应用访问数据以及行为轨迹数据和负样本用户的应用访问数据以及行为轨迹数据,提取时间特征元素、在场行为元素两者中一者。
[0047]
在行为相似度计算完成的基础上,可以进一步确定目标用户的相似用户,具体的,本实施例提供的一种可选实施方式中,在确定至少一个抽样用户为目标用户的相似用户的过程中,执行如下操作:
[0048]
从所述抽样用户中筛选与所述目标用户的地理位置匹配的抽样用户;
[0049]
按照所述行为相似度由高到低的顺序对筛选获得的抽样用户进行排序处理,并将排序位置处于预设位置之前的抽样用户确定为所述相似用户。
[0050]
沿用上例,在利用用户u的行为特征向量:“ua-features={f1,f2,f3,...,fn}”和用户u的抽样用户的行为特征向量:“ubx-features={fx1,fx2,fx3,...,fxn}完成行为相似度计算的基础上,可以基于行为相似度确定目标用户的相似用户,在确定相似用户的过程中,从抽样用户中筛选出与用户u的城市位置匹配的抽样用户,将不符合城市位置条件的抽样用户进行剔除,然后按照计算的行为相似度由高到低的顺序对筛选获得的抽样用户进行排序,将排序位置处于预设位置之前的抽样用户确定为相似用户,表示为:“u-similarity={u1,u2,...,un}”,以增加用户数据的可靠性,同时实现预测过程的高效化。
[0051]
进一步,为了节省预测时间,提升预测结果的时效性,使用户能够在较短的时间内接收到服务消息推送,在针对相似用户在目标时间段的在场行为进行预测之前,可以根据目标用户的应用访问数据以及行为轨迹数据,对目标用户在目标时间段的在场行为进行预测。其中,预测结果包括在场状态、非在场状态或者空,空即对目标用户在目标时间段的在场行为无法预测。
[0052]
本实施例提供的一种可选实施方式中,在根据应用访问数据以及行为轨迹数据计算目标用户与历史用户的行为相似度,并确定至少一个历史用户为目标用户的相似用户之后,执行如下操作:
[0053]
对所述目标用户在所述目标时间段的在场行为进行预测;
[0054]
判断所述目标用户在所述目标时间段的在场行为的预测结果是否为空;
[0055]
若不为空,将所述预测结果作为所述目标用户在所述目标时间段的预测在场行为;
[0056]
若为空,执行步骤s104。
[0057]
针对目标用户在目标时间段的在场行为进行预测的执行过程中,为了提升预测结果的准确性和可靠性,以下提供三种预测的具体实现方式:
[0058]
本实施例提供的第一种可选实施方式中,对目标用户在目标时间段的在场行为进行预测的过程中,执行如下操作:
[0059]
从所述目标用户的应用访问数据以及行为轨迹数据中读取所述目标用户的前次访问位置信息,并计算所述前次访问位置信息中的访问位置与目标场的距离;
[0060]
基于计算得到的距离确定所述目标用户在所述目标时间段的在场行为的预测结果。
[0061]
其中,前次访问位置信息包括前一次访问位置信息、前两次访问位置信息等。
[0062]
具体的,在基于计算得到的距离确定目标用户在目标时间段的在场行为的预测结果的过程中,若计算得到的距离低于预设距离阈值,则判定相似用户在目标时间段的预测在场行为属于在场状态;若计算得到的距离高于预设距离阈值,则判定相似用户在目标时间段的预测在场行为属于非在场状态;若通过计算无法获得预测结果,则确定相似用户在目标时间段的预测在场行为为空,继续执行判断预测获得的预测结果是否为空操作。
[0063]
例如,从用户a的应用访问数据以及行为轨迹数据中,读取的9:00-10:00时间段的前次访问位置信息中包含的访问位置为用户a的目标场附近的商超,计算商超位置与目标场位置之间的距离获得的结果为10m,判断计算的距离(10m)《预设距离阈值(20m),则判定用户a在9:00-10:00时间段的预测在场行为属于在场状态,则预测结果不为空。
[0064]
本实施例提供的第二种可选实施方式中,对目标用户在目标时间段的在场行为进行预测的过程中,执行如下操作:
[0065]
通过所述目标用户的应用访问数据以及行为轨迹数据获取所述目标用户的历史访问时间和历史位置信息;
[0066]
基于所述历史访问时间和所述历史位置信息统计所述目标用户处于在场状态的有效时间段,并计算所述有效时间段中各时间段处于所述在场状态的有效频次;
[0067]
基于所述有效频次确定所述目标用户在所述目标时间段的在场行为的预测结果。
[0068]
例如,通过用户b的应用访问数据以及行为轨迹数据获取用户b过去一个月的历史访问时间和历史位置信息,统计用户b处于在场状态的有效时间段分别为12:00-13:30,19:00-22:00,23:00-次日8:30,再计算12:00-13:30时间段的处于在场状态的有效频次为10,计算19:00-22:00时间段的处于在场状态的有效频次为50,计算23:00-次日8:30时间段的处于在场状态的有效频次为20,通过比对,确定用户b在12:00-13:30时间段的预测在场行为属于非在场状态,则预测结果不为空。
[0069]
需要补充的是,除通过目标用户的应用访问数据以及行为轨迹数据获取目标用户的历史访问时间和历史位置信息之外,还可以通过目标用户的应用访问数据以及行为轨迹数据获取历史访问时间、历史位置信息两者中一者。
[0070]
本实施例提供的第三种可选实施方式中,对目标用户在目标时间段的在场行为进行预测的过程中,执行如下操作:
[0071]
基于所述目标用户的用户特征将所述目标用户划分至对应的群体特征类别;
[0072]
根据所述群体特征类别对应的在场行为特征,确定所述目标用户在所述目标时间段的在场行为的预测结果。
[0073]
例如,用户c的用户特征包括25岁女性程序员,基于用户c的用户特征将用户c划分至对应的群体特征类别,根据群体特征类别对应的在场行为特征未获得用户c在13:00-16:00时间段的在场行为的预测结果,则表明预测结果为空。
[0074]
此外,除上述提供的三种针对目标用户在目标时间段的预测在场行为进行预测的实现方式,还可以采用其他预测方式,以使用更精确的预测方式获得预测结果,提升预测结果的置信度。
[0075]
需要补充的是,对目标用户在目标时间段的在场行为进行预测的过程还可以在,根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为目标用户的相似用户操作执行之前进行执行,则针对用户在场行为预测方法,包括:
[0076]
对目标用户在目标时间段的在场行为进行预测;
[0077]
判断目标用户在目标时间段的在场行为的预测结果是否为空;
[0078]
若不为空,则将预测结果作为目标用户在目标时间段的预测在场行为;
[0079]
若为空,则执行根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为目标用户的相似用户;对相似用户在目标时间段的在场行为进行预测;按照行为相似度对相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分;基于预测得分确定目标用户在目标时间段的预测在场行为操作。
[0080]
步骤s104,对所述相似用户在目标时间段的在场行为进行预测。
[0081]
具体实施时,在针对相似用户在目标时间段的在场行为进行预测的执行过程中,下述提供三种实现方式:
[0082]
(1)从相似用户的应用访问数据以及行为轨迹数据中读取相似用户的前次访问位置信息,并计算前次访问位置信息中的访问位置与目标场的距离;
[0083]
根据计算的距离确定相似用户在目标时间段的在场行为的预测结果。
[0084]
具体的,若计算得到的距离低于预设距离阈值,则判定相似用户在目标时间段的预测在场行为属于在场状态,则代表预测结果不为空;若计算得到的距离高于预设距离阈值,则判定相似用户在目标时间段的预测在场行为属于非在场状态,则表明预测结果不为空;若通过计算无法获得预测结果,则确定相似用户在目标时间段的预测在场行为为空。
[0085]
(2)通过相似用户的应用访问数据以及行为轨迹数据获取相似用户的历史访问时间和历史位置信息;
[0086]
基于历史访问时间和历史位置信息统计相似用户处于在场状态的有效时间段,并计算有效时间段中各时间段处于在场状态的有效频次;
[0087]
基于有效频次确定相似用户在目标时间段的在场行为的预测结果。
[0088]
(3)基于相似用户的用户特征将相似用户划分至对应的群体特征类别;
[0089]
根据群体特征类别对应的在场行为特征,确定相似用户在目标时间段的在场行为的预测结果。
[0090]
实际应用中,在针对相似用户在目标时间段的在场行为进行预测的执行过程中,除了上述提供的三种实现方式,也可以采用预测模型实现预测结果的高精度和高可靠性,具体的操作过程如下:
[0091]
在相似用户的应用访问数据以及行为轨迹数据中提取相似用户的模型输入数据,以输入行为预测模型进行相似用户在目标时间段的在场行为的预测,并获得相似用户的在场行为的预测结果;其中,行为预测模型基于正样本用户数据和负样本用户数据训练生成。
[0092]
其中,模型输入数据可以是将应用访问数据以及行为轨迹数据进行转化处理后获得的标准化序列,也可以是将在场行为特征进行转化处理获得的标准化序列,还可以直接将构造的相似用户的行为特征向量输入预测模型进行预测。
[0093]
此外,由于预测的结果可能存在空的情况,针对于此,可以在对相似用户在目标时间段的在场行为进行预测之后,再对相似用户的在场行为的预测结果进行判断,若预测结果均为空,则不作处理,以提升数据处理效率,避免数据资源的浪费,减少预测的执行步骤,推动预测过程的灵活执行。在借助相似用户在目标时间段的在场行为无法预测(预测结果均为空)的情况下,则很大概率与相似用户具有相似性的目标用户在目标时间段的在场行为也无法预测,通过检测相似用户的在场行为是否具有可预测性确定预测结果是否均为空。
[0094]
本实施例提供的一种可选实施方式中,在对相似用户在目标时间段的在场行为进行预测之后,执行如下操作:判断所述相似用户在所述目标时间段的在场行为的预测结果是否均为空;若是,则确定所述目标用户在所述目标时间段的预测在场行为为空;若否,则执行步骤s106。
[0095]
步骤s106,按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。
[0096]
上述判断相似用户的在场行为的预测结果是否均为空,在此基础上,若预测结果不为空,则按照行为相似度对相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分。
[0097]
本实施例提供的一种可选实施方式中,在按照行为相似度对相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分的过程中,执行如下操作:
[0098]
按照所述行为相似度对所述相似用户进行权重分配,并从所述相似用户中剔除所述预测结果为空的相似用户;
[0099]
根据所述预测权重,计算剔除后行为类别为在场状态的相似用户的在场得分,以及计算剔除后行为类别为非在场状态的相似用户的非在场得分。
[0100]
可选的,所述预测权重的权重大小按照排序顺序依次递减,且相邻两个预测权重之间的权重差值相等。通过依次递减且以相等的权重差值进行权重赋值的方式为排序完成的相似用户分配权重,并分别计算处于在场状态和非在场状态的相似用户的预测得分,提升预测效果,利用大量的相似用户的在场行为数据来比拟目标用户的在场行为,提升数据的利用性,挖掘海量数据潜在的数据规律来提升用户的使用体验。
[0101]
例如,用户u的top10相似用户为u-similarity={u1,u2,...,u10},按照行为相似度利用10倒序对相似用户分配给{u1,u2,...,u10}-》{10,9,...,1},而top10相似用户的预测结果分别为{在场状态、在场状态、在场状态、在场状态、在场状态、非在场状态、非在场状态、非在场状态、空、空},将两个预测结果为空的相似用户进行剔除,预测结果表示为{在场状态、在场状态、在场状态、在场状态、在场状态、非在场状态、非在场状态、非在场状态},根据分配的预测权重,计算处于在场状态的相似用户的在场得分为10+9+8+7+6=40,计算计算处于非在场状态的相似用户的非在场得分为5+4+3=12。
[0102]
步骤s108,基于所述预测得分确定所述目标用户在所述目标时间段的预测在场行为。
[0103]
上述按照行为相似度对相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分的基础上,本实施例基于预测得分
确定目标用户在目标时间段的预测在场行为。所述预测得分包括上述提到的在场得分和非在场得分,所述预测在场行为包括下述至少一项:在场状态、非在场状态、空。
[0104]
具体实施时,在基于预测得分确定目标用户在目标时间段的预测在场行为的过程中,执行如下操作:
[0105]
若所述在场得分高于所述非在场得分,则将所述在场状态作为所述目标用户在所述目标时间段的预测在场行为;
[0106]
若所述在场得分低于所述非在场得分,则确定所述非在场状态为所述目标用户在所述目标时间段的预测在场行为。
[0107]
沿用上例,根据分配的预测权重,计算处于在场状态的相似用户的在场得分为10+9+8+7+6=40,计算计算处于非在场状态的相似用户的非在场得分为5+4+3=12,由于在场得分40》非在场得分12,则判定用户u在19:00-22:00时间段的预测在场行为属于在场状态。
[0108]
在具体的执行过程中,为了基于目标用户的预测在场行为针对性地向目标用户进行服务消息推送,减少服务消息推送的失效率,提升用户触发服务效率的概率,进而提升用户的转化率,提升服务方的运营效益,在将在场状态作为目标用户在目标时间段的预测在场行为的基础上,可以向目标用户进行服务消息推送。
[0109]
本实施例提供的一种可选实施方式中,在将在场状态作为目标用户在目标时间段的预测在场行为之后,执行如下操作:
[0110]
根据待处理服务的服务信息在所述目标时间段向所述目标用户进行服务消息推送。
[0111]
沿用上例,用户u在19:00-22:00时间段的预测在场行为被确定为在场状态,则可以在19:00-22:00时间段向用户u发送关于实名登记的服务消息推送,以使用户u通过触发服务消息来完成上传身份凭证等证件信息的任务,以避免服务消息推送的无效性。
[0112]
下述以本实施例提供的一种用户在场行为预测方法在服务推送场景的应用为例,对本实施例提供的用户在场行为预测方法进行进一步说明,参见图2,应用于服务推送场景的用户在场行为预测方法,具体包括如下步骤。
[0113]
步骤s202,从历史用户的应用访问数据以及行为轨迹数据中抽取抽样用户。
[0114]
步骤s204,根据目标用户的应用访问数据以及行为轨迹数据构造行为特征向量,以及根据抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量。
[0115]
在此过程中,从抽样用户的应用访问数据以及行为轨迹数据中抽取正样本用户和负样本用户,通过正样本用户的应用访问数据以及行为轨迹数据和负样本用户的应用访问数据以及行为轨迹数据,提取时间特征元素和在场行为元素,根据时间特征元素和在场行为元素构造抽样用户的行为特征向量,以及从目标用户的应用访问数据以及行为轨迹数据提取时间特征元素和在场行为元素,根据时间特征元素和在场行为元素构造目标用户的行为特征向量。
[0116]
步骤s206,将目标用户的行为特征向量以及抽样用户的行为特征向量输入相似度算法进行行为相似度计算,并输出目标用户与抽样用户的行为相似度。
[0117]
步骤s208,从抽样用户中筛选与目标用户的地理位置匹配的抽样用户。
[0118]
步骤s210,按照行为相似度由高到低的顺序对筛选获得的抽样用户进行排序处理,并将排序位置处于预设位置之前的抽样用户确定为相似用户。
[0119]
步骤s212,从目标用户的应用访问数据以及行为轨迹数据中读取目标用户的前次访问位置信息,并计算前次访问位置信息中的访问位置与目标场的距离。
[0120]
步骤s214,基于计算得到的距离确定目标用户在目标时间段的在场行为的预测结果。
[0121]
步骤s216,判断目标用户在目标时间段的在场行为的预测结果是否为无法预测;
[0122]
若否,则将预测结果作为目标用户在目标时间段的预测在场行为;
[0123]
若是,则执行步骤s218至步骤s222。
[0124]
步骤s218,基于相似用户的用户特征将相似用户划分至对应的群体特征类别。
[0125]
步骤s220,根据群体特征类别对应的在场行为特征,确定相似用户在目标时间段的在场行为的预测结果。
[0126]
步骤s222,判断相似用户的在场行为的预测结果是否均为无法预测;
[0127]
若是,则确定目标用户在目标时间段的预测在场行为为无法预测;
[0128]
若否,则执行步骤s224至步骤s230。
[0129]
步骤s224,按照行为相似度对相似用户进行权重分配,并从相似用户中剔除预测结果为无法预测的相似用户。
[0130]
步骤s226,根据预测权重,计算剔除后行为类别为在场状态的相似用户的在场得分,以及计算剔除后行为类别为非在场状态的相似用户的非在场得分。
[0131]
其中,预测权重的权重大小按照排序顺序依次递减,且相邻两个预测权重之间的权重差值相等。
[0132]
步骤s228,若在场得分高于非在场得分,则将在场状态作为目标用户在目标时间段的预测在场行为。
[0133]
步骤s230,根据节碳服务信息在目标时间段向目标用户进行量化节碳指标的服务消息推送。
[0134]
综上所述,本实施例提供的用户在场行为预测方法,首先,从历史用户的应用访问数据以及行为轨迹数据中抽取抽样用户,根据目标用户的应用访问数据以及行为轨迹数据构造行为特征向量,以及根据抽样用户的应用访问数据以及行为轨迹数据构造行为特征向量,再将目标用户的行为特征向量以及抽样用户的行为特征向量输入相似度算法进行行为相似度计算,并输出目标用户与抽样用户的行为相似度,然后从抽样用户中筛选与目标用户的地理位置匹配的抽样用户,按照行为相似度由高到低的顺序对筛选获得的抽样用户进行排序处理,并将排序位置处于预设位置之前的抽样用户确定为相似用户;
[0135]
其次,对目标用户在目标时间段的在场行为进行预测,再判断预测获得的预测结果是否为空,若不为空,将预测结果作为目标用户在目标时间段的预测在场行为,若为空,则对相似用户在目标时间段的在场行为进行预测,再判断相似用户的在场行为的预测结果是否均为空,若是,则确定目标用户在目标时间段的预测在场行为为空,若否,则按照行为相似度对相似用户进行权重分配,并从相似用户中剔除预测结果为空的相似用户,根据预测权重,计算剔除后行为类别为在场状态的相似用户的在场得分,以及计算剔除后行为类别为非在场状态的相似用户的非在场得分;
[0136]
最后,若在场得分高于非在场得分,则将在场状态作为目标用户在目标时间段的预测在场行为,再根据待处理服务的服务信息在目标时间段向目标用户进行服务消息推
送,以此,提升用户在场行为预测的精确性和可靠性,提升预测结果的置信度和时效性,实现针对性地向用户进行服务信息推送,避免服务消息推送的无效性和数据资源的浪费,同时提升用户触发服务信息的概率,进而提升用户的转化效率。
[0137]
本说明书提供的一种用户在场行为预测装置实施例如下:
[0138]
在上述的实施例中,提供了一种用户在场行为预测方法,与之相对应的,还提供了一种用户在场行为预测装置,下面结合附图进行说明。
[0139]
参照图3,其示出了本实施例提供的一种用户在场行为预测装置示意图。
[0140]
由于装置实施例对应于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
[0141]
本实施例提供一种用户在场行为预测装置,包括:
[0142]
相似度计算模块302,被配置为根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并确定至少一个抽样用户为所述目标用户的相似用户;
[0143]
在场行为预测模块304,被配置为对所述相似用户在目标时间段的在场行为进行预测;
[0144]
预测得分计算模块306,被配置为按照所述行为相似度对所述相似用户进行权重分配,并根据分配的预测权重计算预测获得的在场行为属于同行为类别的相似用户的预测得分;
[0145]
在场行为确定模块308,被配置为基于所述预测得分确定所述目标用户在所述目标时间段的预测在场行为。
[0146]
本说明书提供的一种用户在场行为预测设备实施例如下:
[0147]
对应上述描述的一种用户在场行为预测方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种用户在场行为预测设备,该用户在场行为预测设备用于执行上述提供的用户在场行为预测方法,图4为本说明书一个或多个实施例提供的一种用户在场行为预测设备的结构示意图。
[0148]
本实施例提供的一种用户在场行为预测设备,包括:
[0149]
如图4所示,用户在场行为预测设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器401和存储器402,存储器402中可以存储有一个或一个以上存储应用程序或数据。其中,存储器402可以是短暂存储或持久存储。存储在存储器402的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括用户在场行为预测设备中的一系列计算机可执行指令。更进一步地,处理器401可以设置为与存储器402通信,在用户在场行为预测设备上执行存储器402中的一系列计算机可执行指令。用户在场行为预测设备还可以包括一个或一个以上电源403,一个或一个以上有线或无线网络接口404,一个或一个以上输入/输出接口405,一个或一个以上键盘406等。
[0150]
在一个具体的实施例中,用户在场行为预测设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对用户在场行为预测设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
[0151]
根据应用访问数据以及行为轨迹数据计算目标用户与抽样用户的行为相似度,并
hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
[0165]
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0166]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0167]
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0168]
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0169]
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程用户行为预测设备的处理器以产生一个机器,使得通过计算机或其他可编程用户行为预测设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0170]
这些计算机程序指令也可存储在能引导计算机或其他可编程用户行为预测设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0171]
这些计算机程序指令也可装载到计算机或其他可编程用户行为预测设备上,使得
在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0172]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0173]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0174]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0175]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0176]
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0177]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0178]
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1