一种神经网络模型的训练方法及装置与流程

文档序号:29943149发布日期:2022-05-07 15:12阅读:117来源:国知局
一种神经网络模型的训练方法及装置与流程

1.本技术涉及信息处理技术领域,尤其涉及一种神经网络模型的训练方法及装置。


背景技术:

2.目前,对于如何确定用户的消费水平,往往是通过对用户做调查问卷,查询银行窗口记录以及信用卡消费记录等方式实现,从银行业的数据中获得用户在消费水平方面的信息,但这些数据包含的信息覆盖的用户维度较少,难以对用户的消费水平作出准确的分析。


技术实现要素:

3.本技术提供一种神经网络模型的训练方法及装置,能够提高神经网络模型对用户的消费水平预测的准确度。
4.第一方面,本技术提供一种神经网络模型的训练方法,该训练方法包括:获取多个样本用户的运营商数据,以及多个样本用户的消费行为等级,运营商数据包括以下至少一项:通话行为数据,网络行为数据,以及位置轨迹数据,消费行为等级用于表示用户的消费行为的能力水平;根据多个样本用户的运营商数据,确定多个样本用户的消费行为;消费行为包括以下至少一项:线下消费方式,通话地区,出行方式,线上消费方式,金融偏好,以及通信消费;确定多个样本用户的消费行为中,每个消费行为的行为特征数据;行为特征数据包括行为热度,行为深度,以及行为规律;行为热度用于表征用户对于消费行为的消费倾向;行为深度用于表征用户对于消费行为所使用的应用类型的集中程度;行为规律,用于表征消费行为的行为热度和行为深度的可用性;将多个样本用户的行为特征数据,以及多个样本用户的消费行为等级作为训练数据对预设神经网络模型进行训练,得到消费行为预测模型;消费行为预测模型的输入数据为待预测用户的行为特征数据,消费行为预测模型的输出数据为待预测用户的消费行为等级。
5.本技术提供的技术方案,一方面,本技术中的神经网络模型是以运营商数据为基础,对用户的通话行为数据,网络行为数据,以及位置轨迹数据进行分析处理,而由于运营商数据存在数据量大,类型多,真实性高的特点,因此,本技术中的神经网络模型为用户的消费水平的准确预测奠定了数据基础。另一方面,本技术在运营商数据的基础上,构建了消费方式,通话地区,出行方式,网购行为,金融偏好,以及通信消费六类消费行为,可以从多个维度对用户的消费行为进行预测。进一步的,本技术还计算了六类消费行为的行为特征数据,也即行为热度,行为深度,以及行为规律,不仅从多个维度对用户的消费行为进行分析,还对每类消费行为进行深度和规律性分析,极大地提高了对运营商数据的分析程度,提高了神经网络模型在训练过程中的输入参数的准确性,从而提高了神经网络模型对用户的消费行为预测的准确性。
6.可选的,在得到消费行为预测模型之后,方法还包括:获取待预测用户的运营商数据;根据待预测用户的运营商数据,确定待预测用户的行为特征数据;将待预测用户的行为特征数据输入到消费行为预测模型,得到待预测用户的消费行为等级。
7.可选的,根据多个样本用户的运营商数据,确定多个样本用户的消费行为,包括:根据网络行为数据中的线下支付行为,以及位置轨迹数据,确定多个样本用户的线下消费方式;根据通话行为数据,确定多个样本用户的通话地区;根据多个样本用户的出行支付行为,以及出行轨迹,确定多个样本用户的出行方式;根据网络行为数据中的线上支付行为,确定多个样本用户的线上消费方式;根据网络行为数据中的金融浏览行为,确定多个样本用户的金融偏好;根据多个样本用户使用的手机信息,以及网络行为数据中的业务使用情况,确定多个样本用户的通信消费。
8.可选的,确定多个样本用户的消费行为中,每个消费行为的行为特征数据,包括:根据位置轨迹数据,确定多个样本用户是否出入高消费场所,高消费场所为消费水平高于预设阈值的消费场所;若多个样本用户出入高消费场所,则根据网络行为数据中的线下支付行为,确定线下消费方式的行为热度,线下消费方式的行为热度包括以下至少一项特征:月均出入高消费场所的次数,月均出入高消费场所的时长,以及月均出入高消费场所且发生支付行为的次数;根据通话行为数据中通话记录的对端号码的归属地,确定与目标消费水平地区相关的通话记录;根据与目标消费水平地区相关的通话记录,确定通话地区的行为热度,通话地区的行为热度包括以下至少一项特征:月均与目标消费水平地区的通话次数,月均与目标消费水平地区的通话时长,月均与目标消费水平地区通话的号码数量,月均与目标消费水平地区的通话数量占月均通话数量的比重;根据多个样本用户的出行轨迹,确定多个样本用户每次出行行为的速度;若出行行为的速度满足预设条件,则根据出行支付行为的应用类型,确定出行方式的行为热度,出行方式的行为热度包括以下至少一项特征:月均使用公共交通出行的次数占月均出行次数的比重,月均使用网约车出行的次数占月均出行次数的比重,月均租车出行的次数占月均出行次数的比重,月均自驾出行的次数占月均出行次数的比重;根据线上支付行为中应用类型以及支付记录,确定线上消费方式的行为热度,线上消费方式的行为热度包括以下至少一项特征:月均使用支付类应用的次数,月均使用支付类应用的时长,月均使用支付类应用的流量,月均使用支付类应用的数量占月均使用应用数量的比重,月均使用支付类应用的次数占月均使用应用次数的比重,月均使用支付类应用的流量占月均使用应用流量的比重,月均使用支付类应用的时长占月均使用应用时长的比重;根据金融浏览行为中应用类型以及浏览记录,确定金融偏好的行为热度,金融偏好的行为热度包括以下至少一项特征:月均使用金融类应用的次数,月均使用金融类应用的时长,月均使用金融类应用的流量,月均使用金融类应用的数量占月均使用应用数量的比重,月均使用金融类应用的次数占月均使用应用次数的比重,月均使用金融类应用的流量占月均使用应用流量的比重,月均使用金融类应用的时长占月均使用应用时长的比重;根据手机信息中的手机价值和更换频次,以及业务使用情况中的流量业务使用情况和语音业务使用情况,确定通信消费的行为热度,通信消费的行为热度包括以下至少一项特征:手机价值是否大于预设阈值,预设时间段内换手机次数,月均使用流量,月均使用语音时长。
9.可选的,确定多个样本用户的消费行为中,每个消费行为的行为特征数据,还包括:根据消费行为的行为热度,以及用户对于消费行为所使用的应用类型,确定行为热度的每项特征中与应用类型对应的特征值;根据行为热度的每项特征中与应用类型对应的特征值,以及应用类型的种类,确定消费行为的行为深度。
10.可选的,消费行为的行为深度可以由如下公式计算得到:
11.其中,n为消费行为的标识,j为消费行为行为热度中特征的标识,s
nj
为第n个消费行为的行为热度中第j项特征的行为深度,m为应用类型的种类数,为第n个消费行为的行为热度中第j项特征与第i类应用类型对应的特征值;为第n个消费行为的行为热度中第 j项特征与应用类型对应的特征值的平均值。
12.可选的,确定多个样本用户的消费行为中,每个消费行为的行为特征数据,还包括:在消费行为的日行为数据大于预设阈值的情况下,记录日行为数据对应的当天为消费行为的行为热度日,日行为数据为与行为热度的特征对应的每天的消费行为数据;根据每月中行为热度日的天数,以及每月中发生消费行为的天数,确定消费行为的行为规律。
13.可选的,消费行为的行为规律可以由如下公式计算得到:
14.其中,t为运营商数据中自然月的数量,hn为第n个消费行为的行为规律,s
npt
为在第t个月中,第n个消费行为的行为热度日的天数与发生消费行为的天数的比值。
15.可选的,网络行为数据包括用户的网络支付行为,网络浏览行为,用户终端使用情况;获取多个样本用户的运营商数据,包括:确定多个样本用户的用户标识;获取用户标识对应的网络浏览行为,获取用户标识关联的终端库,得到用户终端使用情况,用户终端使用情况包括用户使用的手机信息;获取用户的位置轨迹数据,匹配用户出入高消费场所的信息;获取上网行为中的网络支付行为;获取用户的通话行为记录,确定通话行为数据。
16.第二方面,本技术提供一种神经网络模型的训练装置,该训练装置包括:通信模块和处理模块,通信模块,用于获取多个样本用户的运营商数据,以及多个样本用户的消费行为等级,运营商数据包括以下至少一项:通话行为数据,网络行为数据,以及位置轨迹数据,消费行为等级用于表示用户的消费行为的能力水平;处理模块,用于根据多个样本用户的运营商数据,确定多个样本用户的消费行为;消费行为包括以下至少一项:线下消费方式,通话地区,出行方式,线上消费方式,金融偏好,以及通信消费;确定多个样本用户的消费行为中,每个消费行为的行为特征数据;行为特征数据包括行为热度,行为深度,以及行为规律;行为热度用于表征用户对于消费行为的消费倾向;行为深度用于表征用户对于消费行为所使用的应用类型的集中程度;行为规律,用于表征消费行为的行为热度和行为深度的可用性;将多个样本用户的行为特征数据,以及多个样本用户的消费行为等级作为训练数据对预设神经网络模型进行训练,得到消费行为预测模型;消费行为预测模型的输入数据为待预测用户的行为特征数据,消费行为预测模型的输出数据为待预测用户的消费行为等级。
17.可选的,通信模块还用于获取待预测用户的运营商数据;处理模块,还用于根据待预测用户的运营商数据,确定待预测用户的行为特征数据;将待预测用户的行为特征数据输入到消费行为预测模型,得到待预测用户的消费行为等级。
18.可选的,处理模块,具体用于根据网络行为数据中的线下支付行为,以及位置轨迹数据,确定多个样本用户的线下消费方式;根据通话行为数据,确定多个样本用户的通话地
区;根据多个样本用户的出行支付行为,以及出行轨迹,确定多个样本用户的出行方式;根据网络行为数据中的线上支付行为,确定多个样本用户的线上消费方式;根据网络行为数据中的金融浏览行为,确定多个样本用户的金融偏好;根据多个样本用户使用的手机信息,以及网络行为数据中的业务使用情况,确定多个样本用户的通信消费。
19.可选的,处理模块,具体用于根据位置轨迹数据,确定多个样本用户是否出入高消费场所,高消费场所为消费水平高于预设阈值的消费场所;若多个样本用户出入高消费场所,则根据网络行为数据中的线下支付行为,确定线下消费方式的行为热度,线下消费方式的行为热度包括以下至少一项特征:月均出入高消费场所的次数,月均出入高消费场所的时长,以及月均出入高消费场所且发生支付行为的次数;根据通话行为数据中通话记录的对端号码的归属地,确定与目标消费水平地区相关的通话记录;根据与目标消费水平地区相关的通话记录,确定通话地区的行为热度,通话地区的行为热度包括以下至少一项特征:月均与目标消费水平地区的通话次数,月均与目标消费水平地区的通话时长,月均与目标消费水平地区通话的号码数量,月均与目标消费水平地区的通话数量占月均通话数量的比重;根据多个样本用户的出行轨迹,确定多个样本用户每次出行行为的速度;若出行行为的速度满足预设条件,则根据出行支付行为的应用类型,确定出行方式的行为热度,出行方式的行为热度包括以下至少一项特征:月均使用公共交通出行的次数占月均出行次数的比重,月均使用网约车出行的次数占月均出行次数的比重,月均租车出行的次数占月均出行次数的比重,月均自驾出行的次数占月均出行次数的比重;根据线上支付行为中应用类型以及支付记录,确定线上消费方式的行为热度,线上消费方式的行为热度包括以下至少一项特征:月均使用支付类应用的次数,月均使用支付类应用的时长,月均使用支付类应用的流量,月均使用支付类应用的数量占月均使用应用数量的比重,月均使用支付类应用的次数占月均使用应用次数的比重,月均使用支付类应用的流量占月均使用应用流量的比重,月均使用支付类应用的时长占月均使用应用时长的比重;根据金融浏览行为中应用类型以及浏览记录,确定金融偏好的行为热度,金融偏好的行为热度包括以下至少一项特征:月均使用金融类应用的次数,月均使用金融类应用的时长,月均使用金融类应用的流量,月均使用金融类应用的数量占月均使用应用数量的比重,月均使用金融类应用的次数占月均使用应用次数的比重,月均使用金融类应用的流量占月均使用应用流量的比重,月均使用金融类应用的时长占月均使用应用时长的比重;根据手机信息中的手机价值和更换频次,以及业务使用情况中的流量业务使用情况和语音业务使用情况,确定通信消费的行为热度,通信消费的行为热度包括以下至少一项特征:手机价值是否大于预设阈值,预设时间段内换手机次数,月均使用流量,月均使用语音时长。
20.可选的,处理模块,具体用于根据消费行为的行为热度,以及用户对于消费行为所使用的应用类型,确定行为热度的每项特征中与应用类型对应的特征值;根据行为热度的每项特征中与应用类型对应的特征值,以及应用类型的种类,确定消费行为的行为深度。
21.可选的,消费行为的行为深度可以由如下公式计算得到:
22.其中,n为消费行为的标识,j为消费行为行为热度中特征的标识,s
nj
为第n个消费行为的行为热度中第j项特征的行为深度,m为应用类型的种类数,为第n个消费行为的行为热度中第j项特征与第i类应用类型对应的特征值;为第n个
消费行为的行为热度中第 j项特征与应用类型对应的特征值的平均值。
23.可选的,处理模块,具体用于在消费行为的日行为数据大于预设阈值的情况下,记录日行为数据对应的当天为消费行为的行为热度日,日行为数据为与行为热度的特征对应的每天的消费行为数据;根据每月中行为热度日的天数,以及每月中发生消费行为的天数,确定消费行为的行为规律。
24.可选的,消费行为的行为规律可以由如下公式计算得到:
[0025][0026]
其中,t为运营商数据中自然月的数量,hn为第n个消费行为的行为规律,s
npt
为在第t个月中,第n个消费行为的行为热度日的天数与发生消费行为的天数的比值。
[0027]
可选的,网络行为数据包括用户的网络支付行为,网络浏览行为,用户终端使用情况;通信模块,具体用于确定多个样本用户的用户标识;获取用户标识对应的网络浏览行为,获取用户标识关联的终端库,得到用户终端使用情况,用户终端使用情况包括用户使用的手机信息;获取用户的位置轨迹数据,匹配用户出入高消费场所的信息;获取上网行为中的网络支付行为;获取用户的通话行为记录,确定通话行为数据。
[0028]
第三方面,本技术提供了一种神经网络模型的训练装置,该训练装置包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的神经网络模型的训练方法。
[0029]
第四方面,本技术提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机可读存储介质中的指令由神经网络模型的训练装置的处理器执行时,使得神经网络模型的训练装置能够执行如第一方面和第一方面的任一种可能的实现方式中描述的神经网络模型的训练方法。
[0030]
第五方面,本技术提供一种包含指令的计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在神经网络模型的训练装置上运行时,使得神经网络模型的训练装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的神经网络模型的训练方法。
[0031]
第六方面,本技术提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的神经网络模型的训练方法。
[0032]
上述第二方面至第五方面中任一种实现方式所带来的技术效果可以参见第一方面对应设计所带来的技术效果,此处不再赘述。
附图说明
[0033]
图1为本技术实施例提供的一种神经网络模型的训练装置的结构示意图;
[0034]
图2为本技术实施例提供的一种神经网络模型的训练方法的流程示意图;
[0035]
图3为本技术实施例提供的另一种神经网络模型的训练方法的流程示意图;
[0036]
图4为本技术实施例提供的另一种神经网络模型的训练装置的结构示意图。
具体实施方式
[0037]
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和 b,单独存在b这三种情况。
[0038]
本技术的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
[0039]
此外,本技术的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选的还包括其他没有列出的步骤或单元,或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0040]
需要说明的是,本技术实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
[0041]
在本技术的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
[0042]
以下,对本技术实施例涉及的名词进行解释,以方便读者理解。
[0043]
1、神经网络模型:是指由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统。神经网络模型具有大规模并行、分布式存储和处理、自组织、自适应、以及自学的特点,特别适合处理需要同时考虑许多因素和条件、以及不精确和模糊的信息来处理问题的场景。
[0044]
需要说明的是,神经网络模型中不仅需要模型算法,还需要特征工程。
[0045]
其中,模型算法主要用于训练神经网络模型,可以为梯度提升决策树(gradient boosting decision tree,gbdt)、梯度提升树(gradient boosting tree, gbt)、梯度提升机械(light gradient boosting machine,lightgbm)算法。
[0046]
其中,特征工程包括用户输入的原始数据以及对用户输入的原始数据进行加权的权重值。对于检测不同目标的神经网络模型来说,需要构建不同的特征工程。
[0047]
2、运营商通常采用两大系统(即业务支撑系统(business support system,bss)和运营支撑系统(operation support system,oss))进行数据管理。
[0048]
其中,bss是面对用户的业务支撑系统,主要用于对用户的套餐计费、用户的营业情况、用户的账务、以及用户的服务资料等数据进行管理。bss 所管理的数据称为bss域数据。bss域数据可以包括多种字段名、多种字段含义、以及多种字段类型。
[0049]
示例性的,单个用户在预设时间段内的bss数据如下表1所示。
[0050]
表1
[0051]
字段名字段含义字段类型month _id账期字符串user id订购实例标识字符串cust id客户标识字符串cust type归属客户类型字符串service type业务类型字符串brand _id品牌标识字符串
area id归属地市字符串user diff code用户类别字符串device number接入号码字符串net typecbss网别cbss字符串score value积分值整数credit class信用等级字符串basic _credit value基本信用度整数credit _value信用度整数is acct出帐标志字符串pay mode付费方式字符串innet date入网时间字符串oper date开户时间字符串is innet是否在网字符串innet months在网时长整数total _fee出账收入整数
[0052]
需要说明的是,上述表1仅为bss域数据的一种示例,不对bss域数据做任何限定。
[0053]
其中,oss是面向网络资源的后台支撑系统,主要用于对核心网络电路域数据、分组域数据、无线网络基础数据等数据进行管理。oss所管理的数据称为oss域数据。需要说明的是,oss域数据可以通过通信接口来获取。
[0054]
需要说明的是,oss域数据可以通过通信接口所传输的通话详单文件 (x detailed record,xdr)中获取。xdr可以包括多种字段名和多种字段类型。
[0055]
示例性的,iucs接口所传输的xdr可以通过下表2所示。
[0056]
表2
[0057]
字段名字段类型(长度)proctypevarchar(5)xdrtypevarchar(5)starttimetimestampendtimetimestamplac_enbidvarchar(20)ci_ecivarchar(20)imsivarchar(20)msisdnvarchar(20)imeivarchar(20)pmsisdnvarchar(20)pimsivarchar(20)talklennumber(5)resultvarchar(2)rrantypevarchar(5)rdirevarchar(5)
subevttypevarchar(5)
[0058]
示例性的,s1mme接口所传输的xdr可以通过下表3所示。
[0059]
表3
[0060]
列名类型(长度)proctypevarchar(5)sdrtypevarchar(5)startt metimestampendtimetimestamplacenbidvarchar(20)ciecivarchar(20)imsivarchar(20)msisdnvarchar(20)imeivarchar(20)示例性的,s1uhttp接口所传输的xdr可以通过下表4所示。
[0062]
表4
[0063]
列名列中文名类型(长度)proctype接口类型varchar(5)sdrtype话单类型varchar(5)starttime开始时间timestampendtime结束时间timestamplac_enbid位置区或跟踪区编码基站编码varchar(20)ci_eciciecivarchar(20)imsiimsivarchar(20)msisdn手机号码varchar(20)imei终端标识varchar(20)servname流量类型varchar(5)uptraffic上行流量number(10)downtraffic下行流量number(10)result呼叫结果varchar(2)apapnvarchar(32)hosthostvarchar(256)uri网址/特征信息varchar(2048)user_agentuser agentvarchar(256)duration操作时长number(8)province省varchar(20)day日期varchar(20)durition时长number(20)uldurarion上行持续时长number(20)dldurarion下行持续时长number(0)
[0064]
需要说明的是,上述表2、表3、以及表4仅为xdr的三种示例,不对xdr做任何限定。
[0065]
以上是对本技术实施例中涉及到的部分概念所做的简单介绍,以下不再赘述。
[0066]
目前,对于如何确定用户的消费水平,往往是通过对用户做调查问卷,查询银行窗口记录以及信用卡消费记录等方式实现,从银行业的数据中获得用户在消费水平方面的信息,但这些数据包含的信息覆盖的用户维度较少,难以对用户的消费水平作出准确的分析。
[0067]
基于大数据的用户行为预测和研究已得到广泛应用,例如,在应急事件支撑、场景化精准营销等众多场景中均被广泛研究。而运营商数据直接关系到用户的各种消费行为,如何运用运营商数据进行用户的消费行为分析,具有战略意义。
[0068]
但由于运营商大数据错综复杂,指标体系丰富,具体选择哪些维度的指标作为用户的消费行为的判别依据,以准确的评价用户的消费水平,是一个复杂问题,且无法依据经验提出合理的方案。进一步的,如果直接把运营商大数据的所有指标都作为神经网络模型训练的特征工程,会产生由于特征选择不合理所导致的模型准确度低的问题。
[0069]
为了解决上述技术问题,本技术实施例提供一种神经网络模型的训练方法。本技术实施例提供的神经网络模型可以应用于各种应用场景,例如,对不同住宅小区中住户的消费水平预测场景,对高校大学生的消费水平的预测场景等等。本领域普通技术人员可知,随着科学技术的演变和新类型场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
[0070]
为了实现本技术实施例提供的神经网络模型的训练方法,本技术实施例提供了一种神经网络模型的训练装置,用于执行所述的神经网络模型的训练方法,图1为本技术实施例提供的一种神经网络模型的训练装置的结构示意图。如图1所示,该训练装置100包括至少一个处理器101,通信线路102,以及至少一个通信接口104,还可以包括存储器103。其中,处理器101,存储器103以及通信接口104三者之间可以通过通信线路102 连接。
[0071]
处理器101可以是一个中央处理器(central processing unit,cpu),也可以是特定集成电路(application specific integrated circuit,asic),或者是被配置成实施本技术实施例的一个或多个集成电路,例如:一个或多个数字信号处理器(digital signal processor,dsp),或,一个或者多个现场可编程门阵列(field programmable gate array,fpga)。
[0072]
通信线路102可以包括一通路,用于在上述组件之间传送信息。
[0073]
通信接口104,用于与其他设备或通信网络通信,可以使用任何收发器一类的装置,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local area networks,wlan)等。
[0074]
存储器103可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(randomaccess memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmableread-only memory,eeprom)、只读光盘(compact disc read-only memory, cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于包括或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
[0075]
一种可能的设计中,存储器103可以独立于处理器101存在,即存储器103可以为处
理器101外部的存储器,此时,存储器103可以通过通信线路102与处理器101相连接,用于存储执行指令或者应用程序代码,并由处理器101来控制执行,实现本技术下述实施例提供的神经网络模型的训练方法。又一种可能的设计中,存储器103也可以和处理器101集成在一起,即存储器103可以为处理器101的内部存储器,例如,该存储器103 为高速缓存,可以用于暂存一些数据和指令信息等。
[0076]
作为一种可实现方式,处理器101可以包括一个或多个cpu,例如图 1中的cpu0和cpu1。作为另一种可实现方式,训练装置100可以包括多个处理器,例如图1中的处理器101和处理器107。作为再一种可实现方式,训练装置100还可以包括输出设备105和输入设备106。
[0077]
如图2所示,本技术实施例提供了一种神经网络模型的训练方法,应用于图1中的训练装置100,该方法包括步骤s201-s204。
[0078]
s201、训练装置获取多个样本用户的运营商数据,以及多个样本用户的消费行为等级。
[0079]
其中,多个样本用户的群体特征应与待预测用户的群体特征相同,群体特征可以包括以下至少一项:地域,职业,年龄,以及性别。
[0080]
示例性的,以高校大学生的消费水平的预测场景为例,训练装置可以选取多名高校大学生作为样本用户。例如,训练装置可以获取1000名高校大学生在12个月内的运营商数据。本技术实施例中,运营商数据可以包括以下至少一项:通话行为数据,网络行为数据,以及位置轨迹数据。
[0081]
可选的,样本用户的通话行为数据可以为运营商数据中与样本用户的通话相关的数据。
[0082]
作为一种可能的实现方式,训练装置可以获取用户的通话行为记录,根据用户的通话行为记录,确定通话行为数据。
[0083]
在一些实施例中,训练装置可以确定多个样本用户的用户标识,根据用户标识,提取oss域中的通话行为记录。示例性的,训练装置可以提取 oss域中数据中的iucs接口所传输的xdr,根据iucs接口所传输的xdr,确定通话行为记录。
[0084]
其中,样本用户的用户标识用于表示样本用户的身份信息。示例性的,用户标识可以为样本用户的手机号码。又一示例性的,用户标识还可以为样本用户的身份证号码。
[0085]
需要说明的是,iucs接口所传输的xdr还包括除通话行为记录之外的其他信息,因此,训练装置还需对iucs接口的xdr进行预处理,以得到通话行为记录。示例性的,训练装置筛选iucs接口的xdr中呼叫成功的记录,以确定通话行为记录。
[0086]
可选的,样本用户的网络行为数据可以为运营商数据中与样本用户的上网行为相关的数据。网络行为数据可以包括以下至少一项:用户的网络支付行为,网络浏览行为,用户终端使用情况。
[0087]
作为一种可能的实现方式,训练装置可以获取用户的上网行为中的网络支付记录,以确定网络行为数据中的网络支付行为。训练装置可以获取用户的上网行为中的网络浏览记录,以确定网络行为数据中的网络浏览行为。训练装置可以获取用户标识关联的终端库,得到用户终端使用情况。其中,用户终端使用情况包括用户使用的手机信息。
[0088]
示例性的,训练装置可以根据用户标识,提取oss域中的网络支付记录,网络浏览
记录,以及终端库,以确定样本用户的网络行为数据。例如,训练装置可以提取oss域中iucs接口,iups接口,s1mme接口,以及 s1uhttp接口所传输的xdr,以确定样本用户的网络行为数据。
[0089]
可选的,样本用户的位置轨迹数据可以为运营商数据中与样本用户的出行或移动相关的数据。
[0090]
作为一种可能的实现方式,训练装置可以获取样本用户的位置移动记录,以确定样本用户的位置轨迹数据。从而,训练装置可以根据用户的位置轨迹数据,匹配用户出入高消费场所的信息,确定样本用户的出行消费相关的数据。
[0091]
示例性的,训练装置可以根据用户标识,提取oss域中的位置移动记录,以确定样本用户的位置轨迹数据。例如,训练装置可以提取oss域中 s1uhttp接口所传输的xdr,以确定样本用户的网络行为数据。
[0092]
可以理解的是,用户的运营商数据涉及用户日常行为中的多个方面。例如,用户的通话行为,上网行为,购物行为,出行行为等。对用户的运营商数据进行分析,可以从多个维度,更加全面的对用户的消费水平进行分析,从而提高对用户消费行为预测的准确性。
[0093]
本技术实施例中,样本用户的消费行为等级用于表示样本用户的消费行为的能力水平。
[0094]
示例性的,消费行为等级可以为多级,消费行为等级越高,表示消费行为的能力水平越强。例如,消费行为等级可以为5级,分别为1级,2 级,3级,4级,5级。其中,1级级别最低,则对应的消费行为的能力水平最低;5级级别最高,则对应的消费行为的能力水平最高。
[0095]
作为一种可能的实现方式,获取多个样本用户的消费行为等级,可以具体实现为:获取多个样本用户的上报数据,走访数据,以及政务数据,根据上报数据,走访数据,以及政务数据,确定多个样本用户的消费水平,根据多个样本用户的消费水平,确定多个样本用户的消费行为等级。
[0096]
其中,上报数据可以由样本用户做问卷调查得到。走访数据可以由相关工作人员走访样本用户得到。政务数据可以为政府部门提供的数据。例如,街道办,高校后勤部门。政府数据中心,银行部门等,在此不作赘述。
[0097]
在一些实施例中,训练装置可以根据上报数据,走访数据,以及政务数据,确定多个样本用户所在家庭的人均收入、家庭总收入、家庭总支出等一项或多项收入指标,根据多个样本用户的收入指标,确定多个样本用户的收入水平,根据该收入水平,确定多个样本用户的消费行为等级。
[0098]
s202、训练装置根据多个样本用户的运营商数据,确定多个样本用户的消费行为。
[0099]
其中,多个样本用户的消费行为用于评价样本用户的消费能力水平。消费行为包括以下至少一项:线下消费方式,通话地区,出行方式,线上消费方式,金融偏好,通信消费,以及借贷行为。
[0100]
作为一种可能的实现方式,训练装置可以根据通话行为数据,网络行为数据,以及位置轨迹数据,确定多个样本用户的消费行为。
[0101]
示例性的,多个样本用户的线下消费方式可以根据网络行为数据中的线下支付行为,以及位置轨迹数据确定。
[0102]
示例性的,多个样本用户的通话地区可以根据通话行为数据确定。
[0103]
示例性的,多个样本用户的出行方式可以根据多个样本用户的出行支付行为,以及出行轨迹确定。
[0104]
示例性的,多个样本用户的线上消费方式可以根据网络行为数据中的线上支付行为确定。
[0105]
示例性的,多个样本用户的金融偏好可以根据网络行为数据中的金融浏览行为确定。
[0106]
示例性的,多个样本用户的通信消费可以根据多个样本用户使用的手机信息,以及网络行为数据中的业务使用情况确定。
[0107]
可以理解的是,多个样本用户的消费行为涉及样本用户的通话,出行,金融,购物,借贷等多种消费场景,训练装置可以基于消费行为,从多个维度对运营商数据进行分析,使得对用户消费行为的分析更加准确。
[0108]
s203、训练装置确定多个样本用户的消费行为中,每个消费行为的行为特征数据。
[0109]
其中,消费行为的行为特征数据用于表示样本用户对消费行为的消费倾向,应用偏好,以及消费规律。行为特征数据可以包括行为热度,行为深度,以及行为规律。
[0110]
本技术实施例中,消费行为的行为热度用于表征用户对于消费行为的消费倾向。
[0111]
在一些实施例中,线下消费方式的行为热度用于表征样本用户对线下消费的消费倾向程度。示例性的,线下消费方式的行为热度越高,则表示样本用户越倾向于线下消费。
[0112]
作为一种可能的实现方式,线下消费方式的行为热度可以根据如下方式确定:根据位置轨迹数据,确定多个样本用户是否出入高消费场所,其中,高消费场所为消费水平高于预设阈值的消费场所;若多个样本用户出入高消费场所,则根据网络行为数据中的线下支付行为,确定线下消费方式的行为热度。
[0113]
示例性的,线下消费方式的行为热度可以为样本用户线下消费的频次和时长。例如,线下消费方式的行为热度可以包括表5中的至少一项特征:
[0114]
表5
[0115]
用户标识e1:月均出入高消费场所的次数e2:月均出入高消费场所的时长e3:月均出入高消费场所且发生支付行为的次数
[0116]
在一些实施例中,通话地区的行为热度用于表征样本用户与目标消费水平地区通话的消费倾向程度。示例性的,通话地区的行为热度越高,则表示样本用户越倾向于和目标消费水平地区的用户通话,样本用户与目标消费水平地区的关联性较大。
[0117]
作为一种可能的实现方式,通话地区的行为热度可以根据如下方式确定:根据通话行为数据中通话记录的对端号码的归属地,确定与目标消费水平地区相关的通话记录;根据与目标消费水平地区相关的通话记录,确定通话地区的行为热度。
[0118]
示例性的,通话地区的行为热度可以为样本用户与目标消费水平地区通话的频次和时长。例如,通话地区的行为热度可以包括表6中的至少一项特征:
[0119]
表6
[0120][0121]
在一些实施例中,出行方式的行为热度用于表征样本用户对出行方式的消费倾向程度。示例性的,样本用户更倾向于乘坐公共交通出行,或者,样本用户更倾向于乘坐网约车出行。
[0122]
作为一种可能的实现方式,出行方式的行为热度可以根据如下方式确定:根据多个样本用户的出行轨迹,确定多个样本用户每次出行行为的速度;若出行行为的速度满足预设条件,则根据出行支付行为的应用类型,确定出行方式的行为热度。
[0123]
其中,出行支付行为的应用类型用于表征样本用户出行时选择的交通消费方式。示例性的,出行支付行为的应用类型可以为表7中示出的至少一项,也即公共交通,网约车,租车,自驾。
[0124]
表7
[0125][0126][0127]
例如,假设用户在一次出行行为中,用户的移动速度大于100米/分钟,则训练装置对出行类应用的使用时长进行判断,若“滴滴打车”这一应用的使用时长最长,则判定此次出行方式为网约车出行,并记录此次出行过程中“滴滴打车”这一应用的使用时长。
[0128]
示例性的,出行方式的行为热度可以为样本用户使用出行类应用的频次和时长。例如,出行方式的行为热度可以包括表8中的至少一项特征:
[0129]
表8
[0130]
用户标识t1:月均使用公共交通出行的次数占月均出行次数的比重t2:月均使用网约车出行的次数占月均出行次数的比重t3:月均租车出行的次数占月均出行次数的比重t4:月均自驾出行的次数占月均出行次数的比重
[0131]
在一些实施例中,线上消费方式的行为热度用于表征样本用户对线上消费的消费倾向程度。示例性的,线上消费方式的行为热度越高,则表示样本用户越倾向于线上消费。
[0132]
作为一种可能的实现方式,线上消费方式的行为热度可以根据线上支付行为中应用类型以及支付记录确定。
[0133]
其中,线上支付行为中应用类型用于表征样本用户线上消费时选择的消费类别。示例性的,线上支付行为中应用类型可以为表9中示出的至少一项,也即电器类消费,日用百货类消费,书籍类消费,餐饮类消费。
[0134]
表9
[0135][0136]
示例性的,线上消费方式的行为热度可以为样本用户使用线上消费类应用的频次和时长。例如,线上消费方式的行为热度可以包括表10中的至少一项特征:
[0137]
表10
[0138]
用户标识s1:月均使用线上消费类应用的次数s2:月均使用线上消费类应用的时长s3:月均使用线上消费类应用的流量s4:月均使用线上消费类应用的数量占月均使用应用数量的比重s5:月均使用线上消费类应用的次数占月均使用应用次数的比重s6:月均使用线上消费类应用的流量占月均使用应用流量的比重s7:月均使用线上消费类应用的时长占月均使用应用时长的比重
[0139]
在一些实施例中,金融偏好的行为热度用于表征样本用户对金融行为的消费倾向程度。示例性的,金融偏好的行为热度越高,则表示样本用户越倾向于金融消费。
[0140]
作为一种可能的实现方式,金融偏好的行为热度可以根据金融浏览行为中应用类型以及浏览记录确定。
[0141]
其中,金融浏览行为中应用类型用于表征样本用户在金融行为中的应用偏好。示例性的,金融浏览行为中应用类型可以为表11中示出的至少一项,也即银行类应用,理财类应用,其他类应用等。
[0142]
表11
[0143][0144]
示例性的,金融偏好的行为热度可以为用户使用金融类应用的频次和时长。例如,金融偏好的行为热度可以包括表12中的至少一项特征:
[0145]
表12
[0146]
用户标识f1:月均使用金融类应用的次数f2:月均使用金融类应用的时长f3:月均使用金融类应用的流量f4:月均使用金融类应用的数量占月均使用应用数量的比重f5:月均使用金融类应用的次数占月均使用应用次数的比重f6:月均使用金融类应用的流量占月均使用应用流量的比重f7:月均使用金融类应用的时长占月均使用应用时长的比重
[0147]
在一些实施例中,通信消费的行为热度用于表征样本用户对通信消费的消费倾向程度。示例性的,通信消费的行为热度越高,则表示样本用户越倾向于通信消费。
[0148]
作为一种可能的实现方式,通信消费的行为热度可以根据手机信息中的手机价值和更换频次,以及业务使用情况中的流量业务使用情况和语音业务使用情况确定。
[0149]
示例性的,通信消费的行为热度可以为样本用户对手机的使用情况。例如,通信消费的行为热度可以包括表13中的至少一项特征:
[0150]
表13
[0151]
用户标识c1:手机价值是否大于预设阈值c2:预设时间段内换手机次数c3:月均使用流量c4:月均使用语音时长
[0152]
可选的,用户的消费行为还可以包括借贷行为。借贷行为的行为热度用于表征样本用户对借贷类消费的倾向程度。示例性的,借贷行为的行为热度越高,则表示样本用户越倾向于借贷类消费。
[0153]
作为一种可能的实现方式,借贷行为的行为热度可以根据借贷行为中用户使用的应用类型以及借贷记录确定。
[0154]
其中,借贷行为中用户使用的应用类型用于表征样本用户在借贷行为中的应用偏好。示例性的,借贷行为中应用类型可以为表14中示出的至少一项,也即快贷类应用,分期贷类应用,其他类应用等。
[0155]
表14
[0156][0157]
示例性的,借贷行为的行为热度可以为样本用户使用借贷类应用的频次和时长。例如,借贷行为的行为热度可以包括表15中的至少一项特征:
[0158]
表15
[0159]
用户标识l1:月均使用借贷类应用的次数l2:月均使用借贷类应用的时长l3:月均使用借贷类应用的流量l4:月均使用借贷类应用的数量占月均使用应用数量的比重l5:月均使用借贷类应用的次数占月均使用应用次数的比重l6:月均使用借贷类应用的流量占月均使用应用流量的比重l7:月均使用借贷类应用的时长占月均使用应用时长的比重
[0160]
本技术实施例中,消费行为的行为深度用于表征用户对于消费行为所使用的应用类型的集中程度。
[0161]
作为一种可能的实现方式,消费行为的行为深度可以根据如下方式确定:根据消费行为的行为热度,以及用户对于消费行为所使用的应用类型,确定行为热度的每项特征中与应用类型对应的特征值;根据行为热度的每项特征中与应用类型对应的特征值,以及应用类型的种类,确定消费行为的行为深度。
[0162]
在一些实施例中,消费行为的行为深度满足如下公式1:
[0163][0164]
其中,n为消费行为的标识;j为消费行为行为热度中特征的标识;s
nj
为第n个消费行为的行为热度中第j项特征的行为深度;m为应用类型的种类数;为第n个消费行为的行为热度中第j项特征与第i类应用类型对应的特征值;为第n个消费行为的行为热度中第j项特征与应用类型对应的特征值的平均值。
[0165]
示例性的,以线上消费方式的行为深度为例,对于特征s1:月均使用线上消费类应用的次数,其对应的行为深度满足如下公式2:
[0166][0167]
其中,s
41
为线上消费方式的行为热度中特征s1:月均使用线上消费类应用的次数对应的行为深度;m为线上消费类应用的种类数;s
41i
为月均使用第i类应用的次数;为月均使用不同种类的线上消费类应用的次数的平均值。
[0168]
本技术实施例中,行为规律,用于表征消费行为的行为热度和行为深度的可用性。
[0169]
作为一种可能的实现方式,消费行为的行为规律可以由如下方式确定:在消费行为的日行为数据大于预设阈值的情况下,记录日行为数据对应的当天为消费行为的行为热度日,日行为数据为与行为热度的特征对应的每天的消费行为数据;根据每月中行为热度日的天数,以及每月中发生消费行为的天数,确定消费行为的行为规律。
[0170]
在一些实施例中,消费行为的行为规律满足如下公式3:
[0171][0172]
其中,t为运营商数据中自然月的数量;hn为第n个消费行为的行为规律;s
npt
为在第t个月中,第n个消费行为的行为热度日的天数与发生消费行为的天数的比值。
[0173]
可以理解的是,消费行为的行为规律可以理解为行为热度和行为深度的信息熵,信息熵用于刻画消费行为的概率或变异性,也即用户发生该类消费行为的规律性。或者,还可以表述为行为规律用于表征行为热度和行为深度的可用性。
[0174]
示例性的,训练装置可以根据消费行为的行为规律,确定消费行为的行为特征数据的权重,以增加预设神经网络模型的输入数据的准确性。例如,金融偏好类消费行为的行为规律的取值较大,则表示金融偏好类消费行为的行为热度和行为深度的可用性较高。因此,训练装置可以提高金融偏好类消费行为的行为热度和行为深度的权重,以提高预设神经网络模型的输入数据的准确性,从而提高对用户消费水平预测的准确度。
[0175]
示例性的,以线上消费方式的行为规律为例,对于特征s1:月均使用线上消费类应用的次数,其对应的行为规律可以由如下公式确定:
[0176][0177]
其中,h4为线上消费方式的行为规律;s
4pt
为在第t个月中,线上消费方式的行为热度日的天数与发生消费行为的天数的比值;t为运营商数据中自然月的数量。示例性的,t可以为12,也即获取的是样本用户12个月内的运营商数据。
[0178]
需要说明的是,消费行为的行为特征数据从行为热度,行为深度,以及行为规律综合分析了用户对消费行为的消费倾向,应用偏好,以及消费规律,不仅从多个维度对用户的消费行为进行分析,还对每类消费行为进行深度和规律性分析,极大地提高了对运营商数据的分析程度,提高了神经网络模型在训练过程中的输入参数的准确性,从而提高了神经网络模型对用户的消费行为预测的准确性。
[0179]
s204、训练装置将多个样本用户的行为特征数据,以及多个样本用户的消费行为等级作为训练数据对预设神经网络模型进行训练,得到消费行为预测模型。
[0180]
其中,消费行为预测模型的输入数据为待预测用户的行为特征数据,消费行为预测模型的输出数据为待预测用户的消费行为等级。
[0181]
在一些实施例中,训练装置可以直接将行为特征数据中的行为热度,行为深度,以及行为规律输入到预设神经网络模型进行训练,得到消费行为预测模型。
[0182]
在另一些实施例中,训练装置还可以设置行为特征数据中的行为热度,行为深度,以及行为规律的权重值,将行为特征数据,以及权重值输入到预设神经网络模型进行训练,得到消费行为预测模型。
[0183]
本技术实施例提供的技术方案,一方面,本技术中的神经网络模型是以运营商数据为基础,对用户的通话行为数据,网络行为数据,以及位置轨迹数据进行分析处理,而由于运营商数据存在数据量大,类型多,真实性高的特点,因此,本技术中的神经网络模型为用户的消费水平的准确预测奠定了数据基础。另一方面,本技术在运营商数据的基础上,构建了消费方式,通话地区,出行方式,网购行为,金融偏好,以及通信消费六类消费行为,可以从多个维度对用户的消费行为进行预测。进一步的,本技术还计算了六类消费行为的行为特征数据,也即行为热度,行为深度,以及行为规律,不仅从多个维度对用户的消费行为进行分析,还对每类消费行为进行深度和规律性分析,极大地提高了对运营商数据的分析程度,提高了神经网络模型在训练过程中的输入参数的准确性,从而提高了神经网络模型对用户的消费行为预测的准确性。
[0184]
可选的,如图3所示,在得到消费行为预测模型之后,本技术实施例还提供了一种使用该消费行为预测模型预测用户的消费行为的方法,如图 3所示,该方法包括步骤s301-s303:
[0185]
s301、电子设备获取待预测用户的运营商数据。
[0186]
在一些实施例中,电子设备可以包括训练装置100。示例性的,电子设备还可以包括预测装置,其中,预测装置用于对待预测用户的运营商数据进行预测。
[0187]
在另一些实施例中,电子设备为训练装置之外的其他设备,电子设备可以通过图1中所示的通信接口104与训练装置100进行交互。例如,电子设备可以调用训练装置100中的消费行为预测模型。或者,又例如,电子设备可以接收训练装置100发送的消费行为预测模型。
[0188]
本技术实施例中,运营商数据可以包括以下至少一项:通话行为数据,网络行为数据,以及位置轨迹数据。运营商数据的其他相关描述,可以参照步骤s201,在此不再赘述。
[0189]
在一些实施例中,待预测用户可以为高校学生,小区居民,目标消费水平地区人员,某单位人员。
[0190]
需要说明的是,为了提高消费行为预测模型的准确度,待预测用户的群体特征,应与消费行为预测模型的样本用户的群体特征相同,以减少不同群体之间消费行为的差异。
[0191]
s302、电子设备根据待预测用户的运营商数据,确定待预测用户的行为特征数据;
[0192]
作为一种可能的实现方式,训练装置可以根据待预测用户的运营商数据,确定待预测用户的消费行为;确定待预测用户的消费行为中,每个消费行为的行为特征数据。
[0193]
其中,待预测用户的消费行为可以包括以下至少一项:线下消费方式,通话地区,出行方式,线上消费方式,金融偏好,通信消费,以及借贷行为。行为特征数据包括行为热度,行为深度,以及行为规律。
[0194]
消费行为和行为特征数据的其他相关描述,可以参照步骤s202-s203,在此不再赘述。
[0195]
s303、电子设备将待预测用户的行为特征数据输入到消费行为预测模型,得到待预测用户的消费行为等级。
[0196]
如此一来,由消费行为预测模型预测的消费行为等级,既以运营商数据为基础,又充分考虑待预测用户的消费行为的多个维度以及深度,极大地提高了对运营商数据的分析程度,从而使得预测出的消费行为等级更加准确。
[0197]
示例性的,假设待预测用户为高校大学生,采用本技术中实施例提供的消费行为预测模型对高校大学生的消费行为等级进行预测。一方面,消费行为预测模型以高校大学生的运营商数据为基础,充分利用运营商数据数据量大,类型多,真实性高的特点,为高校大学生的消费行为等级的准确预测奠定了数据基础。另一方面,本技术实施例构建了消费方式,通话地区,出行方式,网购行为,金融偏好,以及通信消费等六类用于评价高校大学生的消费行为的评价指标,可以从多个维度对高校大学生的消费行为进行预测。进一步的,本技术还计算了六类消费行为的行为特征数据,也即行为热度,行为深度,以及行为规律,不仅从多个维度对高校大学生的消费行为进行分析,还对高校大学生的每类消费行为进行深度和规律性分析,极大地提高了对运营商数据的分析程度,提高了对高校大学生的消费行为等级的预测过程中的准确性。
[0198]
需要说明的是,高校大学生的消费行为等级与高校大学生的消费水平相关。提高对高校大学生的消费行为等级的预测准确性,可以提高对高校大学生的消费水平的预测准确性,有助于高校大学生中目标消费水平学生的认定,提高高校目标消费水平学生的判定效率。
[0199]
可以看出,上述主要从方法的角度对本技术实施例提供的技术方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/ 或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本技术实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0200]
本技术实施例可以根据上述方法示例对训练装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本技术实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0201]
如图4所示,为本技术实施例提供的一种训练装置的结构示意图。该训练装置包括:通信模块401和处理模块402。
[0202]
通信模块401,用于获取多个样本用户的运营商数据,以及多个样本用户的消费行为等级,运营商数据包括以下至少一项:通话行为数据,网络行为数据,以及位置轨迹数据,消费行为等级用于表示用户的消费行为的能力水平。
[0203]
处理模块402,用于根据多个样本用户的运营商数据,确定多个样本用户的消费行
为;消费行为包括以下至少一项:线下消费方式,通话地区,出行方式,线上消费方式,金融偏好,以及通信消费;确定多个样本用户的消费行为中,每个消费行为的行为特征数据;行为特征数据包括行为热度,行为深度,以及行为规律;行为热度用于表征用户对于消费行为的消费倾向;行为深度用于表征用户对于消费行为所使用的应用类型的集中程度;行为规律,用于表征消费行为的行为热度和行为深度的可用性;将多个样本用户的行为特征数据,以及多个样本用户的消费行为等级作为训练数据对预设神经网络模型进行训练,得到消费行为预测模型;消费行为预测模型的输入数据为待预测用户的行为特征数据,消费行为预测模型的输出数据为待预测用户的消费行为等级。
[0204]
在一些实施例中,通信模块401,还用于获取待预测用户的运营商数据。处理模块402,还用于根据待预测用户的运营商数据,确定待预测用户的行为特征数据;将待预测用户的行为特征数据输入到消费行为预测模型,得到待预测用户的消费行为等级。
[0205]
在一些实施例中,处理模块402,具体用于根据网络行为数据中的线下支付行为,以及位置轨迹数据,确定多个样本用户的线下消费方式;根据通话行为数据,确定多个样本用户的通话地区;根据多个样本用户的出行支付行为,以及出行轨迹,确定多个样本用户的出行方式;根据网络行为数据中的线上支付行为,确定多个样本用户的线上消费方式;根据网络行为数据中的金融浏览行为,确定多个样本用户的金融偏好;根据多个样本用户使用的手机信息,以及网络行为数据中的业务使用情况,确定多个样本用户的通信消费。
[0206]
在一些实施例中,处理模块402,具体用于根据位置轨迹数据,确定多个样本用户是否出入高消费场所,高消费场所为消费水平高于预设阈值的消费场所;若多个样本用户出入高消费场所,则根据网络行为数据中的线下支付行为,确定线下消费方式的行为热度,线下消费方式的行为热度包括以下至少一项特征:月均出入高消费场所的次数,月均出入高消费场所的时长,以及月均出入高消费场所且发生支付行为的次数;根据通话行为数据中通话记录的对端号码的归属地,确定与目标消费水平地区相关的通话记录;根据与目标消费水平地区相关的通话记录,确定通话地区的行为热度,通话地区的行为热度包括以下至少一项特征:月均与目标消费水平地区的通话次数,月均与目标消费水平地区的通话时长,月均与目标消费水平地区通话的号码数量,月均与目标消费水平地区的通话数量占月均通话数量的比重;根据多个样本用户的出行轨迹,确定多个样本用户每次出行行为的速度;若出行行为的速度满足预设条件,则根据出行支付行为的应用类型,确定出行方式的行为热度,出行方式的行为热度包括以下至少一项特征:月均使用公共交通出行的次数占月均出行次数的比重,月均使用网约车出行的次数占月均出行次数的比重,月均租车出行的次数占月均出行次数的比重,月均自驾出行的次数占月均出行次数的比重;根据线上支付行为中应用类型以及支付记录,确定线上消费方式的行为热度,线上消费方式的行为热度包括以下至少一项特征:月均使用支付类应用的次数,月均使用支付类应用的时长,月均使用支付类应用的流量,月均使用支付类应用的数量占月均使用应用数量的比重,月均使用支付类应用的次数占月均使用应用次数的比重,月均使用支付类应用的流量占月均使用应用流量的比重,月均使用支付类应用的时长占月均使用应用时长的比重;根据金融浏览行为中应用类型以及浏览记录,确定金融偏好的行为热度,金融偏好的行为热度包括以下至少一项特征:月均使用金融类应用的次数,月均使用金融类应用的时长,月均使用金融类应用的流量,月均使用金融类应用的数量占月均使用应用数量的比重,月均使用金融类应用
的次数占月均使用应用次数的比重,月均使用金融类应用的流量占月均使用应用流量的比重,月均使用金融类应用的时长占月均使用应用时长的比重;根据手机信息中的手机价值和更换频次,以及业务使用情况中的流量业务使用情况和语音业务使用情况,确定通信消费的行为热度,通信消费的行为热度包括以下至少一项特征:手机价值是否大于预设阈值,预设时间段内换手机次数,月均使用流量,月均使用语音时长。
[0207]
在一些实施例中,处理模块402,具体用于根据消费行为的行为热度,以及用户对于消费行为所使用的应用类型,确定行为热度的每项特征中与应用类型对应的特征值;根据行为热度的每项特征中与应用类型对应的特征值,以及应用类型的种类,确定消费行为的行为深度。
[0208]
在一些实施例中,消费行为的行为深度可以由如下公式计算得到:
[0209]
其中,n为消费行为的标识,j为消费行为行为热度中特征的标识,s
nj
为第n个消费行为的行为热度中第j项特征的行为深度,m为应用类型的种类数,为第n个消费行为的行为热度中第j项特征与第i类应用类型对应的特征值;为第n个消费行为的行为热度中第 j项特征与应用类型对应的特征值的平均值。
[0210]
在一些实施例中,处理模块402,具体用于在消费行为的日行为数据大于预设阈值的情况下,记录日行为数据对应的当天为消费行为的行为热度日,日行为数据为与行为热度的特征对应的每天的消费行为数据;根据每月中行为热度日的天数,以及每月中发生消费行为的天数,确定消费行为的行为规律。
[0211]
在一些实施例中,消费行为的行为规律可以由如下公式计算得到:
[0212][0213]
其中,t为运营商数据中自然月的数量,hn为第n个消费行为的行为规律,s
npt
为在第t个月中,第n个消费行为的行为热度日的天数与发生消费行为的天数的比值。
[0214]
在一些实施例中,网络行为数据包括用户的网络支付行为,网络浏览行为,用户终端使用情况;通信模块401,具体用于确定多个样本用户的用户标识;获取用户标识对应的网络浏览行为,获取用户标识关联的终端库,得到用户终端使用情况,用户终端使用情况包括用户使用的手机信息;获取用户的位置轨迹数据,匹配用户出入高消费场所的信息;获取上网行为中的网络支付行为;获取用户的通话行为记录,确定通话行为数据。
[0215]
可选的,该训练装置还可以包括存储模块,用于存储训练装置的程序代码和/或数据。
[0216]
其中,处理模块402可以是处理器或控制器。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包括一个或多个微处理器组合,dsp和微处理器的组合等等。通信模块401可以是收发电路或通信接口等。存储模块可以是存储器。当处理模块402为处理器,通信模块401为通信接口,存储模块为存储器时,本技术实施例所涉及的训练装置可以为图1所示训练装置。
[0217]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上
述功能分配由不同的功能模块完成,即将网络节点的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,模块和网络节点的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0218]
本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述方法实施例所示的方法流程中的各个步骤。
[0219]
本技术的实施例提供一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行上述方法实施例中的训练方法。
[0220]
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(random accessmemory,ram)、只读存储器(read-only memory,rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(compact disc read-onlymemory,cd-rom)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(application specificintegrated circuit,asic)中。在本发明实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0221]
由于本发明的实施例中的装置、设备、计算机可读存储介质、计算机程序产品可以应用于上述方法,因此,其所能获得的技术效果也可参考上述方法实施例,本技术实施例在此不再赘述。
[0222]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何在本技术揭露的技术范围内的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1