基于多阶段时序多任务的用户安全等级识别方法及装置与流程

文档序号:30731490发布日期:2022-07-13 03:06阅读:153来源:国知局
基于多阶段时序多任务的用户安全等级识别方法及装置与流程

1.本技术涉及计算机信息处理领域,具体而言,涉及一种基于多阶段时序多任务的用户安全等级识别方法、装置、电子设备及计算机可读介质。


背景技术:

2.利用历史数据中的有用信息来帮助分析未来数据的机器学习,通常需要大量有标签数据才能训练出一个优良的学习器。深度学习模型是一种典型的机器学习模型,因为这类模型是带有很多隐藏层和很多参数的神经网络,所以通常需要数以百万计的数据样本才能学习得到准确的参数。但是,包括医学图像分析在内的一些应用无法满足这种数据要求,因为标注数据需要很多人力劳动。在这些情况下,多任务学习(mtl)可以通过使用来自其它相关学习任务的有用信息来帮助缓解这种数据稀疏问题。
3.多任务学习任务是根据训练数据集(包含训练数据实例和它们的标签)预测未曾见过的数据的标签。训练数据集中数据的“好坏”对多任务学习的效果有着至关重要的作用。但是,在实际的应用场景中,训练数据集中的数据很难准确的反应真实情况。
4.在所述背景技术部分公开的上述信息仅用于加强对本技术的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.有鉴于此,本技术提供一种基于多阶段时序多任务的用户安全等级识别方法、装置、电子设备及计算机可读介质,能够从实际问题和应用场景出发,从模型样本角度、模型参数角度整体改进多任务机器学习方法,从而保证应用系统用户数据安全、交易安全。
6.本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。
7.根据本技术的一方面,提出一种基于多阶段时序多任务的用户安全等级识别方法,该方法包括:根据全量用户和其对应的用户阶段生成多个阶段集合;将多个阶段集合按照时序依次排列;依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;通过所述多组阶段评分模型对当前用户进行安全等级识别。
8.可选地,根据全量用户和其对应的用户阶段生成多个阶段集合,包括:根据产品特征确定多个用户阶段;将全量用户中每一个用户对应的用户阶段和所述多个用户阶段进行匹配;根据匹配结果将用户分配至和其用户阶段对应的阶段集合中。
9.可选地,根据全量用户和其对应的用户阶段生成多个阶段集合,还包括:为每一个用户阶段确定标签策略;根据所述标签策略为每一个阶段集合中用户分配样本标签。
10.可选地,依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,包括:提取所述多个阶段集合中的第一阶段集合;将
第一阶段集合输入第一组初始模型中,生成第一组模型参数向量;根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数。
11.可选地,依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,还包括:为每一个用户阶段确定一组机器学习模型;根据每一个用户阶段对应的标签策略为历史用户分配样本标签;通过带有样本标签的历史用户对第n+1组机器学习模型进行训练,生成第n+1组初始模型,n为正整数。
12.可选地,将第一阶段集合输入第一组初始模型中,生成第一组模型参数向量,包括:将第一阶段集合中的用户信息分别输入第一组初始模型中;第一组初始模型根据用户信息和其对应的标签进行模型训练,在训练完毕后,生成第一组模型参数向量。
13.可选地,根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,包括:生成更新向量;将所述更新向量加权后叠加到第n+1组初始模型的模型参数向量中;将第n+1阶段集合中的用户信息分别输入模型参数向量更新后的第n+1组初始模型中以进行多任务训练;在训练完毕后,生成第n+1组模型参数向量。
14.可选地,生成更新向量,包括:将第n组模型参数向量进行非线性变换以生成更新向量;或通过第一组至第n组模型参数向量的非线性变换生成第一组至第n组的更新向量。
15.可选地,将第n+1阶段集合中的用户信息分别输入模型参数向量更新后的第n+1组初始模型中以进行多任务训练,包括:将第n+1阶段集合中的用户信息分别输入模型参数向量更新后的第n+1组初始模型中;第n+1组初始模型根据用户信息和其对应的标签进行多任务训练;在训练过程中的损失函数不满足收敛条件时,重新确定第n+1组初始模型的初始模型参数以再次进行多任务训练;在损失函数满足收敛条件时,完成第n+1组初始模型的多任务训练。
16.可选地,重新确定第n+1组初始模型的初始模型参数以再次进行模型训练,包括:对第n+1组初始模型再次进行模型训练以生成新的初始模型参数;或重新确定收敛条件以对第n+1组初始模型再次进行模型训练,生成新的初始模型参数。
17.根据本技术的一方面,提出一种基于多阶段时序多任务的用户安全等级识别装置,该装置包括:阶段模块,用于根据全量用户和其对应的用户阶段生成多个阶段集合;排序模块,用于将多个阶段集合按照时序依次排列;训练模块,用于依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;模型模块,用于直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组评分模型;分级模块,用于通过所述多组评分模型对当前用户进行安全等级识别,根据识别结果确定所述当前用户的安全分级。
18.根据本技术的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
19.根据本技术的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
20.根据本技术的基于多阶段时序多任务的用户安全等级识别方法、装置、电子设备及计算机可读介质,通过根据全量用户和其对应的用户阶段生成多个阶段集合;将多个阶
段集合按照时序依次排列;依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,生成第n组模型参数向量,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;通过所述多组阶段评分模型对当前用户进行安全等级识别的方式,能够从实际问题和应用场景出发,从模型样本角度、模型参数角度整体改进多任务机器学习方法,从而保证应用系统用户数据安全、交易安全。
21.应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本技术。
附图说明
22.通过参照附图详细描述其示例实施例,本技术的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1是根据一示例性实施例示出的样本空间示意图。
24.图2是根据另一示例性实施例示出的样本空间示意图。
25.图3是根据一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法及装置的系统框图。
26.图4是根据一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的流程图。
27.图5是根据另一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的示意图。
28.图6是根据另一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的流程图。
29.图7是根据另一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的示意图。
30.图8是根据一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别装置的框图。
31.图9是根据一示例性实施例示出的一种电子设备的框图。
32.图10是根据一示例性实施例示出的一种计算机可读介质的框图。
具体实施方式
33.现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本技术将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
34.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方
法、装置、实现或者操作以避免模糊本技术的各方面。
35.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
36.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
37.应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本技术概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
38.本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本技术所必须的,因此不能用于限制本技术的保护范围。
39.为了便于理解本技术内容,现以互联网金融服务平台为例,实际应用情况进行说明。如图1所示,在互联网金融平台中,用户注册网站会员之后,在实际服务之前会进行金融资源的申请,互联网服务平台会根据用户的基础信息对用户的金融风险进行评分,评分高于阈值的优质用户允许其进行金融资源借用,评分低于阈值的用户,则不会再提供金融服务。优质用户并不是每个人都会进行实际的金融资源借用,只有部分用户会在实际需要时占用金融资源。优质用户可能会在批准其金融资源借用资格的首日即使用金融资源,也可能在批准其使用金融资源的30日内使用金融资源,还可能在更远一些的时间使用金融资源,当然,也存在完全不使用金融资源的优质用户。在使用金融资源的优质用户中,在金融资源使用期限到期后,可能会有一部分用户存在违约现象,在违约超过一定时间后,该用户则会进入催收流程,有些用户可能在较短的时间内归还违约的资源,有些用户则可能更长时间归还资源。
40.本案申请人发现,在上述的每个步骤中,均会有用户损失(用户被拒绝服务或者用户主动选择不进行后续的服务),而在每个阶段环节的建模样本中,会将在本阶段环节有表现的用户作为正负样本,将上一步骤筛选之后的用户作为无标签样本,正负样本和无标签样本统一构成样本集合,利用半监督机器学习手段进行建模。
41.在上述的每个阶段,均是通过当前阶段中的用户建立训练数据集,从而进行机器学习模型训练的,也就是说,每个阶段中均是基于多次筛选之后的用户建立训练集数据,从而建立评估模型的。如图2所示,真实的样本空间是全量样本空间,而实际训练集的数据是有偏的样本空间,这种情况下,训练出的样本无法真实的反应实际情况。
42.由上述说明可知,在实际应用阶段的样本集合中,由于受到实际情况的限制,实际建模的样本空间远远小于真实的全量样本空间,这就造成了构建的模型在准确度和精确度上存在偏差。为了解决这个问题,本案申请人提出了一种基于多阶段时序多任务的用户安全等级识别方法,下面借助于具体的实施例,对本技术的内容进行详细说明。
43.图3是根据一示例性实施例示出的一种基于多阶段时序多任务(multi-stage interaction sequence,msis)的用户安全等级识别方法及装置的系统框图。
44.如图3所示,系统架构30可以包括终端设备301、302、303,网304和服务器305。网
304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
45.用户可以使用终端设备301、302、303通过网304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种通讯客户端应用,例如互联网服务类应用、购物类应用、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等。
46.终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
47.服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所浏览的互联网服务类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的用户数据进行分析等处理,并将处理结果(例如安全等级、资源配额)反馈给互联网服务网站的管理员和/或终端设备301、302、303。
48.服务器305可例如由终端设备301、302、303获取用户数据作为全量用户数据;服务器305可例如根据全量用户和其对应的用户阶段生成多个阶段集合;服务器305可例如将多个阶段集合按照时序依次排列;服务器305可例如依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;服务器305可例如通过所述多组阶段评分模型对终端设备301、302、303中的用户进行安全等级识别。
49.需要说明的是,本技术实施例所提供的基于多阶段时序多任务的用户安全等级识别方法可以由服务器305和/或终端设备301、302、303执行,相应地,基于多阶段时序多任务的用户安全等级识别装置可以设置于服务器305和/或终端设备301、302、303中。而提供给用户进行互联网服务平台浏览的网页端一般位于终端设备301、302、303中。
50.图4是根据一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的流程图。基于多阶段时序多任务的用户安全等级识别方法40至少包括步骤s402至s410。
51.如图4所示,在s402中,根据全量用户和其对应的用户阶段生成多个阶段集合。可根据产品特征确定多个用户阶段;将全量用户中每一个用户对应的用户阶段和所述多个用户阶段进行匹配;根据匹配结果将用户分配至和其用户阶段对应的阶段集合中。
52.继续以金融服务平台为例进行下文的说明,其中,用户可为个人用户或者企业用户,资源可为金融资源,也可为电力资源、水力资源、数据资源等等。用户信息可包括经过用户授权的基础信息,可例如为业务账号信息、用户的终端设备标识信息、用户所处地域信息等;用户信息还可包括行为信息,可例如为用户的页面操作数据、用户的业务访问时长、用户的业务访问频率等,用户信息的具体内容可根据实际应用场景确定,在此不做限制。在金融服务平台中,可将用户分为“服务申请阶段”、“资源动支阶段”、“逾期阶段”,上述三个阶段根据业务内容存在着时序上的关联。
53.在用户信息中,可包括用户当前所处于的阶段,在用户处于“逾期阶段”的时候,可知该用户经过了“服务申请阶段”、“资源动支阶段”,此时需要将该用户分别放入对应阶段的集合中。同理,当用户处于“资源动支阶段”阶段时,其一定经过了“服务申请阶段”,也需要将该用户分别放入对应阶段的集合中。
54.在一个实施例中,还包括:为每一个用户阶段确定标签策略;根据所述标签策略为每一个阶段集合中用户分配样本标签。更具体的,可为“服务申请阶段”确定“通过”和“拒绝”标签;为“资源动支阶段”确定“首日动支”、“30日内动支”、“60日内动支”标签;“逾期阶段”确定“入催还款”、“入催30日还款”、“入催60日还款”;按照用户信息中的用户表现,分别为不同阶段的用户分配对应于该阶段的标签。
55.在s404中,将多个阶段集合按照时序依次排列。将上述阶段集合按照其对应的按照业务发生顺序排列,即为“服务申请阶段”、“资源动支阶段”、“逾期阶段”三个阶段集合顺序排列。
56.在s406中,依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量。
57.在一个实施例中,还包括:为每一个用户阶段确定一组机器学习模型;根据每一个用户阶段对应的标签策略为历史用户分配样本标签;通过带有样本标签的历史用户对第n组机器学习模型进行多任务训练,生成第n组初始模型,n为正整数。可事先通过历史数据对每个阶段和每个标签分别训练初始模型,可例如,对应于“服务申请阶段”训练生成申请初始模型,对应于“资源动支阶段”训练生成本组模型,可包括首日动支初始模型,30日内动支初始模型,60日内动支初始模型等等。
58.具体的,针对每个训练集合,分别构建初始模型,将所述训练集合中的各个用户的用户信息输入所述初始模型,以得到预测标签,将所述预测标签与相应的真实的标签进行比对,判断预测标签与真实的标签是否一致,统计与真实的标签一致的预测标签的数量,并计算与真实的标签一致的预测标签的数量在所有预测标签的数量中的占比,若所述占比大于或等于预设占比值,则所述初始模型收敛,得到训练完成的初始模型,若所述占比小于所述预设占比值,则调整所述初始模型中的参数,通过调整后的初始模型重新预测各个对象的预测标签,直至所述占比大于或等于预设占比值。其中,调整所述初始模型中的参数的方法可以采用随机梯度下降算法、梯度下降算法或正规方程进行。
59.可提取所述多个阶段集合中的第一阶段集合;将第一阶段集合输入第一组初始模型中,生成第一组模型参数向量;然后根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数。
60.图5所示为本技术引入的多阶段时序多任务机器学习模型框架,其中,多阶段指的是上文中的多个产品阶段,将上述多个产品阶段按照时序排列,并结合多任务学习的方式进行模型训练,即生成本技术中的多阶段时序多任务机器学习模型框架。
61.在具体的应用中,可将第一阶段集合中的用户和其对应的用户标签由输入层输入,共享层对用户数据经常整理,然后输入到第一阶段对应的申请初始模型中,得到对应于本次输入数据的模型参数向量。
62.然后将第二阶段集合中的用户和其对应的用户标签由输入层输入,共享层对用户数据经常整理,然后和第一阶段得到的模型参数向量一起输入到第二阶段对应的首日动支初始模型,30日内动支初始模型,60日内动支初始模型中,得到对应于本次输入数据的三个模型的模型参数向量。
63.后续阶段数据和模型依次处理。其中,“根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数”的详细内容
将在图6,图7对应的实施例中详细说明。
64.在s408中,直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型。在所有的阶段集合训练完毕后,可根据当前每组初始模型中的模型参数生成多组训练完毕的阶段评分模型。
65.在s410中,通过所述多组阶段评分模型对当前用户进行安全等级识别。可例如,在实际的应用场景中,获取当前用户的用户信息;根据用户信息中的用户阶段提取多组阶段评分模型;比如,当前用户处于“服务申请阶段”,则提取“资源动支阶段”和“逾期阶段”对应的多个初始模型。
66.在一个实施例中,还可将所述多组阶段模型按照其对应的阶段时序依次排列;依次将所述用户信息输入多组阶段评分模型中,生成多组阶段评分;根据所述多组阶段评分,确定为所述用户提供的服务。
67.在现有技术中,用户可能在申请阶段评分较少,可能最初就被拒绝了。而在本技术中,利用多阶段时序多任务模型训练出多个不同阶段的模型,在实际应用中,可利用这些模型分别计算该用户的评分,选择最大的评分很可能就是用户最终对应的情况,比如,某个用户在动支阶段30日动支概率最高,则根据这个情况为用户指定优惠信息和策略,促进用户动支,如果用户在逾期阶段超期30天风险评分最高,则为用户确定延期还款策略等等。
68.根据本技术的基于多阶段时序多任务的用户安全等级识别方法,通过根据全量用户和其对应的用户阶段生成多个阶段集合;将多个阶段集合按照时序依次排列;根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;通过所述多组阶段评分模型对当前用户进行安全等级识别的方式,能够从实际问题和应用场景出发,从模型样本角度、模型参数角度整体改进多任务机器学习方法,从而保证应用系统用户数据安全、交易安全。
69.应清楚地理解,本技术描述了如何形成和使用特定示例,但本技术的原理不限于这些示例的任何细节。相反,基于本技术公开的内容的教导,这些原理能够应用于许多其它实施例。
70.图6是根据另一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别方法的流程图。图6所示的流程60是对图4所示的流程中s406“依次根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数”的详细描述。
71.如图6所示,在s602中,将第一阶段集合中的用户信息分别输入第一组初始模型中。如上文所述,可将第一阶段集合中的用户和其对应的用户标签由输入层输入,共享层对用户数据经常整理,然后输入到第一阶段对应的申请初始模型中,得到对应于本次输入数据的模型参数向量。
72.在s604中,第一组初始模型根据用户信息和其对应的标签进行模型训练,在训练完毕后,生成第一组模型参数向量。
73.在s606中,通过第n组模型参数向量更新第n+1组初始模型的模型参数向量。
74.在一个实施例中,可通过非线性变换函数sigmoid函数和第n组模型参数向量更新第n+1组初始模型的模型参数向量;在一些实施例中,还可以采用其他非线性变换的方法对
第n组模型参数向量以更新第n+1组初始模型的模型参数向量,本技术不以此为限。
75.参数传递公式可表示如下:;其中,是代表参数变换之后输入到当前阶段的数据,是代表上一阶段的模型参数,g()为非线性函数。其中,进行非线性变换而不是线性变换的目的是为了让模型参数对应的函数可以更符合实际情况,而不是单纯的直线划分。
76.比如,如果计算出的模型参数是一个一次函数,y=ax+b,则可认为在这个直线之上的用户为好,直线之下的用户为坏,这种情况下,有一些靠近直线的特征点可能被错误的划分;所以,在参数传递的时候,利用非线性函数对模型参数进行拟合,能够使得特征点的划分更加准确,符合实际情况。
77.在一个实施例中,可将第n组模型参数进行非线性变换以生成更新向量;将所述更新向量加权后叠加到第n+1组初始模型的模型参数向量中。这种情况下,参数输出的公式可写为:;其中,为第d-1阶段中第m个模型的模型参数的权重,即上一阶段的第m个模型的模型参数的权重,d为当前阶段,为上一阶段的第m个模型的模型参数向量,m为第d-1阶段的模型数量。
78.在另一个实施例中,可通过第一组至第n组模型参数的非线性变换生成第一组至第n组的更新向量;将第一组至第n组的更新向量加权后叠加到第n+1组初始模型的模型参数向量中。这种情况下,公式可写为:;其中,表示第d-1阶段的第m1个模型的模型参数的权重,表示第d-1阶段的第m1个模型的模型参数向量,m1表示第d-1阶段的模型数量;表示第d-2阶段的第m2个模型的模型参数的权重,表示第d-2阶段的第m2个模型的模型参数向量,m2表示第d-2阶段的模型数量;表示第1阶段的第mn个模型的模型参数的权重,表示第1阶段的第mn个模型的模型参数向量,mn表示第1阶段的模型数量;即为,根据第d-1阶段(上一阶段)的多个模型的模型参数至第一阶段的多个模型的模型参数共同生成本阶段的模型参数。
79.更具体的,上文中每个阶段的权重和

的计算方式可参考进行,可按照如下公式处理:
;;其中,表示归一化前第d-1阶段中第m个模型的模型参数的权重,m为第d-1阶段的模型数量,《》为点积函数,为第d-1阶段中第m个模型的模型参数的权重,为第d-1阶段(上一阶段)的第m个模型的模型参数,g()为非线性函数。
80.将上一阶段的模型参数和本阶段的模型参数进行权重叠加,生成本阶段的模型参数的公式可如下:;其中,函数为非线性变换函数,与上述g()函数相同,均为非线性变换函数,比如,sigmoid函数,当然,也可以采用其他非线性变换的方法,本方案对此不作特别限定。
81.其中,为更新后的当前阶段的第一个初始模型的模型参数向量,当前阶段原有的第一个初始模型的模型参数向量,如需确定更新后的第n个初始模型的模型参数向量,可参考本公式的计算方式,将模型参数向量进行替换,即将公式中的第一个初始模型的模型参数向量更换为第n个初始模型的模型参数向量,得到更新后的第n个初始模型的模型参数向量,,,为权重,,的具体计算方法可参考,或者,由用户根据模型参数向量的重要程度自行进行设置,本技术在此不再赘述。
82.在s608中,将第n+1阶段集合中的用户信息分别输入模型参数向量更新后的第n+1组初始模型中以进行多任务训练。
83.如上文所述,在实际计算中,可将前一阶段的模型的参数向量变换后传入当前阶段的初始模型中,前一阶段的参数向量和当前阶段的参数向量进行加权求和得到当前阶段新的初始模型的参数向量。
84.值得注意的是,当前初始模型的模型参数是事先根据现有特征和标签训练好的模型,直接加上传进来的前一阶段的模型的参数,利用新的模型参数进行当前计算。
85.一方面,模型的收敛并不是对所有特征都会准确判断,另一方面,训练完毕的初始模型参数,其实并不是固定的,在已有特征和标签的情况下只要满足收敛条件了,就会输出结果。而且模型对于输入的用户特征,输出的结果是一个0~1的小数,所以,在原有的模型参数上加上传入的模型的参数,并不一定会影响到对于原有特征的判断结果。所以,新的模型的参数是否会错误判断现有特征和标签。
86.在s610中,在训练完毕后,生成第n+1组模型参数向量。
87.在一个实施例中,可将第n+1阶段集合中的用户信息分别输入模型参数向量更新后的第n+1组初始模型中;第n+1组初始模型根据用户信息和其对应的标签进行多任务训练;在训练过程中的损失函数不满足收敛条件时,重新确定第n+1组初始模型的初始模型参
数以再次进行多任务训练;在损失函数满足收敛条件时,完成第n+1组初始模型的多任务训练。
88.在实际的计算中,如果新的模型对于原有特征的判断不满足收敛条件,比如,预测准确率达不到要求,可以采用对于原有的模型重新再进行训练,得到的新的原有模型的模型参数,然后传入前一阶段的模型参数进行判断,一直迭代,直至原有模型与传入的模型的参数得到的新的模型对于原有特征的判断满足条件为止。
89.在一个实施例中,重新确定第n+1组初始模型的初始模型参数以再次进行模型训练,包括:对第n+1组初始模型再次进行模型训练以生成新的初始模型参数;或重新确定收敛条件以对第n+1组初始模型再次进行模型训练,生成新的初始模型参数。
90.在一个实施例中,如上文所述,训练完毕的模型在已有特征和标签的情况下只要满足收敛条件了,就会输出结果。由于每次训练的模型对应的模型参数并不一定相同,所以,可在多任务训练的训练损失函数不满足收敛条件时,再次对初始模型进行训练,根据训练阶段重新生成一组初始模型的模型参数,然后利用重新生成的初始模型的模型参数再次进行模型训练,直至满足多任务训练的收敛条件为止。
91.在另一个实施例中,可在多任务训练的训练损失函数不满足收敛条件时,调整初始模型训练时候的收敛条件,以便再次对初始模型进行模型训练,获得重新生成的初始模型的模型参数,然后利用重新生成的初始模型的模型参数再次进行模型训练,直至满足多任务训练的收敛条件为止。
92.本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由cpu 执行的计算机程序。在该计算机程序被cpu 执行时,执行本技术提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
93.此外,需要注意的是,上述附图仅是根据本技术示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
94.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
95.图8是根据一示例性实施例示出的一种基于多阶段时序多任务的用户安全等级识别装置的框图。如图8所示,基于多阶段时序多任务的用户安全等级识别装置80包括:阶段模块802,排序模块804,训练模块806,模型模块808,分级模块810。
96.阶段模块802用于根据全量用户和其对应的用户阶段生成多个阶段集合;排序模块804用于将多个阶段集合按照时序依次排列;训练模块806用于根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;模型模块808用于直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组评分模型;分级模块810用于通过所述多组评分模型对当前用户进行安全等级识别,根据识别结果确定所述当前用户的安全分级。
97.根据本技术的基于多阶段时序多任务的用户安全等级识别装置,通过根据全量用
户和其对应的用户阶段生成多个阶段集合;将多个阶段集合按照时序依次排列;根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;通过所述多组阶段评分模型对当前用户进行安全等级识别的方式,能够从实际问题和应用场景出发,从模型样本角度、模型参数角度整体改进多任务机器学习方法,从而保证应用系统用户数据安全、交易安全。
98.图9是根据一示例性实施例示出的一种电子设备的框图。
99.下面参照图9来描述根据本技术的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
100.如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:至少一个处理单元910、至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940等。
101.其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元910执行,使得所述处理单元910执行本说明书中的根据本技术各种示例性实施方式的步骤。例如,所述处理单元910可以执行如图4,图6中所示的步骤。
102.所述存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(rom)9203。
103.所述存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
104.总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
105.电子设备900也可以与一个或多个外部设备900’(例如键盘、指向设备、蓝牙设备等)通信,使得用户能与该电子设备900交互的设备通信,和/或该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口950进行。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器960可以通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
106.通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,如图10所示,根据本技术实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本技术实施方式的上述方法。
107.所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或
半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
108.所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
109.可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
110.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:根据全量用户和其对应的用户阶段生成多个阶段集合;将多个阶段集合按照时序依次排列;根据第n+1阶段集合、第n组模型参数向量对第n+1组初始模型进行多任务训练,生成第n+1组模型参数向量,n为正整数;直至所述多个阶段集合训练完毕,基于多组模型参数向量生成多组阶段评分模型;通过所述多组阶段评分模型对当前用户进行安全等级识别。
111.本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
112.通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本技术实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本技术实施例的方法。
113.以上具体地示出和描述了本技术的示例性实施例。应可理解的是,本技术不限于这里描述的详细结构、设置方式或实现方法;相反,本技术意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1