1.本说明书一个或多个实施例涉及人工智能技术领域,尤其涉及一种建立风 险识别模型的方法、风险识别的方法及对应装置。
背景技术:2.在互联网技术日益发展的今天,用户在使用互联网的各种行为中出现各种 风险,随之而来的是对网络安全的要求越来越高。在实际的风险控制场景中, 图神经网络模型是目前应用比较广泛的一种深度神经网络模型。图神经网络在 对图结构中节点之间的关联关系进行建模方面表现出强大的学习和表征能力。 然而,目前基于图神经网络的表征学习都局限于处理静态图数据,而在真实场 景下图数据大多是随着时间流逝而发生结构和性质的变化。以金融风控场景为 例,交易数据不断产生导致图结构随着时间不断变化。因此现有基于图神经网 络模型的风险识别无法捕捉动态图数据的结构和时序信息,使得风险识别的准 确性较低。
技术实现要素:3.有鉴于此,本说明书一个或多个实施例公开了一种建立风险识别模型的 方法、风险识别的方法及对应装置,以便于提高风险识别的准确性。
4.根据第一方面,本公开提供了一种建立风险识别模型的方法,该方法包括:
5.获取利用用户在n个时刻的网络行为数据构建的n个时刻的异构网络图, 所述异构网络图包括节点和边,所述节点包括行为主体和行为对象,所述边依 据行为主体和行为对象之间的行为关系确定,所述n为大于1的正整数;所述 节点中的部分节点被标注有是否存在预设类型风险的标签;
6.利用所述n个时刻的异构网络图训练得到所述风险识别模型,其中所述风 险识别模型包括图神经网络、脉冲神经网络、拼接网络和映射网络;所述图神 经网络利用所述n个时刻的异构网络图得到各节点在所述n个时刻的第一表征 向量;所述脉冲神经网络利用各节点在所述n个时刻的第一表征向量累积并更 新膜电压,得到各节点在n个时刻的脉冲序列;所述拼接网络分别针对各节点 将该节点在所述n个时刻的脉冲序列进行拼接,得到该节点的第二表征向量; 所述映射网络用以利用各节点的第二表征向量确定各节点的风险识别结果;所 述训练目标包括:最小化所述风险识别模型对节点的风险识别结果与标签之间 的差异。
7.根据本技术实施例中一可实现的方式,所述图神经网络采用图采样和聚合 graphsage网络;
8.对于所述n个时刻中的每个时刻t,所述graphsage网络针对各节点v, 从t时刻的异构网络图中采样节点v的邻居节点以及从t时刻异构网络图相比较 t-1时刻的更新图数据中采样节点v的邻居节点;所述graphsage利用节点v及 其采样的邻居节点的信息,确定节点v在t时刻的第一表征向量。
9.根据本技术实施例中一可实现的方式,所述脉冲神经网络利用各节点在所 述n个时刻的第一表征向量累积并更新膜电压,得到各节点在n个时刻的脉冲 序列包括:
10.脉冲神经网络利用节点v在t时刻的第一表征向量和t-1时刻的膜电压进行 膜电压累积,同时基于泄漏参数泄漏部分膜电压,得到t时刻的膜电压;
11.若t时刻的膜电压达到t时刻的电压阈值时产生脉冲并将膜电压置为初始 值;
12.节点v在n个时刻是否产生脉冲的信息构成节点v在n个时刻的脉冲序列。
13.根据本技术实施例中一可实现的方式,所述t时刻的电压阈值是由t-1时刻 的电压阈值和t时刻是否产生脉冲得到的。
14.根据本技术实施例中一可实现的方式,在所述训练过程中,每一轮迭代利 用损失函数的取值更新所述风险识别模型的模型参数,直至满足预设的训练结 束条件,所述模型参数包括所述泄漏参数。
15.根据本技术实施例中一可实现的方式,在所述训练过程中进行模型参数的 更新时,利用近似阶跃函数替代所述脉冲神经网络所采用的阶跃函数进行梯度 计算,所述近似阶跃函数包括sigmoid函数。
16.第二方面,提供了一种风险识别的方法,该方法包括:
17.获取利用用户在n个时刻的网络行为数据构建的n个时刻的异构网络图, 所述异构网络图包括节点和边,所述节点包括行为主体和行为对象,所述边依 据行为主体和行为对象之间的行为关系确定,所述n为大于1的正整数;
18.将所述n个时刻的异构网络图和目标节点的信息输入风险识别模型,获得 所述风险识别模型对所述目标节点的风险识别结果;
19.其中,所述风险识别模型采用上述第一方面的方法预先建立。
20.第三方面,提供了一种建立风险识别模型的装置,该装置包括:
21.图获取单元,被配置为获取利用用户在n个时刻的网络行为数据构建的n 个时刻的异构网络图,所述异构网络图包括节点和边,所述节点包括行为主体 和行为对象,所述边依据行为主体和行为对象之间的行为关系确定,所述n为 大于1的正整数;所述节点中的部分节点被标注有是否存在预设类型风险的标 签;
22.模型训练单元,被配置为利用所述n个时刻的异构网络图训练得到所述风 险识别模型,其中所述风险识别模型包括图神经网络、脉冲神经网络、拼接网 络和映射网络;所述图神经网络利用所述n个时刻的异构网络图得到各节点在 所述n个时刻的第一表征向量;所述脉冲神经网络利用各节点在所述n个时刻 的第一表征向量累积并更新膜电压,得到各节点在n个时刻的脉冲序列;所述 拼接网络分别针对各节点将该节点在所述n个时刻的脉冲序列进行拼接,得到 该节点的第二表征向量;所述映射网络用以利用各节点的第二表征向量确定各 节点的风险识别结果;所述训练目标包括:最小化所述风险识别模型对节点的 风险识别结果与标签之间的差异。
23.第四方面,提供了一种风险识别的装置,该装置包括:
24.图获取单元,被配置为获取利用用户在n个时刻的网络行为数据构建的n 个时刻的异构网络图,所述异构网络图包括节点和边,所述节点包括行为主体 和行为对象,所述边依据行为主体和行为对象之间的行为关系确定,所述n为 大于1的正整数;
25.风险识别单元,被配置为将所述n个时刻的异构网络图和目标节点的信息 输入风
险识别模型,获得所述风险识别模型对所述目标节点的风险识别结果;
26.其中,所述风险识别模型采用如上第三方面所述的装置预先建立。
27.根据第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算 机程序,当所述计算机程序在计算机中执行时,令计算机执行如上第一方面或 第二方面所述的方法。
28.根据本技术提供的具体实施例,本技术可以具备以下技术效果:
29.1)本技术将图神经网络与脉冲神经网络结合,提出了基于脉冲神经网络的 风险识别模型来捕捉动态图数据的结构和时序信息,以使得基于用户网络行为 数据的风险识别更加准确。
30.2)本技术中图神经网络采用了graphsage网络,并且改进了graphsage 网络的采样方式,针对各节点v,从t时刻的异构网络图中采样节点v的邻居节 点以及从t时刻异构网络图相比较t-1时刻的更新图数据中采样节点v的邻居节 点,以适应动态图数据,更好地捕捉节点在图结构下的动态演化信息。
31.3)脉冲神经网络的模型参数少,计算过程简单,仅涉及简单的电压充放电, 因此相比较rnn架构大大提高了计算效率。
32.4)脉冲神经网络输出的节点的表征向量是系数离散的脉冲序列,因此在计 算存储效率上相比较实数值存储得到了大大提升。
33.5)本技术中脉冲神经网络采用泄漏积分放电方式,且电压阈值可动态调整, 泄漏参数可学习,以此加强了脉冲神经网络捕获时序信息的能力,且使得脉冲 神经网络在训练过程中更好地收敛。
附图说明
34.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1示出了可以应用本公开实施例的示例性系统架构图;
36.图2为本公开实施例提供的建立风险识别模型的方法流程图;
37.图3为本技术实施例提供的风险识别模型的原理示意图;
38.图4为本技术实施例提供的建立风险识别模型的装置结构图;
39.图5为本技术实施例提供的风险识别装置的结构图。
具体实施方式
40.下面结合附图,对本说明书提供的方案进行描述。
41.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非 旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的
ꢀ“
一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含 义。
42.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关 系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同 时存在a和b,单独存在b这
三种情况。另外,本文中字符“/”,一般表示前 后关联对象是一种“或”的关系。
43.取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或
ꢀ“
当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如 果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响 应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件 或事件)”。
44.基于动态图数据的场景,动态图表征学习成为近年来一个重要的研究方向。 动态图表征学习在静态图数据建模的基础上增加了时间维度,以能够同时表征 动态图数据的结构和时序信息。
45.目前已有的针对动态图表征学习的实现方式主要是将静态图神经网络模型 改进应用到动态图场景上,并额外考虑了时间维度。典型的方式是将图神经网 络与rnn(recurrent neural network,循环神经网络)架构进行结合,同时建 模图结构与时间信息。但这种方式存在以下缺陷:
46.1)rnn模型参数量大,计算复杂,难以应用于诸如风险识别等大规模动态 图数据场景。
47.2)rnn得到的各节点的表征向量均为实数值,对于存储的要求较高。
48.有鉴于此,本技术提出了一种全新的风险识别模型的建模思路。为了方 便对本技术的理解,首先对本技术所基于的系统架构进行介绍。图1示出了 可以应用本公开实施例的示例性系统架构。该系统主要包括建立风险识别模 型的装置和风险识别装置。其中,建立风险识别模型的装置从数据仓库中获 取批量的用户网络行为数据,对用户网络行为数据进行分析,从而建立风险 识别模型。
49.风险识别装置利用训练得到的风险识别模型,对图数据中的目标节点进 行风险识别。
50.上述系统中的建立风险识别模型的装置和风险识别装置可以在服务器端 实现。该服务器端可以是单一服务器,也可以是多个服务器构成的服务器群 组,还可以是云服务器。云服务器又称为云计算服务器或云主机,是云计算 服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(vps, virtual private server)服务中存在的管理难度大,业务扩展性弱的缺陷。除 了在服务器端实现之外,也可以在具有强大计算能力的计算机终端实现。
51.应该理解,图1中的建立风险识别模型的装置、风险识别装置和数据仓 库的数目仅仅是示意性的。根据实现需要,可以具有任意数目的建立风险识 别模型的装置、风险识别装置和数据仓库。
52.图2为本公开实施例提供的建立风险识别模型的方法流程图。可以理解, 该方法可以通过图1所示系统中的建立风险识别模型的装置来执行。参见图 2,该方法包括:
53.步骤202:获取利用用户在n个时刻的网络行为数据构建的n个时刻的异 构网络图,异构网络图包括节点和边,节点包括行为主体和行为对象,边依据 行为主体和行为对象之间的行为关系确定,n为大于1的正整数;节点中的部 分节点被标注有是否存在预设类型风险的标签。
54.步骤204:利用n个时刻的异构网络图训练得到风险识别模型,其中风险 识别模型包括图神经网络、脉冲神经网络、拼接网络和映射网络;图神经网络 利用n个时刻的异构网
络图得到各节点在n个时刻的第一表征向量;脉冲神经 网络利用各节点在n个时刻的第一表征向量累积并更新膜电压,得到各节点在 n个时刻的脉冲序列;拼接网络分别针对各节点将该节点在n个时刻的脉冲序 列进行拼接,得到该节点的第二表征向量;映射网络用以利用各节点的第二表 征向量确定各节点的风险识别结果;训练目标包括:最小化风险识别模型对节 点的风险识别结果与标签之间的差异。
55.由以上实施例提供的技术内容可以看出,本技术将图神经网络与脉冲神经 网络结合,提出了基于脉冲神经网络的风险识别模型来捕捉动态图数据的结构 和时序信息,以使得基于用户网络行为数据的风险识别更加准确。
56.另外,脉冲神经网络的模型参数少,计算过程简单,仅涉及简单的电压充 放电,因此相比较rnn架构大大提高了计算效率。
57.脉冲神经网络输出的节点的表征向量是稀疏离散的脉冲序列,因此在计算 存储效率上相比较实数值存储得到了大大提升。
58.在此需要说明的是,本技术中涉及的“第一”、“第二”等限定并不具备 大小、顺序和数量等方面的限制,仅仅用以在名称上加以区分,例如“第一表 征向量”和“第二表征向量”用以区分两个表征向量。
59.下面对图2所示的各个步骤进行说明。
60.首先结合实施例对上述步骤202即“获取利用用户在n个时刻的网络行为数 据构建的n个时刻的异构网络图”进行详细描述。
61.用户在使用网络的过程中被服务器端记录了大量的网络行为数据,这些 网络行为数据通常记录于数据仓库中,体现了大量行为主体和行为对象之间 的关联。同时用户的行为数据是随着时间发生变化的,因此可以获得每个时 刻的用户网络行为数据,并基于此来构建各时刻的网络异构图。
62.通常进行的风险识别是针对特定场景的,在特定场景下要关注和分析的 行为主体、行为对象和网络行为的类型也是特定的。因此可以从数据仓库中 获取目标场景所对应行为主体类型、行为对象类型和网络行为类型的行为主体、 行为对象和网络行为,用以构建异构网络图。这种基于特定场景构建异构网络 图的方式可以大大降低图数据的规模。异构网络图包括节点和边,节点包括行 为主体和行为对象,边依据行为主体和行为对象之间的网络行为关系确定。
63.其中,目标场景所对应的主体类型、行为对象类型和网络行为类型可以预 先根据经验设置。
64.以网络交易风险为例,行为主体可能是账户、银行卡等。行为对象也可能 是账户、银行卡等,还可能是红包id等。也就是说,行为主体和行为对象是与 金融类相关的主体和对象。节点之间的边可以是行为主体和行为对象之间发生 的支付行为、存取款行为、签约绑定行为、收发红包行为等等与金融类相关的 行为关系。
65.以网络交友诈骗风险为例,行为主体可能是社交网络账户、实时通信工具 账户、金融账户、主机地址、客户端标识等等。节点之间的边可以是发送好友 请求的行为、添加好友的行为、聊天行为、转账行为、收发红包行为、发送链 接的行为,等等。
66.本技术实施例中在进行风险识别模型的建立时,用到的n个时刻的异构网 络图均采用上所述方式预先构建。n为大于1的正整数,也就是说需要构建连 续多个时刻的异构网
络图。由于本技术实施例中建立风险识别模型采用的是监 督学习的方式,因此需要对异构网络图中的部分节点进行标注,将标注的这部 分节点作为样本节点。标注的内容是是否存在预设类型风险的标签,例如标注 为诈骗的风险用户、非风险用户。
67.例如,一些用户频繁被投诉,则可以认为该用户为已知风险用户,并在异 构网络图中确定对应的节点并进行标注。再例如,通过一些已有的高准确性的 检测工具检测出一些用户是风险用户,或者,可以通过人工鉴别的方式鉴别出 一些风险用户,并在异构网络中确定对应的节点并进行标注。
68.类似地,也存在一些用户是明确为非风险用户的。例如,从一些官方渠道 获取到消息指明一些用户是被高度推荐或赞许的,或者是高信誉度用户,例如 存在大量慈善行为、对城市建设起推动作用的用户、被评选为模范等等,这些 用户被确定为已知安全用户,在异构网络中确定对应的节点并进行标注。再例 如,能够通过一些已有的高准确性的检测工具检测出一些用户是安全用户,或 者,可以通过人工鉴别的方式鉴别出一些安全用户,在异构网络中确定对应的 节点并进行标注。
69.下面结合实施例对上述步骤204即“利用n个时刻的异构网络图训练得到 风险识别模型”进行详细描述。
70.如图3中所示,本技术实施例中提供的风险识别模型主要包括图神经网络、 脉冲神经网络、拼接网络和映射网络。
71.其中图神经网络的输入为n个时刻的异构网络图。将一个时刻的异构网络 图输入图神经网络后,图神经网络可以输出各节点在该时刻的第一表征向量。 那么对于n个时刻,则图神经网络分别利用n个时刻的异构网络图得到各节点 在n个时刻的第一表征向量。
72.作为其中一种可实现的方式,本技术实施例中采用的图神经网络可以是 graphsage(graph sample and aggregate,图采样和聚合)网络,但除此之外, 也可以是诸如图卷积网络、图注意力网络、图transformer网络等其他图神经网 络。
73.graphsage网络使用节点之间的连接信息对邻居进行采样,然后通过聚合 函数不断将相邻节点的信息融合在一起。传统的graphsage网络仅适用于静态 图数据,为了更好地适应动态图数据结构,本技术实施例对graphsage网络的 采样方式进行改进,采用基于时序的动态邻居采样。具体地,对于n个时刻中 的每个时刻t,graphsage网络针对各节点v,从t时刻的异构网络图中采样节 点v的邻居节点以及从t时刻异构网络图相比较t-1时刻的更新图数据中采样节 点v的邻居节点;然后利用节点v及其采样的邻居节点的信息,确定节 点v在t时刻的第一表征向量。
74.例如,针对节点v在t时刻采样的邻居集合可以采用以下公式表示:
[0075][0076]
其中,sampler表示采样所使用的函数,为t时刻的异构网络图,为 t时刻的异构网络图相比较t-1时刻的更新图数据。对于初始时刻,
[0077]
通过上述采样方式可以更好地捕捉节点在图结构下的动态演化信息。
[0078]
基于采样的节点v的邻居集合,graphsage网络进行聚合处理得到节点v的 第一表征向量。
[0079]
脉冲神经网络利用各节点在n个时刻的第一表征向量累积并更新膜电压, 得到各节点在n个时刻的脉冲序列。
[0080]
脉冲神经网络是源于生物启发的新一代人工神经网络,不同于传统采用实 数值计算的人工神经网络,脉冲神经网络通过离散脉冲信号进行信息交换和处 理。脉冲神经网络是一种计算高效的神经网络,其神经元只有在接收或者发射 脉冲信号时才处于活跃状态,在大多数时间中神经元处于抑制状态,因此能够 显著提高网络计算效率和减少能耗。此外,脉冲神经网络能够捕获不同时刻脉 冲的变化情况,因此天然适用于建模时序数据,本技术首次将其应用于动态图 数据中。
[0081]
作为其中一种可实现的方式,本技术实施例中采用的脉冲神经网络可以是 泄漏积分放电网络。为了方便理解,首先对泄漏积分放电网络的原理进行简单 介绍。其主要思想是将神经元充放电过程用一个与电阻并联的电容器进行模拟。 泄漏积分放电网络的膜电压动态过程重要包括三部分:
[0082]
1)充电。当每一时刻有外部电流进入模型,神经元开始累积充电,同时释 放(泄露)部分模电压。
[0083]
2)放电。当膜电压达到电压阈值时,神经元产生脉冲。
[0084]
3)重置。当神经元产生脉冲后,膜电压进入重置状态或初始状态。
[0085]
泄露积分放电模型的膜电压动态过程可由如下的微分方程描述:
[0086][0087]
其中,v为膜电压,c为电容,r为电阻,v
reset
为重置电压或初始电压,i(t)为t时 刻输入泄漏积分放电网络的电流。
[0088]
整项为泄漏积分放电网络的泄露项,用于控制每个时刻电流的 泄露过程以更好地模拟真实神经元动态膜电压过程。由于上式为离散的微分方 程,无法利用神经网络进行模拟求解,因此利用欧拉法将其转换成连续形式, 如下公式所示:
[0089][0090]
其中τm=rc为超参数,可用于控制膜电压衰减/增长的快慢程度。v
t
为t时 刻的膜电压。
[0091]
本技术实施例中,节点v在t时刻的第一表征向量相当于上述i(t),也就是说, 脉冲神经网络利用节点v在t时刻的第一表征向量和t-1时刻的膜电压进行膜电 压累积,同时基于泄漏参数泄漏部分膜电压,得到t时刻的膜电压;若t时刻的 膜电压达到t时刻的电压阈值时产生脉冲并将膜电压置为初始值;节点v在n个 时刻是否产生脉冲的信息构成节点v在n个时刻的脉冲序列。
[0092]
传统的泄露积分放电模型只考虑电压的充放电与重置过程,尽管增加了电 压衰减项,但仍然难以准确模拟真实神经元动态变化情况。
[0093]
基于上述问题,本实施例中改进了传统的泄露积分放电模型,不仅考虑了 泄露参
数的动态变化情况,还考虑将膜电压的电压阈值进行动态调整,从而赋 予风险识别模型更好地拟合能力和泛化能力。在考虑上述过程后,泄露积分放 电网络的动态过程可以表示为:
[0094][0095]
其中f为充电函数,如式(3)所示,并且泄漏参数τm可以随着模型训练进行 更新优化。θ为放电函数,采用阶跃函数;o
t
为模型在t时刻产生的脉冲,取值 为0或者1,表示是否产生脉冲。τ
th
与γ为控制电压阈值动态调整的参数因子。为t-1时刻的电压阈值。
[0096]
通过对脉冲神经网络进行上述优化,可以使得风险识别模型具有更好地动 态时序捕捉能力与泛化能力。
[0097]
上述过程可以表示如下:
[0098][0099]
其中,为节点v在t时刻第k层输出的表征向量,w为可学习的权重矩阵。 agg()为图神经网络采用的聚合函数,可以为均值、求和等聚合函数。δ()为脉 冲神经网络的函数,其输入为图神经网络的输出,输出为产生的脉冲。
[0100]
考虑到脉冲神经网络的输出为离散的布尔值,因此可以对上述公式(5)做 进一步简化处理以提高计算效率:
[0101][0102]
其中,w[
·
]为掩膜求和(masked summation)计算操作。w[h]指的是利用 向量h对矩阵w进行掩膜处理,再将掩膜处理后得到的向量进行相加。举个例子:
[0103]
h=[0 1 0 1]
[0104][0105]
向量h对矩阵w进行掩膜处理,即将向量h中元素0所在位置对应的矩阵w中 的行向量进行掩膜,仅保留向量h中元素1所在位置对应的矩阵w中的行向量。 掩膜处理得到两个向量:[0.5 0.1 0.8 1.0]和[0.2 0.1 0.3 0.2],两个向量相加后 得到向量[0.7 0.2 1.1 1.2]。可见掩膜求和处理后的结果与hw(向量和矩阵 相乘)的结果一致。但由于掩膜求和处理仅涉及矩阵加法和布尔掩模操作,因 此计算效率远远高于矩阵乘法,可以极大程度的降低运算时间。
[0106]
拼接网络用以分别针对各节点将该节点在n个时刻的脉冲序列进行拼接, 得到该
节点的第二表征向量。例如可以表示为:
[0107][0108]
其中,zv为节点v的第二表征向量,k为脉冲神经网络的总层数。concat()为 拼接处理。
[0109]
映射网络用以利用各节点的第二表征向量确定各节点的风险识别结果。其 中,映射网络可以是分类网络,也可以是回归网络等。风险识别结果为是否存 在预设类型风险的标签,例如存在欺诈风险即欺诈风险用户,不具备欺诈风险 即非欺诈风险用户。
[0110]
上述模型的训练目标包括:最小化风险识别模型对节点的风险识别结果与 标签之间的差异。可以依据上述训练目标构造损失函数,例如若映射网络采用 分类网络,则可以采用交叉熵损失函数,若映射网络采用回归网络,则可以采 用均方差损失函数。在每一轮迭代中利用损失函数的取值,采用诸如梯度下降 等方式更新模型参数,直至满足预设的训练结束条件。其中训练结束条件可以 包括诸如损失函数的取值小于或等于预设的损失函数阈值,迭代次数达到预设 的次数阈值等。
[0111]
由于在模型训练过程中,脉冲神经网络采用了不可导的阶跃函数,因此无 法直接对脉冲神经网络进行梯度下降更新参数。为了解决这一问题,本技术实 施例可以利用近似阶跃函数替代脉冲神经网络所采用的阶跃函数进行梯度计 算。即在反向传播的时候计算近似阶跃函数的梯度以进行参数更新,而在前向 传播的时候仍采用阶跃函数。
[0112]
作为其中一种可实现的方式,上述近似阶跃函数可以采用sigmoid函数,其 表达式为:
[0113]
σ(αx)=1/(1+exp(-αx))
ꢀꢀꢀ
(8)
[0114]
在反向传播过程中,计算梯度时采用的倒数计算公式为:
[0115]
σ(αx)
′
=α
·
σ(αx)
·
(1-σ(αx))
ꢀꢀꢀ
(9)
[0116][0117]
其中,x为膜电压。α为超参数,用于控制函数的平滑程度。当α较大时, 近似阶跃函数越平滑,近似效果越差;当α较小时,近似阶跃函数越尖锐,近 似效果越好,但容易在两端出现梯度爆炸和梯度消失问题。因此需要选取一个 合适的α,可以采用经验值或试验值。
[0118]
另外,更新的模型参数包括图神经网络、脉冲神经网络和映射网络的参数 之外,特别地,在脉冲神经网络中泄漏参数随着模型训练过程进行更新优化, 从而使得模型具有更好地动态时序捕捉能力和泛化能力。
[0119]
在此需要说明的是,在风险识别模型训练的过程中,输入风险识别模型的 是主要是异构网络图的邻接矩阵和节点特征矩阵。上述节点特征矩阵中采用的 节点特征数据可以是诸如节点类型、注册时长、对应用户的相关属性信息等。 在确定节点特征时可以融合边的特征,边的特征可以是诸如行为类型、行为时 间、行为地点、行为次数等等。鉴于本技术对于这部分并未进行改动,在此不 做详述。
[0120]
完成上述风险识别模型的训练后,训练得到的风险识别模型可以用以进行 风险识别,即用以对动态的异构网络图中的目标节点进行风险识别。例如获取 利用用户在n个时刻的网络行为数据构建的n个时刻的异构网络图后,将目标 节点的信息和上述n个时刻
的异构网络图的信息输入风险识别模型,由风险识 别模型输出针对该目标节点的风险识别结果,例如是否具有预设类型的风险。
[0121]
以网络交易风险为例,依据用户网络行为数据获取的异构网络图包括诸如 账户、银行卡、红包id等等节点。节点之间的边是账户、银行卡、红包id等之 间发生的支付行为、存取款行为、签约绑定行为、收发红包行为等与金融类相 关的行为关系。分别获取n个时刻的上述异构网络图,n个时刻的异构网络图 体现了图数据在时序上的动态变化。然后对异构网络图中已经明确是非风险用 户和风险用户的节点进行标注。利用标注后的异构网络图训练上述风险识别模 型,该风险识别模型基于图神经网络和脉冲神经网络的结合捕捉动态图数据的 结构和时序信息,能够使得风险识别模型更加准确地进行风险识别。
[0122]
训练结束得到风险识别模型后,该风险识别模型就能够利用该n个时刻的 异构网络图以及目标节点的信息,对目标节点进行风险识别,以确定该目标节 点是否非风险用户。
[0123]
以上是对本公开所提供方法进行的详细描述,上述对本说明书特定实施例 进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利 要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可 以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或 者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理 也是可以的或者可能是有利的。
[0124]
下面对本公开所提供的装置进行详细描述。图4示出根据本公开一个实施 例的建立风险识别模型的装置结构图,如图4所示,该装置400可以包括: 图获取单元401和模型训练单元402。其中各组成单元的主要功能如下:
[0125]
图获取单元401,被配置为获取利用用户在n个时刻的网络行为数据构建 的n个时刻的异构网络图,异构网络图包括节点和边,节点包括行为主体和行 为对象,边依据行为主体和行为对象之间的行为关系确定,n为大于1的正整 数;节点中的部分节点被标注有是否存在预设类型风险的标签。
[0126]
模型训练单元402,被配置为利用n个时刻的异构网络图训练得到风险识 别模型,其中风险识别模型包括图神经网络、脉冲神经网络、拼接网络和映射 网络;图神经网络利用n个时刻的异构网络图得到各节点在n个时刻的第一表 征向量;脉冲神经网络利用各节点在n个时刻的第一表征向量累积并更新膜电 压,得到各节点在n个时刻的脉冲序列;拼接网络分别针对各节点将该节点在 n个时刻的脉冲序列进行拼接,得到该节点的第二表征向量;映射网络用以利 用各节点的第二表征向量确定各节点的风险识别结果;训练目标包括:最小化 风险识别模型对节点的风险识别结果与标签之间的差异。
[0127]
作为其中一种可实现的方式,图神经网络采用graphsage网络;
[0128]
对于n个时刻中的每个时刻t,graphsage网络针对各节点v,从t时刻的 异构网络图中采样节点v的邻居节点以及从t时刻异构网络图相比较t-1时刻的 更新图数据中采样节点v的邻居节点;graphsage利用节点v及其采样的邻居节 点的信息,确定节点v在t时刻的第一表征向量。通过上述采样方式可以更好地 捕捉节点在图结构下的动态演化信息。
[0129]
作为其中一种可实现的方式,脉冲神经网络采用了泄漏积分放点模型,即 利用节点v在t时刻的第一表征向量和t-1时刻的膜电压进行膜电压累积,同时 基于泄漏参数泄漏部分膜电压,得到t时刻的膜电压;若t时刻的膜电压达到t 时刻的电压阈值时产生脉冲并
将膜电压置为初始值;节点v在n个时刻是否产生 脉冲的信息构成节点v在n个时刻的脉冲序列。
[0130]
作为其中一种可实现的方式,t时刻的电压阈值是由t-1时刻的电压阈值和t 时刻是否产生脉冲得到的。
[0131]
作为其中一种可实现的方式,模型训练单元402在训练过程中,每一轮迭 代利用损失函数的取值更新风险识别模型的模型参数,直至满足预设的训练结 束条件,模型参数包括泄漏参数。
[0132]
可以看出,本技术实施例中改进了传统的泄露积分放电模型,不仅考虑了 泄露参数的动态变化情况,还考虑将膜电压的电压阈值进行动态调整,从而赋 予风险识别模型更好地拟合能力和泛化能力。
[0133]
作为其中一种可实现的方式,模型训练单元402在训练过程中进行模型参 数的更新时,利用近似阶跃函数替代脉冲神经网络所采用的阶跃函数进行梯度 计算,近似阶跃函数包括sigmoid函数。
[0134]
基于上述建立的风险识别模型,图5示出根据本公开一个实施例的风险识 别装置的结构图,如图5所示,该装置500可以包括:图获取单元501和风险 识别单元502。其中各组成单元的主要功能如下:
[0135]
图获取单元501,被配置为获取利用用户在n个时刻的网络行为数据构建 的n个时刻的异构网络图,异构网络图包括节点和边,节点包括行为主体和行 为对象,边依据行为主体和行为对象之间的行为关系确定,n为大于1的正整 数。
[0136]
风险识别单元502,被配置为将n个时刻的异构网络图和目标节点的信息 输入风险识别模型,获得风险识别模型对目标节点的风险识别结果。
[0137]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相 似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。 尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较 简单,相关之处参见方法实施例的部分说明即可。
[0138]
以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件 说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是 或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络 单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方 案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并 实施。
[0139]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描 述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现 时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一 个或多个指令或代码进行传输。
[0140]
上述的计算机存储介质可以采用一个或多个计算机可读的介质的任意组 合,包括但不限于:便携式计算机磁盘、硬盘、随机存取存储器(ram)、只 读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧 凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适 的组合。
[0141]
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一 步详细
说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于 限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、 等同替换、改进等,均应包括在本发明的保护范围之内。