本说明书一个或多个实施例涉及计算机技术领域,尤其涉及训练欺诈交易检测模型的方法,检测欺诈交易的方法以及对应装置。
背景技术:
互联网技术的发展使得人们的生活越来越方便,人们可以利用网络进行购物、支付、缴费、转账等各种交易和操作。然而,与此同时,由此引起的安全问题也越来越突出。近年来,金融欺诈情况时有发生,不法分子采用各种手段诱骗用户进行一些欺诈交易。例如,将一些欺诈链接伪装成银行或通信公司的官方链接,诱导用户交费或转账;或者,通过一些虚假信息诱骗用户操作网银或电子钱包,进行欺诈交易。因此,需要快速地对欺诈交易进行检测和识别,以便采取相应的应对措施,避免或减少用户的财产损失,提高网络金融平台的安全性。
现有技术中,采用了诸如逻辑斯蒂回归,随机森林,深度神经网络等方法来检测欺诈交易。然而,检测的方式并不全面,结果也不够准确。
因此,需要更为有效的方式,检测金融平台中的欺诈交易。
技术实现要素:
本说明书一个或多个实施例描述了一种方法和装置,引入用户操作的时间因素,训练欺诈交易检测模型,并利用这样的模型对欺诈交易进行检测。
根据第一方面,提供了一种训练欺诈交易检测模型的方法,所述欺诈交易检测模型包括卷积层和分类器层,所述方法包括:
获取分类样本集,所述分类样本集包括多个标定样本,所述标定样本包括用户操作序列和时间序列,所述用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述时间序列包括所述用户操作序列中相邻用户操作之间的时间间隔;
在所述卷积层中,对所述用户操作序列进行第一卷积处理,获得第一卷积数据;
对所述时间序列进行第二卷积处理,获得第二卷积数据;
对所述第一卷积数据和所述第二卷积数据进行结合,获得时间调整卷积数据;
将所述时间调整卷积数据输入所述分类器层,根据分类器层的分类结果训练欺诈交易检测模型。
根据一种实施方式,在对所述用户操作序列进行第一卷积处理之前,将所述用户操作序列处理为操作矩阵。
根据一种实施例方式,采用独热编码方法,或者词嵌入方法,将所述用户操作序列处理为操作矩阵。
根据一种实施方式,在第二卷积处理中,采用预定长度k的卷积核,依次处理所述时间序列中的多个元素,获得时间调整向量a作为第二卷积数据,其中所述时间调整向量a的维度与所述第一卷积数据的维度相对应。
根据一个实施例,通过以下公式获得时间调整向量a中的向量元素ai:
其中f为转换函数,xi为时间序列中的第i个元素,cj为与卷积核相关的参数。
在一个例子中,所述转换函数f为以下之一:tanh函数,指数函数,sigmoid函数。
根据一种实施方式,对所述第一卷积数据和所述第二卷积数据进行结合包括:将所述第一卷积数据对应的矩阵与所述第二卷积数据对应的向量进行点乘结合。
在一种实施方式中,欺诈交易检测模型的卷积层包括多个卷积层,相应地,将上一卷积层获得的所述时间调整卷积数据作为下一卷积层的用户操作序列进行处理,并将最后一个卷积层获得的所述时间调整卷积数据输出到所述分类器层。
根据第二方面,提供一种检测欺诈交易的方法,所述方法包括:
获取待检测样本,所述待检测样本包括待检测用户操作序列和待检测时间序列,所述待检测用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述待检测时间序列包括所述待检测用户操作序列中相邻用户操作之间的时间间隔;
将所述待检测样本输入欺诈交易检测模型,使其输出检测结果,所述欺诈交易检测模型是根据第一方面的方法训练得到的模型。
根据第三方面,提供一种训练欺诈交易检测模型的装置,所述欺诈交易检测模型包括卷积层和分类器层,所述装置包括:
样本集获取单元,配置为获取分类样本集,所述分类样本集包括多个标定样本,所述标定样本包括用户操作序列和时间序列,所述用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述时间序列包括所述用户操作序列中相邻用户操作之间的时间间隔;
第一卷积处理单元,配置为在所述卷积层中,对所述用户操作序列进行第一卷积处理,获得第一卷积数据;
第二卷积处理单元,配置为对所述时间序列进行第二卷积处理,获得第二卷积数据;
结合单元,配置为对所述第一卷积数据和所述第二卷积数据进行结合,获得时间调整卷积数据;
分类训练单元,配置为将所述时间调整卷积数据输入所述分类器层,根据分类器层的分类结果训练欺诈交易检测模型。
根据第四方面,提供一种检测欺诈交易的装置,所述装置包括:
样本获取单元,配置为获取待检测样本,所述待检测样本包括待检测用户操作序列和待检测时间序列,所述待检测用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述待检测时间序列包括所述待检测用户操作序列中相邻用户操作之间的时间间隔;
检测单元,配置为将所述待检测样本输入欺诈交易检测模型,使其输出检测结果,所述欺诈交易检测模型是利用第三方面的装置训练得到的模型。
根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
通过本说明书实施例提供的方法及装置,在欺诈交易检测模型的输入样本数据中引入了时间序列,并在卷积层中引入了时间调整参数,使得欺诈交易检测模型的训练过程考虑了用户操作的时序因素以及操作的时间间隔的因素,采用如此训练获得的欺诈交易检测模型能够更全面更准确地对欺诈交易进行检测。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的训练欺诈交易检测模型的方法的流程图;
图3示出根据一个实施例的欺诈交易检测模型的示意图;
图4示出根据另一实施例的欺诈交易检测模型的示意图;
图5示出根据一个实施例的检测欺诈交易的方法的流程图;
图6示出根据一个实施例的训练欺诈交易检测模型的装置的示意性框图;
图7示出根据一个实施例的检测欺诈交易的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,用户有可能通过网络进行多种交易操作,例如支付、转账、缴费等。相应地,交易操作对应的服务器,例如支付宝服务器,可以记录用户的操作历史。可以理解,记录用户的操作历史的服务器可以是集中的服务器,也可以是分布式服务器,在此不做限定。
为了训练欺诈交易检测模型,可以从服务器中记录的用户操作记录中获取训练样本集。具体地,可以采用人工标定或其他方式,预先确定出一些欺诈交易操作和正常操作。然后,基于此形成欺诈样本和正常样本,其中欺诈样本包括欺诈交易操作以及该操作之前的操作历史构成的欺诈操作序列,正常样本包括正常操作以及该操作之前的操作历史构成的正常操作序列。并且,还获取操作历史中的时间信息,即,各个操作之间的时间间隔,由这些时间间隔构成时间序列。
计算平台可以如上所述获取上述的欺诈样本和正常样本,每一项样本均包括用户操作序列和对应的时间序列。计算平台基于操作序列和时间序列两者,来训练欺诈交易检测模型。更具体而言,采用卷积神经网络来处理用户操作序列和对应的时间序列,从而训练欺诈交易检测模型。
在训练得到欺诈交易检测模型的基础上,对于有待检测的交易样本,同样提取出其用户操作序列和时间序列,将其输入到训练好的模型中,就可以输出得到检测结果,即,当前的有待检测的交易是否为欺诈交易。
上述计算平台可以是任何具有计算、处理能力的装置、设备和系统,例如可以是服务器,它既可以作为独立的计算平台,也可以集成到记录用户操作历史的服务器中。如上所述,在训练欺诈交易检测模型的过程中,计算平台引入了与用户操作序列对应的时间序列,这使得模型可以考虑到用户操作的时序因素和操作间隔因素,更为全面地刻画和捕获欺诈交易的特点,更有效地检测欺诈交易。下面描述计算平台训练欺诈交易检测模型的具体过程。
图2示出根据一个实施例的训练欺诈交易检测模型的方法的流程图。该方法可以由例如图1的计算平台执行,该计算平台可以是任何具有计算、处理能力的装置、设备和系统,例如可以是服务器。如图2所示,训练欺诈交易检测模型的方法可以包括以下步骤:步骤21,获取分类样本集,其中包括多个标定样本,所述标定样本包括用户操作序列和时间序列,所述用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述时间序列包括所述用户操作序列中相邻用户操作之间的时间间隔;步骤22,在欺诈交易检测模型的卷积层中,对所述用户操作序列进行第一卷积处理,获得第一卷积数据;在步骤23,对所述时间序列进行第二卷积处理,获得第二卷积数据;在步骤24,对所述第一卷积数据和所述第二卷积数据进行结合,获得时间调整卷积数据;在步骤25,将所述时间调整卷积数据输入所述分类器层,根据分类器层的分类结果训练欺诈交易检测模型。下面描述以上各个步骤的具体执行过程。
首先,在步骤21,获取用于训练的分类样本集,其中包括多个标定样本,所述标定样本包括用户操作序列和时间序列。如本领域人员所知,为了对模型进行训练,需要一些已经标定好的样本作为训练样本。标定的过程可以采取人工标定等各种方式。在本步骤中,为了训练欺诈交易检测模型,需要获取与欺诈交易操作有关的训练样本。具体地,获取的分类样本集可以包括欺诈交易样本集,又称“黑样本集”,和正常操作样本集,又称“白样本集”,黑样本集中包括与欺诈交易操作相关的黑样本,白样本集中包括与正常操作相关的白样本。
为了获得黑样本集,首先获取预先被确定为欺诈交易的操作,然后从用户的操作记录中进一步获取,该用户在该欺诈交易之前的预定数目的用户操作,这些用户操作与标定为欺诈交易的用户操作按时间顺序排列,构成一个用户操作序列。例如,假定用户操作o0被标定为欺诈交易,那么从该操作o0向前追溯预定数目的操作,例如n个操作,获得连续的操作o1,o2,…on,这些操作连同o0,按时间顺序排列,构成一个用户操作序列(o0,o1,o2,…on)。当然,操作序列也可以反向从on排到o1和o0。在一个实施例中,已经标定的欺诈交易操作o0位于操作序列的端点。另一方面,还获取以上用户操作序列中相邻的用户操作之间的时间间隔,由这些时间间隔构成一个时间序列。可以理解,记录用户操作历史的用户记录一般地包括多条记录,每条记录除了包含用户操作的操作名称,还会包括用户执行这项操作时的时间戳。利用这些时间戳信息,可以容易地获取到用户操作之间的时间间隔,进而获得时间序列。例如,对于以上的用户操作序列(o0,o1,o2,…on),可以获得对应的时间序列(x1,x2,…xn),其中xi为操作oi-1和oi之间的时间间隔。
对于与正常用户操作相关的白样本集,类似地获得白样本的用户操作序列和时间序列。即,获取预先被确定为正常交易的操作,然后从用户的操作记录中获取,该用户在该正常操作之前的预定数目的用户操作。这些用户操作与标定为正常操作的用户操作按时间顺序排列,同样构成一个用户操作序列。在该用户操作序列中,已经标定的正常交易操作同样位于操作序列的端点。另一方面,获取以上用户操作序列中相邻的用户操作之间的时间间隔,由这些时间间隔构成一个时间序列。
如此,获取的分类样本集中含有多个标定样本(其中包括标定为欺诈交易的样本和标定为正常交易的样本),每个标定样本包括用户操作序列和时间序列,用户操作序列包括预定数目的多个用户操作,这多个用户操作以标定类别的用户操作为端点,且按照时间顺序排列,所述标定类别的用户操作为标定为欺诈交易的操作,或标定为正常交易的操作;上述时间序列包括所述多个用户操作中相邻用户操作之间的时间间隔。
在获取了上述的分类样本集的基础上,就可以利用这样的样本集对欺诈交易检测模型进行训练。在一个实施例中,欺诈交易检测模型总体上采用卷积神经网络cnn(convolutionneuralnetwork)的算法模型。
卷积神经网络cnn是图像处理领域常用的一种神经网络模型,通常可以认为包含有卷积层、池化层等处理层。在卷积层中,对输入的较大维度的矩阵或向量进行局部特征提取和操作,生成若干特征图(featuremap)。用于进行局部特征提取和操作的计算模块又称为过滤器或卷积核。过滤器或卷积核的大小可以根据实际需要而设置和调整。并且,可以设置多种卷积核,来针对同一局部区域提取不同方面的特征。
在卷积处理之后,通常地,还对卷积处理的结果进行池化(pooling)处理。卷积处理可以认为是将整个输入样本拆分为多个局部区域,并对其进行特征刻画的过程,而为了描述整个样本的全貌,还需要对不同位置不同区域的特征进行聚合统计,以此进行降维,同时改善结果,避免过拟合的出现。这种聚合的操作就叫做池化,根据具体的池化方法,又分为平均池化、最大池化等。
通常的卷积神经网络还存在若干隐藏层,对池化之后的结果进行进一步处理。在采用卷积神经网络进行分类的情况下,卷积层、池化层、隐藏层等处理之后的结果可以输入到分类器中,对输入样本进行分类。
如前所述,在一个实施例中,欺诈交易检测模型采用卷积神经网络cnn模型。那么相应地,欺诈交易检测模型至少包括卷积层和分类器层。卷积层用于对输入的样本数据进行卷积处理,分类器层用于对初步处理的样本数据进行分类。由于在步骤21已经获得用于训练的分类样本集,在接下来的步骤中,可以将分类样本集中的标定样本数据输入到卷积神经网络进行处理。
具体地,在步骤22,在卷积层中,对标定样本中的用户操作序列进行第一卷积处理,获得第一卷积数据;在步骤23,对标定样本中的时间序列进行第二卷积处理,获得第二卷积数据。
步骤22中的第一卷积处理可以是常规的卷积处理。也就是,利用一定大小的卷积核,从用户操作序列中提取局部特征,并利用与卷积核相关的卷积算法对提取的特征进行运算操作。
在一个实施例中,用户操作序列表示为向量的形式,输入到卷积层。卷积层直接对该操作序列向量进行卷积处理。卷积处理的结果通常表示为矩阵,也可以通过矩阵-向量转化,输出向量形式的输出结果。
在另一实施例中,在输入到卷积层之前,首先将用户操作序列处理为操作矩阵。
更具体地,在一个实施例中,采用独热编码(one-hot)方法,将用户操作序列处理为操作矩阵。独热编码方法又称为一位有效编码方法,在机器学习中可以用于将离散的不连续的特征处理为单个编码。在一个例子中,假定要处理的用户操作序列(o0,o1,o2.,,,on)中包括m种不同的操作,那么就可以将每一项操作转换为一个m维向量,该向量中仅包含一个为1的元素,其他元素均为0,其中第i个元素为1,则代表对应第i种操作。如此,可以将用户操作序列处理为m*(n+1)的操作矩阵,其中每一行代表一项操作,对应一个m维向量。独热编码处理得出的矩阵一般比较稀疏。
在另一实施例中,采用词嵌入(embedding)模型,将用户操作序列处理为操作矩阵。词嵌入模型是自然语言处理nlp中用到的一种模型,用于将单个词转换为一个向量。在最简单的模型中,为每个单词构造一组特征作为其对应向量。更进一步地,为了体现单词之间的关系,例如类别关系,从属关系,可以采用各种方式训练语言模型,优化向量表达。例如,word2vec的工具中包含了多种词嵌入的方法,能够快速得到单词的向量表达,并且向量表达能够体现单词之间的类比关系。如此,可以采取词嵌入模型,将用户操作序列中的各个操作转换为向量形式,相应地,整个操作序列被转换处理为一个操作矩阵。
本领域技术人员了解,还可以采取其他方式,将用户操作序列处理为矩阵形式,例如将向量形式的操作序列乘以预先定义或预先学习的矩阵,也会得到用户操作序列的矩阵表达形式。
在将用户操作序列转换为矩阵形式的情况下,经过第一卷积处理,获得的第一卷积数据通常也是一个矩阵。当然,也可以通过矩阵-向量转化,输出向量形式的第一卷积数据。
另一方面,在步骤23,在卷积层中,还对标定样本中的时间序列进行第二卷积处理,获得第二卷积数据。
在一个实施例中,时间序列可以表示为向量形式,输入到卷积层中。在卷积层中,对时间序列数据进行专门的卷积处理,即第二卷积处理,以获得第二卷积数据。
具体地,在一个实施例中,采用预定长度k的卷积核,依次处理所述时间序列中的多个元素,获得时间调整向量a作为时间调整卷积数据:
a=(a1,a2,…as)。
可以理解,第二卷积处理得到的时间调整向量a的维度s,依赖于原时间序列中元素的数目,以及卷积核的长度。在一个实施例中,将卷积核的长度k设置为,使得输出的时间调整向量a的维度s与该第一卷积数据的维度相对应。更具体地,在前述第一卷积处理获得的第一卷积数据为卷积矩阵的情况下,输出的时间调整向量a的维度s与该第一卷积数据的列数相对应。例如,假定时间序列包含n个元素,即(x1,x2,…,xn),如果卷积核长度为k,那么得到的时间调整向量a的维度s=(n-k+1)。通过调整k,可以使得s与卷积矩阵的列数相当。
更具体地,在一个例子中,第二卷积处理的过程可以包括,通过以下公式获得时间调整向量a中的向量元素ai:
其中f为转换函数,用于将数值压缩到预定范围,xi为时间序列中的第i个元素。可以看到,a中的每个元素ai都是用长度为k的卷积核对时间序列中的元素(xi+1,xi+2,…xi+k)进行卷积操作的结果,其中cj为与卷积核相关的参数,更具体来说,cj可以认为是卷积核中定义的权重因子。
为了防止求和结果取向正无穷,采用转换函数f来限制其范围。转换函数f可以根据需要进行设定。在一个实施例中,转换函数f采用tanh函数;在另一实施例中,转换函数f采用指数函数;在又一实施例中,转换函数采用sigmoid函数。转换函数f还有可能采取其他形式。
在一个实施例中,还可以对上述的时间调整向量a进行进一步运算,获得更多形式的第二卷积数据,例如矩阵形式,数值形式等。
通过如上所述的第二卷积处理,获得了例如时间调整向量a作为第二卷积数据。
接着,在步骤24,将步骤22获得的第一卷积数据和步骤23获得的第二卷积数据进行结合,从而获得时间调整卷积数据。
在一个实施例中,步骤22获得的第一卷积数据为向量形式,步骤23获得的第二卷积数据为上述的时间调整向量a。此时,在步骤24,可以通过叉乘、连接等方式,对这两个向量进行结合,从而获得时间调整卷积数据。
在另一实施例中,步骤22获得的第一卷积数据为卷积矩阵,步骤23获得了时间调整向量a。如前所述,时间调整向量a的维度s可被设置为,与卷积矩阵的列数相对应。如此,在步骤24,可以将卷积矩阵与时间调整向量a进行点乘,从而进行结合,点乘之后的矩阵作为时间调整卷积数据。
即:co=cin⊙a
其中cin为步骤22获得的卷积矩阵,a为时间调整向量,co为结合获得的时间调整卷积数据。
在其他实施例中,第一卷积数据和/或第二卷积数据采取其他形式。在这样的情况下,可以相应地调整步骤24中的结合算法,从而将两者结合在一起。如此,获得的时间调整卷积数据中引入了与用户操作序列相对应的时间序列,从而引入了用户操作过程的时序和时间间隔的因素。
对于如此获得的时间调整卷积数据,在步骤25,将其输入分类器层,根据分类器层的分类结果来训练欺诈交易检测模型。
可以理解,分类器层根据预定的分类算法,对输入的样本数据进行分析,进而给出分类结果。根据分类器层的分类结果,可以对整个欺诈交易检测模型进行训练。更具体地,可以将分类器层的分类结果(例如,将样本分类为欺诈交易操作还是正常操作)与输入样本的标定分类情况(即,该样本实际上被标定为欺诈交易操作还是正常操作)进行比对,由此确定分类损失函数。然后,通过对分类损失函数求导,进行梯度传递,返回来修改欺诈交易检测模型中的各种参数,然后再次训练和分类,直到分类损失函数在可接受范围之内。如此,实现对欺诈交易检测模型的训练。
图3示出根据一个实施例的欺诈交易检测模型的示意图。如图3所示,欺诈交易检测模型总体上采取卷积神经网络cnn的结构,包括卷积层和分类器层。采用已经标定的欺诈交易操作样本和正常操作样本训练该模型,其中每个样本都包括用户操作序列和时间序列,用户操作序列包含以标定为欺诈交易操作/正常操作的用户操作为端点的、预定数目的用户操作,时间序列包含相邻用户操作之间的时间间隔。
如图3所示,将用户操作序列和时间序列分别输入卷积层,但是分别进行第一卷积处理和第二卷积处理。然后将第一卷积处理得到的第一卷积数据,和第二卷积处理得到的第二卷积数据进行结合,获得时间调整卷积数据。第一卷积处理、第二卷积处理和结合处理的具体算法如前所述,不再赘述。获得的时间调整卷积数据被输入到分类器层,进行分类,从而得到分类结果。分类结果用于确定分类损失函数,从而调整模型参数,进一步训练模型。
在一个实施例中,在输入到卷积层之前,用户操作序列还经过一个嵌入层,该嵌入层用于将用户操作序列处理为一个操作矩阵。处理的具体方法可以包括独热编码方法,词嵌入模型等。
在图3的模型中,将第一卷积处理得到的第一卷积数据,和第二卷积处理得到的第二卷积数据进行结合,获得了时间调整卷积数据。结合的过程起到了聚合统计的作用,从而可以省却常规卷积神经网络中的池化处理,因而在图3的模型中并没有包含池化层。结合获得的时间调整卷积数据由于引入了时间序列,使得分类器层的分类考虑了用户操作的时间间隔这一影响因素,从而可以训练获得更加准确更加全面的欺诈交易检测模型。
图4示出根据另一实施例的欺诈交易检测模型的示意图。如图4所示,该欺诈交易检测模型包括多个卷积层(图4所示为3个)。实际上,对于较为复杂的输入样本来说,利用多个卷积层进行多次卷积处理,是卷积神经网络中常见的情况。在多个卷积层的情况下,如图4所示,在每一卷积层中,对用户操作序列进行第一卷积处理,对时间序列进行第二卷积处理,并将第一卷积处理得到的第一卷积数据和第二卷积处理得到的第二卷积数据进行结合,从而获得时间调整卷积数据。上一卷积层获得的时间调整卷积数据作为下一卷积层的用户操作序列进行处理,最后一个卷积层获得的时间调整卷积数据输出到分类器层中进行分类。如此,实现多卷积层的时间调整卷积处理,并利用这样的经过时间调整卷积处理的操作样本数据来训练欺诈交易检测模型。
不管是图3所示的单卷积层的模型还是图4所示的多卷积层的模型,由于在样本数据中引入了时间序列,并在卷积层中引入了第二卷积数据作为时间调整参数,使得欺诈交易检测模型的训练过程考虑了用户操作的时序因素以及操作的时间间隔的因素,如此训练获得的欺诈交易检测模型能够更全面更准确地对欺诈交易进行检测。
根据另一方面实施例,还提供一种检测欺诈交易的方法。图5示出根据一个实施例的检测欺诈交易的方法的流程图。该方法的执行主体可以为任何具有计算和处理能力的计算平台。如图5所示,该方法包括以下步骤。
首先,在步骤51,获取待检测样本。可以理解,待检测样本的构成应与用于训练欺诈交易检测模型的标定样本的构成相同。具体地,当想要检测某个用户操作,即待检测用户操作,是否为欺诈交易操作时,从该操作开始向前回溯预定数目的用户操作,这些用户操作构成一个待检测用户操作序列。如此构成的待检测用户操作序列包括预定数目的多个用户操作,这些用户操作以待检测操作为端点,且按照时间顺序排列。另一方面,还获取待检测时间序列,它包括待检测用户操作序列中的相邻用户操作之间的时间间隔。
在获取这样的待检测样本之后,在步骤52,将待检测样本输入通过图2的方法训练获得的欺诈交易检测模型,使其输出检测结果。
更具体地,在步骤52,将待检测样本输入所训练的欺诈交易检测模型的卷积层,使得待检测样本中的待检测用户操作序列和待检测时间序列在其中分别进行第一卷积处理和第二卷积处理,获得时间调整卷积数据;将所述时间调整卷积数据输入所述欺诈交易检测模型中的分类器层,从所述分类器层获得检测结果。
在一个实施例中,在将所述待检测样本输入欺诈交易检测模型之前,将所述待检测用户操作序列处理为待检测操作矩阵。
与模型的训练过程相对应地,在进行检测时,输入的待检测样本中也包含了时间序列的特征。在检测过程中,欺诈交易检测模型根据训练中设置好的各种参数,对输入的待检测样本进行分析,包括对时间序列进行卷积处理,并将其结合到用户操作序列,然后基于结合的结果进行分类。如此,欺诈交易检测模型可以更全面更准确地识别、检测出欺诈交易操作。
根据另一方面的实施例,还提供一种训练欺诈交易检测模型的装置。图6示出根据一个实施例的训练欺诈交易检测模型的装置的示意性框图,所训练的欺诈交易检测模型包括卷积层和分类器层。如图6所示,训练装置600包括:样本集获取单元61,配置为获取分类样本集,所述分类样本集包括多个标定样本,所述标定样本包括用户操作序列和时间序列,所述用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述时间序列包括所述用户操作序列中相邻用户操作之间的时间间隔;第一卷积处理单元62,配置为在卷积层中,对所述用户操作序列进行第一卷积处理,获得第一卷积数据;第二卷积处理单元63,配置为对所述时间序列进行第二卷积处理,获得第二卷积数据;结合单元64,配置为对所述第一卷积数据和所述第二卷积数据进行结合,获得时间调整卷积数据;以及分类训练单元65,配置为将所述时间调整卷积数据输入所述分类器层,根据分类器层的分类结果训练欺诈交易检测模型。
在一个实施例中,上述装置还包括转换单元611,配置为将所述用户操作序列处理为操作矩阵。
在一个实施例中,上述转换单元611配置为:采用独热编码方法,或者词嵌入模型,将所述用户操作序列处理为操作矩阵。
在一个实施例中,上述第二卷积处理单元63配置为:采用预定长度k的卷积核,依次处理所述时间序列中的多个元素,获得时间调整向量a作为第二卷积数据,其中所述时间调整向量a的维度与所述第一卷积数据的维度相对应。
在进一步的实施例中,上述第二卷积处理单元63配置为,通过以下公式获得时间调整向量a中的向量元素ai:
其中f为转换函数,xi为时间序列中的第i个元素,cj为与卷积核相关的参数。
在更进一步的实施例中,所述转换函数f为以下之一:tanh函数,指数函数,sigmoid函数。
在一个实施例中,结合单元64配置为:将所述第一卷积数据对应的矩阵与所述第二卷积数据对应的向量进行点乘结合。
在一个实施例中,欺诈交易检测模型的卷积层包括多个卷积层,相应地,所述装置还包括处理单元(未示出),配置为:将上一卷积层获得的时间调整卷积数据作为下一卷积层的用户操作序列进行处理,并将最后一个卷积层获得的所述时间调整卷积数据输出到分类器层。
根据另一方面的实施例,还提供一种检测欺诈交易的装置。图7示出根据一个实施例的检测欺诈交易的装置的示意性框图。如图7所示,该检测装置700包括:样本获取单元71,配置为获取待检测样本,所述待检测样本包括待检测用户操作序列和待检测时间序列,所述待检测用户操作序列包括预定数目的用户操作,所述预定数目的用户操作按照时间顺序排列;所述待检测时间序列包括所述待检测用户操作序列中相邻用户操作之间的时间间隔;以及检测单元72,配置为将所述待检测样本输入欺诈交易检测模型,使其输出检测结果,其中欺诈交易检测模型是利用图6所示的装置训练得到的模型。
在一个实施例中,上述检测单元72配置为:将所述待检测样本输入所述欺诈交易检测模型的卷积层,使得所述待检测样本中的待检测用户操作序列和待检测时间序列在其中分别进行第一卷积处理和第二卷积处理,获得时间调整卷积数据;将所述时间调整卷积数据输入所述欺诈交易检测模型中的分类器层,从所述分类器层获得检测结果。
在一个实施例中,装置700还包括转换单元711,配置为将所述待检测用户操作序列处理为待检测操作矩阵。
利用图6所示的装置,可以训练改进的欺诈交易检测模型,图7的装置基于如此训练的欺诈交易检测模型,对输入样本进行检测,确定其是否为欺诈交易。在如上训练和利用的欺诈交易检测模型中,输入的样本中包含了时间序列的特征,并且时间序列的特征经过卷积处理之后,与用户操作序列相结合。因此,模型中引入了用户操作的时间间隔这一重要因素,使得检测结果更加全面,更加准确。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2或图5所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2或图5所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。