一种订单量异常检测方法及装置与流程

文档序号:23006323发布日期:2020-11-20 11:58阅读:173来源:国知局
一种订单量异常检测方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种订单量异常检测方法及装置。



背景技术:

企业电子商务平台是建立在互联网上的管理环境,通过该平台进行商务活动保证商务顺利运营,区别于传统意义的平台,企业电子商务平台是虚拟的网络空间,它不受时间和空间的限制,具有高效性和直通性。

但是,电子商务平台在提高交易效益的同时,也存在自身的一些缺陷,其中最重要的是对线上虚假交易无法进行有力的监管,虚假交易不仅污染了真实的交易数据,也加大了监管机构和企业的决策难度。例如:一些商家想要领取平台发放的一些补贴或奖励,为了满足领取条件,就故意生成虚假订单等。

因此,亟需提供一种订单量异常检测方案,以对平台交易进行更有效的监管。



技术实现要素:

本说明书实施例提供一种订单量异常检测方法及装置,以解决现有的方法无法对订单量异常进行检测,导致对平台的线上交易无法实现有效监管的问题。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供的订单量异常检测方法,包括:

获取设定历史时间段内待识别行业的历史订单量;

根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

获取所述待识别行业在设定时间段内的待分析订单量;

判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

本说明书实施例提供的一种订单量异常检测装置,包括:

历史订单量获取模块,用于获取设定历史时间段内待识别行业的历史订单量;

历史订单量区间确定模块,用于根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

待分析订单量获取模块,用于获取所述待识别行业在设定时间段内的待分析订单量;

第一判断模块,用于判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

订单量异常确定模块,用于当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

本说明书实施例提供的一种订单量异常检测设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

获取设定历史时间段内待识别行业的历史订单量;

根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

获取所述待识别行业在设定时间段内的待分析订单量;

判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种订单量异常检测方法。

本说明书一个实施例能够达到以下有益效果:通过获取设定历史时间段内待识别行业的历史订单量;根据该历史订单量选择特定算法进行拟合分析,得到正常概率下待识别行业的历史订单量区间;获取待识别行业在设定时间段内的待分析订单量;如果待分析订单量位于历史订单量区间之外,则可以确定待识别行业在设定时间段内的待分析订单量存在异常。通过上述方法,根据行业的订单量可以检测各行业订单量的异常状况,从而实现对平台中的交易订单进行有效监管。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本说明书实施例提供的一种订单量异常检测方法的整体框架示意图;

图2是本说明书实施例提供的一种订单量异常检测方法的流程图;

图3是本说明书实施例提供的一种订单量异常检测方法中正态分布方法的示意图;

图4是本说明书实施例提供的一种订单量异常检测装置的结构示意图;

图5是本说明书实施例提供的一种订单量异常检测设备的结构示意图。

具体实施方式

为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。

以下结合附图,详细说明本说明书各实施例提供的技术方案。

随着电子商务的飞速发展以及移动终端的普及,利用手机、平板等移动设备进行网上交易已经成为当代年轻人的一种生活方式。随着电商平台上入驻的商家越来越多,线上交易订单量越来越大,对于电商平台的监管存在很大的困难。其中最重要的是线上虚假交易无法很好的识别,虚假交易不仅污染了真实的交易数据,也加大了权威机构和企业的监管决策难度。例如,交易平台中的店家通过虚假的购物流程或其他方式生成虚假订单,以提高商家的订单量,通过这种方式,商家可以获得较好的搜索排名、改变店铺的信誉或者依靠订单量领取平台提供的补贴福利等,并且,在同一行业中,很多商家会争相模仿,导致同一行业中的虚假交易异常。

跨境电子商务平台中包含全球范围内的商家以及消费者,跨境交易平台冲破了国家间的障碍,使国际贸易走向无国界贸易。对企业来说,跨境电子商务构建的开放、多维、立体的多边经贸合作模式,极大地拓宽了进入国际市场的路径,大大促进了多边资源的优化配置与企业间的互利共赢。但是,对于平台上的交易监管更是难上加难。如果对电子商务平台上的交易订单无法实现有效的监管,不仅会损害消费者的利益,使用户对电商平台产生质疑;还会影响权威机构对于平台的决策,从而影响电商平台的发展。

因此,为了解决现有技术中的缺陷,本方案给出了以下实施例:

图1是本说明书实施例提供的一种订单量异常检测方法的整体框架示意图。如图1所示,平台可以获取到各个行业(行业1、行业2、行业3、……行业m)对应的订单量。在分析时,可以获取设定历史时间段(比如:3个月内)的订单量,根据订单量的分布趋势以及具体数量可以选择特定的算法(算法1、算法2、算法3、算法4等),这些算法可以是特定的用于异常检测的方法,选择特定的算法进行拟合分析之后,可以检测订单量是否异常。

本说明书实施例提供的这一技术方案,通过分析行业订单量的分布趋势以及具体数量,选择特定的算法进行拟合分析,最终确定订单量的异常情况,能够检测各个行业对应的订单量异常情况,从而对平台中的交易订单进行有效监管。

接下来,将针对说明书实施例提供的一种订单量异常检测方法结合附图进行具体说明:

图2是本说明书实施例提供的一种订单量异常检测方法的流程图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。本实施例中的执行主体可以是电子商务平台对应的服务器或应用服务端。

如图2所示,该流程可以包括以下步骤:

步骤202:获取设定历史时间段内待识别行业的历史订单量。

需要说明的是,设定历史时间段可以是由平台根据实际应用场景设定的时间段,例如:2019年的10月1日至2019年11月1日。

平台中可以获取到入驻平台的所有商家对应的订单数据,分析各行业对应的订单量。在识别异常时,可以获取平台中全量商家的订单量,按照行业分类后,分别对每个行业的订单量异常进行检测。当然,也可以先确定待识别的行业,再获取该行业的订单数据,对订单数据进行分析后确定该行业对应的订单量,从而进行检测。

步骤204:根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间。

需要说明的是,这里的特定算法可以指的是用于进行异常检测的算法。例如:基于密度的聚类算法、正态分布算法、孤立森林(isolationforest)算法、广义帕累托分布(generalizedparetodistribution,简称gpd)算法等。

拟合可以理解为把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法。如果待定函数是线性,可以称作线性拟合或者线性回归,否则就称为非线性拟合或者非线性回归。表达式也可以是分段函数,这种情况下可以称作样条拟合。

其中,异常检测的基本思想是:如果发生了小概率的事件,就认为数据出现了异常,异常检测也是一种模式二分类方法,但两类数据严重不平衡,异常数据要显著少于正常数据。

正常概率可以表示在上述特定算法中根据实际应用一个月场景设定的概率阈值。

选择特定的算法对历史订单量进行拟合分析之后,可以确定正常概率下的订单量区间。例如:假设分析的数据为a行业某个月的订单量,分析后确定正常概率下的订单量区间为100-10000。

当然,在实际应用中,也可以获取某行业一年内的订单数据,确定每个月的订单量,对全年的订单量按照月份分别进行拟合分析,在得到每个月的订单量区间之后,确定平均每个月正常概率下对应的订单量区间。具体地,所述根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间。

步骤206:获取所述待识别行业在设定时间段内的待分析订单量;所述设定时间段的时间长度与所述历史时间段的时间长度相等。

需要说明的是,设定时间段的时间长度与历史时间段的长度可以相等或相近。例如:历史时间段为一个月,则设定时间段也应该在一个月左右。比如:待识别行业为a行业,历史时间段为2019年3月1日-2019年4月1日,在对待识别行业的订单量进行分析时,设定时间段可以取2020年3月1日-2020年4月1日。当然也可以去2020年5月10日-2020年6月10日,只要时间长度与历史时间段的时间长度相等即可。

步骤208:判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果。

步骤210:当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

在判断待识别行业的订单量是否存在异常时,可以判断待分析的订单量是否位于历史订单量区间,如果都位于历史订单量区间,则可以认为该行业不存在订单量异常。如果待分析订单量位于历史订单量区间之外,则可以认为该待识别行业存在订单量异常。例如:沿用上例,假设分析的数据为a行业某个月的订单量,分析后确定正常概率下的订单量区间为100-10000,待分析的订单量为10万时,可以确定该行业的待分析订单量在设定的时间段内存在异常。

应当理解,本说明书一个或多个实施例所述的方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。

图2中的方法,通过获取设定历史时间段内待识别行业的历史订单量;根据该历史订单量选择特定算法进行拟合分析,得到正常概率下待识别行业的历史订单量区间;获取待识别行业在设定时间段内的待分析订单量;如果待分析订单量位于历史订单量区间之外,则可以确定待识别行业在设定时间段内的待分析订单量存在异常。通过上述方法,根据行业的订单量可以检测行业中交易订单的真实性,从而实现对平台中的交易订单进行有效监管。

基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。

可选的,所述根据所述历史订单量选择特定算法进行拟合分析之前,还可以包括:

判断所述历史订单量是否大于或等于检测阈值,得到第二判断结果;

当所述第二判断结果表示所述历史订单量大于或等于所述检测阈值时,对所述历史订单量进行异常检测;

当所述第二判断结果表示所述历史订单量小于所述检测阈值时,不对所述历史订单量进行异常检测。

需要说明的是,在实际的异常检测过程中,如果数据量过少,会导致检测的准确率较低,此时,检测的意义不大。因此,在进行异常检测之前,可以先对获取的数据量进行评估,当该行业的数据量满足检测阈值时,才对该行业的订单量进行异常检测。这里的检测阈值可以根据实际应用场景进行限定。

通过上述方法,可以保证进行异常检测的订单量满足检测条件,以保证检测结果的准确性。

在实际应用中,在对行业的订单量进行异常检测时,需要选择合适的特定算法来进行拟合分析,从而确定正常概率下的订单量区间。其中,选择特定算法可以基于以下三种方式进行选择:

方式一、根据历史订单量的分布趋势选择特定算法确定历史订单量区间。

可选的,所述根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间,具体可以包括:

根据所述历史订单量的分布趋势选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

需要说明的是,上述步骤中的分布趋势可以表示将数据进行拟合后所满足的具体的分布算法。从数据的分布趋势中可以确定数据分布的集中趋势,可以反映各数据向其中心值靠拢或聚集的程度;也可以从数据的分布趋势中确定分布的离散程度,可以反映各数据远离其中心值的趋势;还可以从数据分布趋势中确定数据分布的形状等。

此时,订单量服从哪种算法的分布,就可以采用服从的该算法对订单量进行拟合分析,从而确定正常概率下的订单量区间。

其中,所述根据所述历史订单量的分布趋势选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间,具体可以包括:

对所述历史订单量进行正态性校验,判断所述历史订单量是否服从正态分布,得到第三判断结果;

当所述第三判断结果表示所述历史订单量服从正态分布时,根据所述正态分布的四西格玛原则确定正常概率下所述待识别行业的历史订单量区间。

需要说明的是,上述步骤中的正态性校验可以表示根据获取到的订单量生成正态概率图并进行假设检验,以检查观测值是否服从正态分布。对于正态性检验,原假设为h0:数据服从正态分布;备择假设h1:数据不服从正态分布。

正态分布(normaldistribution)又名高斯分布(gaussiandistribution),是一个在数学、物理及工程等领域都非常重要的概率分布。若随机变量服从一个位置参数、尺度参数的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。

正态分布是具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作n(μ,σ^2)。遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ^2=1时,称为标准正态分布,记为n(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。

正态分布的公式表示如下:

其中,μ表示正态均值,可以描述数据分布的集中位置,σ表示正态方差,可以描述数据分布的分散程度。

可选的,所述根据所述正态分布的四西格玛原则确定正常概率下所述待识别行业的历史订单量区间,具体可以包括:

根据所述历史订单量确定所述历史订单量对应的正态均值以及正态方差;

根据所述正态均值以及所述正态方差确定四西格玛值;

根据所述四西格玛值确定在正常概率内所述待识别行业的订单量区间。

上述步骤中,采用正态分布方法中的四西格玛值确定在正常概率内的待识别行业的订单量区间,可以结合附图2进行说明:

图3是本说明书实施例提供的一种订单量异常检测方法中正态分布方法的示意图。

如图3所示,正态分布曲线中的正态均值为μ,正态方差为σ,当μ=0,σ=1时正态分布称为标准正态分布。

其中,在描述时,σ可以用西格玛(sigma)来表示,在±σ的范围内,对应的概率值为68.27%;在±2σ的范围内,对应的概率值为95.45%;在±3σ的范围内,对应的概率值为99.73%;在±4σ的范围内,对应的概率值为99.9937%;在±5σ的范围内,对应的概率值为99.99943%;在±6σ的范围内,对应的概率值为99.9999998%。

本实施例中,采用四西格玛原则确定历史订单量区间,由于在±4σ的范围内,正常概率值为99.9937%,计算得到μ±4σ的订单量区间之后,最终落在该区间之外的待分析订单量就会被确定为是异常的订单量。当然,在实际应用过程中,也可以采用五西格玛原则、六西格玛原则等来确定历史订单量的区间,实际选择时,可以根据具体的应用场景以及要求的准确率来选择。根据所述历史订单量的具体数量、所述正态均值以及所述正态方差可以绘制所述待识别行业的历史订单量对应的正态分布曲线。

可选的,所述对所述历史订单量进行正态性校验,判断所述历史订单量是否服从正态分布,得到第三判断结果之后,还可以包括:

当所述第三判断结果表示所述历史订单量不服从正态分布时,校验所述历史订单量是否服从帕累托分布;

若所述历史订单量服从帕累托分布,采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

需要说明的是,上述方法中的帕累托分布(paretodistributions),是从大量真实世界的现象中发现的幂次定律分布。它又称幂律分布(powerlawdistribution),帕累托分布的本质是正反馈机制(positivefeedbackloop),当事件不再独立,一个事件的产生对自身和其它同质事件的产生发生影响时,会导致帕累托分布。

帕累托分布可以理解为一种厚尾(fat-tailed)分布。对于一个随机变量x来说,xm是x能取到的最小值。x的概率分布函数具体公式如下:

由此可以得到其中系数α为正,被称为shapeparameter,或tailindex。xm是1时,α越小,厚尾特征越明显。当x→∞时,帕累托分布有一个阶数为

的尾部。

根据订单量帕累托分布方法分析之后,还可以确定对应的分位点,根据分位点的区间确定计算正常概率下对应的订单量区间。

方式二、根据历史订单量的具体数量选择特定算法确定历史订单量区间。

可选的,所述根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间,具体可以包括:

根据所述历史订单量的具体数量选择特定算法进行拟合分析,得到各个算法所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

需要说明的是,异常检测算法中,一些算法在数据量较小的情况下,仍然能够满足检测的准确性,例如:帕累托算法可以针对小样本数据进行异常检测。因此,可以根据数据量的大小选择相应的异常检测算法。

通过上述方法,可以按照订单量的具体数量选择特定的异常检测算法,确定正常概率下的订单量区间,从而保证订单量的异常检测的准确性。

可选的,所述根据所述历史订单量的具体数量选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间,具体可以包括:

确定所述历史订单量的具体数量是否小于第一预设阈值;

若所述历史订单量的具体数量小于所述第一预设阈值,则采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

需要说明的是,上述步骤中的预设阈值可以根据实际应用场景进行限定。

方式三、根据历史订单量的分布趋势以及历史订单量的具体数量确定历史订单量区间。

可选的,所述根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间,具体可以包括:

根据所述历史订单量的分布趋势以及所述历史订单量的具体数量选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

需要说明的是,在选择特定算法时,还可以同时根据订单量的分布趋势以及订单量的具体数量来进行选择,当服从正态分布时,就采用正态分布方法确定历史订单量区间;如果不服从正态分布,就继续根据订单量的具体数量选择其他异常检测算法确定历史订单量区间。

可选的,所述根据所述历史订单量的分布趋势以及所述历史订单量的具体数量选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间,具体可以包括:

对所述历史订单量进行正态性校验,判断所述历史订单量是否服从正态分布,得到第四判断结果;

当所述第四判断结果表示所述历史订单量服从正态分布时,根据所述正态分布的四西格玛原则确定正常概率下所述待识别行业的历史订单量区间;

当所述第四判断结果表示所述历史订单量不服从正态分布时,确定所述历史订单量的具体数量是否小于第一预设阈值;

若所述历史订单量的具体数量小于所述第一预设阈值,则采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

通过上述方法,结合订单量的分布趋势与订单量的具体数量选择特定算法模型拟合分析,能够选择更合适的算法对订单量进行异常检测,以保证检测准确性。

可选的,所述根据所述历史订单量选择特定算法进行拟合分析之后,还可以包括:

确定所述历史订单量对应的上分位点和下分位点;

根据所述上分位点和所述下分位点确定所述待识别行业对应的历史订单量区间。

需要说明的是,确定分位点,根据分位点确定订单量的方法,可以结合各种异常检测的算法进行使用。

所述根据所述上分位点和所述下分位点确定所述待识别行业对应的历史订单量区间,具体可以包括:

获取所述特定算法对应的正常概率;

确定所述正常概率内对应的上下分位点;

确定所述上分位点对应的订单量的值,作为所述订单量区间的第一端点值;

确定所述下分位点对应的订单量的值,作为所述订单量区间的第二端点值;

根据所述第一端点值以及所述第二端点值确定所述订单量区间。

可选的,所述确定所述待识别行业在设定时间段内的待分析订单量存在异常之后,还可以包括:

确定所述待分析订单量中的异常订单。

可选的,所述确定所述待识别行业中的异常订单之后,还可以包括:

获取所述待分析订单对应的订单记录;所述订单记录中至少包括订单对应的商户;

根据所述订单记录将所述待分析订单中包含的商家信息对应的商户,确定为异常商户。

在实际应用中,当平台检测到某行业存在订单量异常时,可以进一步对该行业的订单进行分析,先确定对异常的订单量贡献度比较大的商家,然后对商家进行进一步的核查。如果确定某商家的订单量存在违规,可以进一步确定该商家的哪些具体订单存在异常。如果进一步核查确定某一个或多个商家存在订单异常,可以让商家进行整改或者对异常订单中商家发送警告信息。

在一些实施例中,平台可能会为商家发放一些奖励或补贴,订单量满足条件的商家可以领取补贴或者奖励。此时,对于订单量异常的商家,平台可以取消其领域奖励或者补贴的资格。

当然,在检测到某一行业中存在订单量异常时,并不意味着该行业一定存在异常订单,因此,可以进一步对检测到的订单量异常的行业作进一步的分析,可以从商家、订单对应的商品、交易信息、买家信息等角度全方面的对订单进行评估和监管。

因此,上述步骤中,所述根据所述订单记录将所述待分析订单中包含的商家信息对应的商户,确定为异常商户之后,还可以包括:

平台生成报警提示信息,所述报警提示信息用于提示平台所述商户存在订单量异常的风险。

所述平台还可以向所述异常商户发送警告信息,所述警告信息用于提示所述异常商户对所述异常订单进行处理。

通过上述实施例中的方法,本说明书实施例可以实现以下技术效果:

1)通过获取设定历史时间段内待识别行业的历史订单量;根据该历史订单量选择特定算法进行拟合分析,得到正常概率下待识别行业的历史订单量区间;获取待识别行业在设定时间段内的待分析订单量;如果待分析订单量位于历史订单量区间之外,则可以确定待识别行业在设定时间段内的待分析订单量存在异常。通过上述方法,根据行业的订单量可以检测行业中订单量的异常状况,从而对平台中的交易订单进行有效监管。

2)在跨境交易平台中,所述订单量来源于全球的各行业商家,跨境交易有相应的监管方,因此,获取到的订单量数据更加详细,也更具有权威性。

3)根据订单量对行业的订单量异常进行检测,能够协助平台对平台上的各行业进行有效监管,从而为权威机构的决策提供更为有力的依据。

基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图4是本说明书实施例提供的一种订单量异常检测装置的结构示意图。如图4所示,该装置可以包括:

历史订单量获取模块402,用于获取设定历史时间段内待识别行业的历史订单量;

历史订单量区间确定模块404,用于根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

待分析订单量获取模块406,用于获取所述待识别行业在设定时间段内的待分析订单量;

第一判断模块408,用于判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

订单量异常确定模块410,用于当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

基于图4的装置,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。

可选的,所述装置,还可以包括:

第二判断模块,用于判断所述历史订单量是否大于或等于检测阈值,得到第二判断结果;

订单量异常检测模块,用于当所述第二判断结果表示所述历史订单量大于或等于所述检测阈值时,对所述历史订单量进行异常检测;

停止检测模块,用于当所述第二判断结果表示所述历史订单量小于所述检测阈值时,不对所述历史订单量进行异常检测。

可选的,所述历史订单量区间确定模块404,具体可以包括:

第一拟合分析单元,用于根据所述历史订单量的分布趋势选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

可选的,所述历史订单量区间确定模块404,具体可以包括:

第二拟合分析单元,用于根据所述历史订单量的具体数量选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

可选的,所述第一拟合分析单元,具体可以用于:

对所述历史订单量进行正态性校验,判断所述历史订单量是否服从正态分布,得到第三判断结果;

当所述第三判断结果表示所述历史订单量服从正态分布时,根据所述正态分布的四西格玛原则确定正常概率下所述待识别行业的历史订单量区间。

可选的,所述第二拟合分析单元,具体可以用于:

确定所述历史订单量的具体数量是否小于第一预设阈值;

若所述历史订单量的具体数量小于所述第一预设阈值,则采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

可选的,所述第一拟合分析单元,还可以用于:

当所述第三判断结果表示所述历史订单量不服从正态分布时,校验所述历史订单量是否服从帕累托分布;

若所述历史订单量服从帕累托分布,采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

可选的,所述第一拟合分析单元,具体可以用于:

根据所述历史订单量确定所述历史订单量对应的正态均值以及正态方差;

根据所述正态均值以及所述正态方差确定四西格玛值;

根据所述四西格玛值确定在正常概率内所述待识别行业的订单量区间。

可选的,所述装置,还可以包括:

分位点确定模块,用于确定所述历史订单量对应的上分位点和下分位点;

历史订单量区间确定模块,用于根据所述上分位点和所述下分位点确定所述待识别行业对应的历史订单量区间。

可选的,所述历史订单量区间确定模块404,具体可以包括:

第三拟合分析单元,用于根据所述历史订单量的分布趋势以及所述历史订单量的具体数量选择特定算法进行拟合分析,得到所述特定算法对应的正常概率下所述待识别行业的历史订单量区间。

可选的,所述第三拟合分析单元,具体可以用于:

对所述历史订单量进行正态性校验,判断所述历史订单量是否服从正态分布,得到第四判断结果;

当所述第四判断结果表示所述历史订单量服从正态分布时,根据所述正态分布的四西格玛原则确定正常概率下所述待识别行业的历史订单量区间;

当所述第四判断结果表示所述历史订单量不服从正态分布时,确定所述历史订单量的具体数量是否小于第一预设阈值;

若所述历史订单量的具体数量小于所述第一预设阈值,则采用帕累托分布方法确定正常概率下所述待识别行业的历史订单量区间。

可选的,所述装置,还可以包括:

异常订单确定模块,用于确定所述待分析订单量中的异常订单。

可选的,所述装置,还可以包括:

订单记录获取模块,用于获取所述待分析订单对应的订单记录;所述订单记录中至少包括订单对应的商户;

异常商户确定模块,用于根据所述订单记录将所述待分析订单中包含的商家信息对应的商户,确定为异常商户。

基于同样的思路,本说明书实施例还提供了上述方法对应的设备。

图5是本说明书实施例提供的一种订单量异常检测设备的结构示意图。如图5所示,设备500可以包括:

至少一个处理器510;以及,

与所述至少一个处理器通信连接的存储器530;其中,

所述存储器530存储有可被所述至少一个处理器510执行的指令520,所述指令被所述至少一个处理器510执行,以使所述至少一个处理510能够:

获取设定历史时间段内待识别行业的历史订单量;

根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

获取所述待识别行业在设定时间段内的待分析订单量;

判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现以下方法:

获取设定历史时间段内待识别行业的历史订单量;

根据所述历史订单量选择特定算法进行拟合分析,得到正常概率下所述待识别行业的历史订单量区间;

获取所述待识别行业在设定时间段内的待分析订单量;

判断所述待分析订单量是否位于所述历史订单量区间,得到第一判断结果;

当所述第一判断结果表示所述待分析订单量位于所述历史订单量区间之外时,确定所述待识别行业在设定时间段内的待分析订单量存在异常。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardwaredescriptionlanguage,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字符多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1