一种基于图像的人机鉴别方法及鉴别系统与流程

文档序号:11215740阅读:738来源:国知局
一种基于图像的人机鉴别方法及鉴别系统与流程

本发明涉及人机鉴别技术领域,特别是涉及一种基于图像的人机鉴别方法及鉴别系统。



背景技术:

由于机器学习技术的快速发展,使得很多主流的人机鉴定识别方法被经过大量特定数据训练后的机器所模拟识别和破解。尤其在图片识别方面,基于深度神经网络(deepneuralnetwork,简称dnn)的机器学习模型在图片识别方面已经能够非常接近人类水平。

目前,主流的人机鉴别方法是一般为使用验证码的方法和基于风险测试系统的身份验证机制两种。

其中,所述验证码为全自动区分计算机和人类的公开图灵测试(completelyautomatedpublicturingtesttotellcomputersandhumansapart,简称captcha),是一种区分用户是计算机或人的公共全自动程序。使用验证码方法对人机鉴别的方法分为两种:一种验证码是将字母或字符输出到图片上,让用户输入图片上的字符,用户输入的字符与图片上的字符按照某种规则计算相等则算验证正确,例如算数公式、字母、数字、中文等;另一种是通过人与验证码进行某类简单的交互行为,通过交互行为产生的数据,例如可滑动的验证码会生成滑动长度和位置数据,带有方向性的验证码可进行旋转生成旋转次数或方向数据等,利用这些简单交互数据进行人机鉴别。

但是,由于光学字符识别技术(opticalcharacterrecognition,简称ocr,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术)已经发展得很成熟,对于普通的字符图片能够很容易识别出验证码图片上的字符。虽然可通过额外的干扰因素来干扰程序的自动识别,如在图片上加随机像素点、随机线条和随机的图片扭曲,但是这样做非但没有阻止程序自动识别出图片上的字母,反而让正常的用户看不清图片上的字母,导致用户的错误率的提高,对用户的使用体验影响非常大。

此外,由于机器学习的发展迅速,很多需要基于用户行为的操作,如滑动的指定位置或旋转的指定方向等,大部分都能够通过机器学习进行训练和识别,进而模拟用户交互数据,导致不能准确实现人机鉴别。

而在第二种方案中,基于风险测试系统的身份验证机制是通过记录客户端与服务端之间的通信记录和行为,对通信操作发生风险的可能性进行评估,根据评估值判断是人或者机器。但是该鉴别的准确度完全依赖风险测试的准确性,对风险测试系统及相关技术要求较高。而且维护成本高,维护困难。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:人机鉴别的准确度比较低。因此目前亟需一种能够准确实现人机鉴别的方法。



技术实现要素:

本发明实施例提供一种基于图像的人机鉴别方法及鉴别系统,可准确实现人机鉴别。

一方面,本发明实施例提供了基于图像的人机鉴别方法,所述人机鉴别方法包括:

根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像;

接收来自客户端的验证请求,并根据所述验证请求,调取一对原始内容标识与对应的扰动图像,并将调取的扰动图像发送至客户端;其中,验证者识别所述调取的扰动图像,并通过所述客户端生成识别标识;

接收来自所述客户端的识别标识,并根据所述识别标识与调取的原始内容标识确定所述验证者的身份。

可选的,所述根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像,具体包括:

根据以下公式,采用最小可能性迭代分类法生成带有干扰信息的扰动图像:

其中:n为迭代次数,x为原始输入图像,xn为第n次迭代的输入图像,为第n次迭代后生成的带有干扰信息的扰动图像,clipx,∈{x`}为由xn生成的图像处理函数,为损失函数,y为原始内容标识,α为扰动权重,为梯度向量,所述梯度向量通过反向传播算法确定。

可选的,所述迭代次数n的取值为int(min(α+4,1.25α)),其中,int()表示取整函数。

可选的,所述根据所述识别标识与调取的原始内容标识确定所述验证者的身份,具体包括:

当所述识别标识与调取的原始内容标识一致时,则确定所述验证者为人;

当所述识别标识与调取的原始内容标识不一致时,则确定所述验证者为机器。

可选的,所述人机鉴别方法还包括:

生成多幅扰动图像,并存储多对不同的原始内容标识与对应的扰动图像供调取。

上述技术方案具有如下有益效果:本发明根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像,使得在对所述扰动图像识别时,人机识别的结果不同,通过客户端生成的识别标识也就不同,从而根据所述识别标识与原始内容标识可准确的确定验证者的身份。

另一方面,本发明实施例提供了一种基于图像的人机鉴别系统,所述人机鉴别系统包括扰动图像生成单元、验证请求单元及结果校验单元;其中,

所述扰动图像生成单元用于根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像;

所述验证请求单元分别与客户端、所述扰动图像生成单元及所述结果校验单元连接,用于接收来自所述客户端的验证请求,并根据所述验证请求,从所述扰动图像生成单元中调取一对原始内容标识与对应的扰动图像,并将调取的扰动图像发送至所述客户端,将调取的原始内容标识发送至所述结果校验单元;其中,验证者识别所述调取的扰动图像,并通过所述客户端生成识别标识;

所述结果校验单元与所述客户端连接,用于接收来自所述客户端的识别标识,并根据所述识别标识与调取的原始内容标识确定所述验证者的身份。

可选的,所述扰动图像生成单元根据以下公式,采用最小可能性迭代分类法生成带有干扰信息的扰动图像:

其中:n为迭代次数,x为原始输入图像,xn为第n次迭代的输入图像,为第n次迭代后生成的带有干扰信息的扰动图像,clipx,∈{x`}为由xn生成的图像处理函数,为损失函数,y为原始内容标识,α为扰动权重,为梯度向量,所述梯度向量通过反向传播算法确定。

可选的,所述迭代次数n的取值为int(min(α+4,1.25α)),其中,int()表示取整函数。

可选的,所述结果校验单元,具体用于当所述识别标识与调取的原始内容标识一致时,则确定所述验证者为人;当所述识别标识与调取的原始内容标识不一致时,则确定所述验证者为机器。

可选的,扰动图像生成单元还用于生成多幅扰动图像,并存储多对不同的原始内容标识与对应的扰动图像供调取。

上述技术方案具有如下有益效果:本发明通过设置扰动图像生成单元、验证请求单元及结果校验单元,可根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像,使得在对所述扰动图像识别时,人机识别的结果不同,通过客户端生成的识别标识也就不同,从而根据所述识别标识与原始内容标识可准确的确定验证者的身份。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例基于图像的人机鉴别方法的流程图;

图2为本发明实施例基于图像的人机鉴别系统的单元结构示意图。

符号说明:

扰动图像生成单元—1,验证请求单元—2,结果校验单元—3,客户端—4。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于图像的人机鉴别方法,根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像,使得在对所述扰动图像识别时,人机识别的结果不同,通过客户端生成的识别标识也就不同,从而根据所述识别标识与原始内容标识可准确的确定验证者的身份。

机器学习:是一个基于数据模型和以往经验的训练过程,最终归纳出一个面向一种性能度量的决策的人工智能。风险测试分析:是对辨识出的测试风险及其特征进行明确的定义描述,分析和描述测试风险发生可能性的高低,测试风险发生的条件等。反向传播:(backpropagation)是“误差反向传播”的简称,是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示,本发明基于图像的人机鉴别方法包括:

步骤100:根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像;

步骤200:接收来自客户端的验证请求,并根据所述验证请求,调取一对原始内容标识与对应的扰动图像,并将调取的扰动图像发送至客户端;其中,验证者识别所述调取的扰动图像,并通过所述客户端生成识别标识;

步骤300:接收来自所述客户端的识别标识,并根据所述识别标识与调取的原始内容标识确定所述验证者的身份。

其中,在步骤100中,所述根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像,具体包括:

根据以下公式,采用最小可能性迭代分类法生成带有干扰信息的扰动图像:

其中:n为迭代次数,x为原始输入图像,xn为第n次迭代的输入图像,为第n次迭代后生成的带有干扰信息的扰动图像,clipx,∈{x`}为由xn生成的图像处理函数,为损失函数,y为原始内容标识,α为扰动权重,为梯度向量,所述梯度向量通过反向传播算法确定,梯度向量会反馈给最优化方法,用来更新权值以最小化损失函数。

其中,所述迭代次数n的取值为int(min(α+4,1.25α)),其中,int()表示取整函数。例如,当选取扰动权重α=16时,可得迭代次数n=20。将原始图像通过上述方法处理,并经过20次迭代后,生成扰动图像,将该扰动图像对应的原始内容标识和该扰动图像存储,以供验证使用。

优选地,本发明基于图像的人机鉴别方法还包括:生成多幅扰动图像,并存储多对不同的原始内容标识与对应的扰动图像供调取。

本发明通过最小可能性迭代分类法生成扰动图像,使得经过训练的机器学习模型无法对其进行正确分类,人类视觉依然能够准确识别其中内容。利用这一特点,经过添加干扰可导致机器学习将图像中物体a识别为物体b,而a和b在外形特征上完全不同,通过将人类视觉图像与机器视觉图像进行合成生成能导致人类与机器视觉差异的图像,从而区分人类和机器。

进一步地,在步骤300中,所述根据所述识别标识与调取的原始内容标识确定所述验证者的身份,具体包括:当所述识别标识与调取的原始内容标识一致时,则确定所述验证者为人;当所述识别标识与调取的原始内容标识不一致时,则确定所述验证者为机器。

本发明基于图像的人机鉴别方法利用机器学习自身特点产生的与人类在视觉上的差异,提高了人机鉴别的准确率并拥有较高的防对抗性,同时本发明调整优化和部署都较为灵活,能够有效降低人机鉴别上的资源成本。

此外,本发明还提供一种基于图像的人机鉴别系统,可准确实现人机鉴别。如图2所示,本发明基于图像的人机鉴别系统包括扰动图像生成单元1、验证请求单元2及结果校验单元3。

其中,所述扰动图像生成单元1用于根据原始内容标识及对应的原始输入图像生成导致人类视觉和机器视觉差异的扰动图像;所述验证请求单元2分别与客户端4、所述扰动图像生成单元1及所述结果校验单元3连接,用于接收来自所述客户端4的验证请求,并根据所述验证请求,从所述扰动图像生成单元1中调取一对原始内容标识与对应的扰动图像,并将调取的扰动图像发送至所述客户端4,将调取的原始内容标识发送至所述结果校验单元3;其中,验证者识别所述调取的扰动图像,并通过所述客户端4生成识别标识。

所述结果校验单元3与所述客户端4连接,用于接收来自所述客户端4的识别标识,并根据所述识别标识与调取的原始内容标识确定所述验证者的身份。

其中,所述扰动图像生成单元1根据以下公式,采用最小可能性迭代分类法生成带有干扰信息的扰动图像:

其中:n为迭代次数,x为原始输入图像,xn为第n次迭代的输入图像,为第n次迭代后生成的带有干扰信息的扰动图像,clipx,∈{x`}为由xn生成的图像处理函数,为损失函数,y为原始内容标识,α为扰动权重,为梯度向量,所述梯度向量通过反向传播算法确定,梯度向量会反馈给最优化方法,用来更新权值以最小化损失函数。

其中,所述迭代次数n的取值为int(min(α+4,1.25α)),其中,int()表示取整函数。例如,当选取扰动权重α=16时,可得迭代次数n=20。将原始图像通过上述方法处理,并经过20次迭代后,生成扰动图像,将该图像对应的原始内容标识和该图像存储,以供验证使用。

优选地,所述扰动图像生成单元1还用于生成多幅扰动图像,并存储多对不同的原始内容标识与对应的扰动图像供调取。

本发明通过最小可能性迭代分类法生成扰动图像,使得经过训练的机器学习模型无法对其进行正确分类,人类视觉依然能够准确识别其中内容。利用这一特点,经过添加干扰可导致机器学习将图像中物体a识别为物体b,而a和b在外形特征上完全不同,通过将人类视觉图像与机器视觉图像进行合成生成能导致人类与机器视觉差异的图像,从而区分人类和机器。

进一步地,所述结果校验单元3,具体用于当所述识别标识与调取的原始内容标识一致时,则确定所述验证者为人;当所述识别标识与调取的原始内容标识不一致时,则确定所述验证者为机器。

相对于现有技术,本发明基于图像的人机鉴别系统与上述基于图像的人机鉴别方法的有益效果相同,在此不再赘述。

应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。

在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。

为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。

上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrativelogicalblock),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrativecomponents),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(asic),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动磁盘、cd-rom或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于asic中,asic可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于ram、rom、eeprom、cd-rom或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(dsl)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、dvd、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1