本发明涉及信息安全领域,具体涉及在线笔迹认证中一种书写节奏特征的提取及认证方法。
背景技术:
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。
所谓书写节奏是指从书写每一段笔画耗时的长短、笔速的快慢、用力的轻重、笔画长度的大小上所体现出来的固有模式,表现为某一些笔画书写笔画耗时长短、笔速快慢、用力轻重的周期性固定搭配。高水平的书写在节奏上表现为轻重徐疾、张弛有度、快慢有序,呈现出规律性,给人以美感;相反,低水平的书写则表现为杂乱无章,无规律性可言。笔迹学研究表明,书写节奏属于高层特征,在长时间的不断练习过程中,书写方式逐渐从大脑控制下的阶段过渡到自动触发的肌肉神经动力定型阶段,一旦掌握,书写节奏将具有较高的稳定性。更重要的是,与字形特征不同,书写节奏往往不易被观察,容易被忽视,摹仿者只能按自己的节奏进行书写。因此,书写节奏特征的提取对提升笔迹认证系统的准确性,具有重要意义和作用。可是,在在线笔迹认证系统中,笔迹数据以离散的采样点信息所表示,节奏特征的提取涉及笔迹分割、笔画类型识别、笔顺识别等一系列难题。
技术实现要素:
本发明的目的就是针对上述技术的不足,提供在线笔迹认证中一种书写节奏特征的提取及认证方法,有效提取书写节奏特征,并估算稳定且一致书写节奏特征在人群中出现的概率,通过有效识别不易被察觉的书写方式,极大地增加摹仿者的攻击难度和攻击成本,从而提升笔迹认证性能。
为实现上述目的,本发明所设计的在线笔迹认证中一种书写节奏特征的提取及认证方法,包括如下步骤:
a)书写节奏特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,对预学习手写笔迹样本集合中的所有手写笔迹样本按笔画进行分割,提取每个手写笔迹样本的书写节奏特征,基于所有手写笔迹样本上提取的书写节奏特征估计书写节奏特征概率密度函数,其中,所述书写节奏特征是同一组与笔画长度、笔画的最大最小用力、速度相关的截断频域数据构成的向量;
所述书写节奏特征是由一组与笔画长度、笔画的最大最小用力、速度相关的截断频域数据构成的向量;
所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括但不限于笔尖的二维位置信息、笔尖施加在书定平面上的压力等信息;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹;所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
b)书写节奏特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,采用与所述步骤a)中书写节奏特征预学习阶段相同的方法,提取每个所述注册手写笔迹样本的书写节奏特征,基于所有所述注册手写笔迹样本上提取的书写节奏特征,计算在书写节奏特征每个分量上的最大最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
c)书写节奏特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与所述步骤a)中书写节奏特征预学习阶段相同的方法,提取所述测试手写笔迹样本的书写节奏特征,基于所述步骤a)取得的书写节奏特征概率密度函数,根据测试手写笔迹样本书写节奏特征中每个分量值与注册手写笔迹样本书写节奏特征上每个分量的最大最小值关系,计算观察到书写节奏特征中所有稳定且一致特征分量的概率,判断该测试手写笔迹样本是否为真实笔迹;
所述稳定且一致特征分量是指在测试手写笔迹样本中提取的书写节奏特征分量取值处于在注册手写笔迹样本的集合上提取的稳定的书写节奏特征分量取值的最大和最小值之间的特征分量,所述稳定的书写节奏特征分量是指在注册手写笔迹样本的集合上提取书写节奏特征分量取值的最大和最小值之间的距离小于一定阈值的特征分量;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹;所述用户身份未知是指还未确认书写手写笔迹的用户身份与注册手写笔迹样本的用户身份是否相一致,有待进一步确认;所述待认证用户是指真实身份未得到确认的用户。
优选地,所述步骤a)、步骤b)和步骤c)中书写节奏特征的提取方法包括如下步骤:
d1)以笔迹w={(x1,y1,f1),(x2,y2,f2),...,(xn,yn,fn)}作为输入参数,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤n,n表示手写笔迹w中包含的采样点个数;
d2)计算笔迹w的书写速度信息,设lw={l1,l2,...,ln}表示笔迹w的书写速度时间序列;
d3)笔迹分割,提取笔迹w中的关键点k={k0,k1,k2,...,km-1,km},其中,ki表示关键点在笔迹w中的序号,0≤i≤m,k0=1,km=n,ki<ki+1,0≤i<m,由这些关键点将笔迹w分割成m段笔画;其中第i段笔画为
d4)构造一个与笔迹w等长的笔画长度序列a1={a11,a12,...,a1n},设初值a1i=0,1≤i<n,在每个笔画开始点处,置
d5)构造一个与笔迹w等长的笔画书写速度最大最小值序列a2={a21,a22,...,a2n},设初值a2i=0,1≤i<n,在每段笔画中相应位置置
d6)构造一个与笔迹w等长的笔画书写用力最大最小值序列a3={a31,a32,...,a3n},设初值a3i=0,1≤i<n,在每段笔画中相应位置置
d7)提取序列a1的频域特征,将序列a1={a11,a12,...,a1n}变换到频域空间,以前x项截断系数作为序列a1的特征表示e1={e11,e12,...,e1x};
d8)提取序列a2的频域特征,将序列a2={a21,a22,...,a2n}变换到频域空间,以前x项截断系数作为序列a2的特征表示e2={e21,e22,...,e2x};
d9)提取序列a3的频域特征,将序列a3={a31,a32,...,a3n}变换到频域空间,以前x项截断系数作为序列a3的特征表示e3={e31,e32,...,e3x};
d10)结束,返回特征集合ew={e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x}作为笔迹w的节奏特征。
优选地,所述步骤a)中,书写节奏特征预学习包括如下步骤:
a1)设s={s1,s2,...,sn}表示海量的足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供1至3个样本;所述足够多的用户是指集合s中的手写笔迹样本所包含的书写节奏具有广泛的代表性,涵盖了手写汉字c各种书写节奏特征的所有可能变化,n表示集合s中的笔迹个数;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
a2)初始化循环变量j=1,初始化书写节奏特征集合
a3)提取第j个手写笔迹样本的书写节奏特征,以集合s中第j个手写笔迹样本作为输入参数,得到关于手写笔迹样本sj的书写节奏特征
a4)j=j+1,若j>n跳转至步骤a5),否则,跳转至步骤a3);
a5)估算人群中关于标准汉字c的书写节奏特征概率密度函数;基于书写节奏特征集合e中的所有书写节奏特征,估计人群中关于标准汉字c的书写节奏特征概率密度分布函数fc(e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x);
a6)结束,返回人群中关于标准汉字c的书写节奏特征概率密度函数fc(e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x)。
优选地,所述步骤b)中,书写节奏特征注册包括如下步骤:
b1)注册用户提交关于标准汉字c的注册手写笔迹样本集合h={h1,h2,...,hq},q≥3;
b2)初始化循环变量j=1,初始化书写节奏特征集合
b3)提取第j个注册手写笔迹样本的书写节奏特征,以集合h中第j个注册手写笔迹样本hj作为输入参数,得到关于笔迹hj的书写节奏特征
b4)j=j+1,若j>n;跳转至步骤b5),否则,跳转至步骤b3);
b5)统计书写节奏特征在每个分量上的最大最小值,计算在书写节奏特征向量集合
b6)结束,返回在书写节奏特征向量集合eh中每个分量上的最大最小值
优选地,所述步骤c)中,书写节奏特征认证包括如下步骤:
c1)待认证用户输入关于标准汉字c的测试手写笔迹样本t;
c2)以测试手写笔迹样本t作为输入参数,得到关于测试手写笔迹样本t的书写节奏特征集合et={e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x};
c3)计算所有稳定且一致书写节奏特征分量的观测概率,采用如下公式计算在注册手写笔迹样本集合h上观测到测试手写笔迹t的书写节奏特征et的概率,所述如下公式定义为
c4)测试笔迹与书写节奏特征相关的判别,采用步骤c3)取得的书写节奏特征概率p(et),再结合其它特征,包括笔顺、布局、书写节奏,综合判断该测试手写笔迹样本t是否为真实笔迹;
c5)结束,返回判别结果。
本发明与现有技术相比,具有以下优点:有效提取书写节奏特征,并估算稳定且一致书写节奏特征在人群中出现的概率,通过有效识别不易被察觉的书写方式,极大地增加摹仿者的攻击难度和攻击成本,从而提升笔迹认证性能。
附图说明
图1为本发明在线笔迹认证中一种书写节奏特征的提取及认证方法流程图;
图2为图1中步骤a)的具体流程图;
图3为图1中步骤b)的具体流程图;
图4为图1中步骤c)的具体流程图;
图5为图1中书写节奏特征提取的具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
在线笔迹认证中一种书写节奏特征的提取及认证方法,如图1所示,包括如下步骤:
a)书写节奏特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,对预学习手写笔迹样本集合中的所有手写笔迹样本按笔画进行分割,提取每个手写笔迹样本的书写节奏特征,基于所有手写笔迹样本上提取的书写节奏特征估计书写节奏特征概率密度函数;
书写节奏特征是由一组与笔画长度、笔画的最大最小用力、速度相关的截断频域数据构成的向量;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括但不限于笔尖的二维位置信息、笔尖施加在书定平面上的压力等信息;
标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹;所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
具体而言,如图2所示,书写节奏特征预学习包括如下步骤:
a1)设s={s1,s2,...,sn}表示海量的足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供1至3个样本;足够多的用户是指集合s中的手写笔迹样本所包含的书写节奏具有广泛的代表性,涵盖了手写汉字c各种书写节奏特征的所有可能变化,n表示集合s中的笔迹个数;标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
a2)初始化循环变量j=1,初始化书写节奏特征集合
a3)提取第j个手写笔迹样本的书写节奏特征,以集合s中第j个手写笔迹样本作为输入参数,得到关于手写笔迹样本sj的书写节奏特征
a4)j=j+1,若j>n跳转至步骤a5),否则,跳转至步骤a3);
a5)估算人群中关于标准汉字c的书写节奏特征概率密度函数;,基于书写节奏特征集合e中的所有书写节奏特征,估计人群中关于标准汉字c的书写节奏特征概率密度分布函数fc(e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x);
a6)结束,返回人群中关于标准汉字c的书写节奏特征概率密度函数fc(e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x);
b)书写节奏特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,采用与步骤a)中书写节奏特征预学习阶段相同的方法,提取每个注册手写笔迹样本的书写节奏特征,基于所有注册手写笔迹样本上提取的书写节奏特征,计算在书写节奏特征每个分量上的最大最小值;
注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,用户身份已知是指手写笔迹书写者的身份是已知的;
具体而言,如图3所示,书写节奏特征注册包括如下步骤:
b1)注册用户提交关于标准汉字c的注册手写笔迹样本集合h={h1,h2,...,hq},q≥3;
b2)初始化循环变量j=1,初始化书写节奏特征集合
b3)提取第j个注册手写笔迹样本的书写节奏特征,以集合h中第j个注册手写笔迹样本hj作为输入参数,得到关于笔迹hj的书写节奏特征
b4)j=j+1,若j>n;跳转至步骤b5),否则,跳转至步骤b3);
b5)统计书写节奏特征在每个分量上的最大最小值,计算在书写节奏特征向量集合
b6)结束,返回在书写节奏特征向量集合eh中每个分量上的最大最小值
c)书写节奏特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与步骤a)中书写节奏特征预学习阶段相同的方法,提取测试手写笔迹样本的书写节奏特征,基于步骤a)取得的书写节奏特征概率密度函数,根据测试手写笔迹样本书写节奏特征中每个分量值与注册手写笔迹样本书写节奏特征上每个分量的最大最小值关系,计算观察到书写节奏特征中所有稳定且一致特征分量的概率值,判断该测试手写笔迹样本是否为真实笔迹;
稳定且一致特征分量是指在测试手写笔迹样本中提取的书写节奏特征分量取值处于在注册手写笔迹样本的集合上提取的稳定的书写节奏特征分量取值的最大和最小值之间的特征分量,稳定的书写节奏特征分量是指在注册手写笔迹样本的集合上提取书写节奏特征分量取值的最大和最小值之间的距离小于一定阈值的特征分量;
测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹;用户身份未知是指还未确认书写手写笔迹的用户身份与注册手写笔迹样本的用户身份是否相一致,有待进一步确认;待认证用户是指真实身份未得到确认的用户;
具体而言,如图4所示,书写节奏特征认证包括如下步骤:
c1)待认证用户输入关于标准汉字c的测试手写笔迹样本t;
c2)以测试手写笔迹样本t作为输入参数,得到关于测试手写笔迹样本t的书写节奏特征集合et={e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x};
c3)计算所有稳定且一致书写节奏特征分量的观测概率,采用如下公式计算在注册手写笔迹样本集合h上观测到测试手写笔迹t的书写节奏特征et的概率,如下公式定义为
c4)测试笔迹与书写节奏特征相关的判别,采用步骤c3)取得的书写节奏特征概率p(et),再结合其它特征,包括笔顺、布局、书写节奏,综合判断该测试手写笔迹样本t是否为真实笔迹;
c5)结束,返回判别结果。
另外,本实施例中,如图5所示,步骤a)、步骤b)和步骤c)中书写节奏特征的提取方法包括如下步骤:
d1)以笔迹w={(x1,y1,f1),(x2,y2,f2),...,(xn,yn,fn)}作为输入参数,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤n,n表示手写笔迹w中包含的采样点个数;
d2)计算笔迹w的书写速度信息,设lw={l1,l2,...,ln}表示笔迹w的书写速度时间序列;
d3)笔迹分割,提取笔迹w中的关键点k={k0,k1,k2,...,km-1,km},其中,ki表示关键点在笔迹w中的序号,0≤i≤m,k0=1,km=n,ki<ki+1,0≤i<m,由这些关键点将笔迹w分割成m段笔画;其中第i段笔画为
d4)构造一个与笔迹w等长的笔画长度序列a1={a11,a12,...,a1n},设初值a1i=0,1≤i<n,在每个笔画开始点处,置
d5)构造一个与笔迹w等长的笔画书写速度最大最小值序列a2={a21,a22,...,a2n},设初值a2i=0,1≤i<n,在每段笔画中相应位置置
d6)构造一个与笔迹w等长的笔画书写用力最大最小值序列a3={a31,a32,...,a3n},设初值a3i=0,1≤i<n,在每段笔画中相应位置置
d7)提取序列a1的频域特征,将序列a1={a11,a12,...,a1n}变换到频域空间,以前x项截断系数作为序列a1的特征表示e1={e11,e12,...,e1x};
d8)提取序列a2的频域特征,将序列a2={a21,a22,...,a2n}变换到频域空间,以前x项截断系数作为序列a2的特征表示e2={e21,e22,...,e2x};
d9)提取序列a3的频域特征,将序列a3={a31,a32,...,a3n}变换到频域空间,以前x项截断系数作为序列a3的特征表示e3={e31,e32,...,e3x};
d10)结束,返回特征集合ew={e11,e12,...,e1x,e21,e22,...,e2x,e31,e32,...,e3x}作为笔迹w的节奏特征。
本发明在线笔迹认证中一种书写节奏特征的提取及认证方法,有效提取书写节奏特征,并估算稳定且一致书写节奏特征在人群中出现的概率,通过有效识别不易被察觉的书写方式,极大地增加摹仿者的攻击难度和攻击成本,从而提升笔迹认证性能。
本发明未详细公开的部分属于本领域的公知技术。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。