一种用于智能机器人的识别方法

文档序号:8381277阅读:683来源:国知局
一种用于智能机器人的识别方法
【技术领域】
[0001] 本申请涉及智能机器人技术领域,尤其涉及一种用于智能机器人的识别方法及系 统。
【背景技术】
[0002] 随着信息技术的飞速发展,特别是Internet的发展,数据信息化的不断深入。越 来越多的事务,可以通过智能机器人来办理,例如:在公共安全领域的用于智能门禁、智能 视频监控、公安布控、海关身份验证、实际驾照验证等的智能机器人;在民事和经济领域对 各类银行卡、金融卡、信用卡、存蓄卡的持卡人进行身份验证的智能机器人。为了信息安全, 办理业务之前通常需要通过验证人员身份后,智能机器人才能为其办理所请求的业务。
[0003] 传统的身份验证方法是根据预先设置的密码或特定的身份标识物,如:证件,来鉴 别不同用户。这种方法存在明显的缺点,如:个人的身份标识物容易丢失或被伪造,密码容 易遗忘或者被破译。更为严重的是,这些系统无法区分真正的拥有者和取得身份标识物的 冒充者。为了克服传统身份验证的缺陷,结合人类鉴别不同个体的方法和特点以及人类自 身的一些生理和行为特征,如:面像、声音和指纹等,其中指纹也容易被窃取后套模。因而, 越来越多的智能机器人采用人脸和声音鉴别技术来鉴别用户身份。
[0004] 人脸鉴别,就是将待识别的人脸与数据库中的已知人脸进行比较,得出相关信息, 这一过程的核心是选择适当的人脸表示方式和匹配策略。通常,将人脸鉴别成为人脸识别。
[0005] 通常,以一些身份证件,如:身份证、护照等照片或者录入的可信照片,作为身份鉴 别中人脸识别的比对版本。由于身份证件都是具有一定有效期的,如:成人身份证通常有效 期为20年、老年人身份证为长期、幼儿身份证有效期为5年等。那么在证件有效期内,人员 的照片将不会更换。此外,由于采集照片时的亮度、人员肤色等信息都会影响人脸识别的准 确度。由此带来了,随着时间推移或者采集环境或者人员身体状态不同,身份鉴别的准确率 逐步下降,即使是本人也不同通过智能机器人的身份鉴别验证的问题。而如果在一段时间 就要求所有人员更新照片,这样的成本太高,需要耗费太多的人力和物力。
[0006] 此外,通过声音来鉴别人员的身份,在接收声音输入时,周围环境噪音会影响对于 声音鉴别的准确性。如何解决环境噪音对于声音识别的影响也是亟待解决的一个问题。

【发明内容】

[0007] 有鉴于此,本申请提供一种用于智能机器人的识别方法,其能避免各种因素而降 低识别准确率的问题,使得智能机器人能以高准确率地进行人员身份鉴别。
[0008] 本申请提供一种用于只能机器人的声音识别方法,所述方法包括步骤:
[0009] 步骤一,建立识别数据库;
[0010] 步骤二,输入待鉴别的人脸图像和声音信息;
[0011] 步骤三,计算所述人脸图像和声音信息的特征向量;
[0012] 步骤四,进行人脸和声音鉴定;
[0013] 步骤五,输出身份鉴别结果。
[0014] 根据在本申请一具体实施例中,所述建立识别数据库包括分别建立人脸识别子数 据库和声音识别子数据库。
[0015] 根据在本申请一具体实施例中,所述建立人脸识别子数据库包括:采集所有人的 可靠图像、可靠图像的人脸特征提取以及在数据库中记录人脸特征信息。
[0016] 根据在本申请一具体实施例中,所述建立声音识别子数据库包括:采集所有人的 可靠声音、可靠声音的特征提取以及在数据库中记录声音特征信息。
[0017] 根据在本申请一具体实施例中,所述可靠图像的人脸特征提取包括:对于每张输 入的可靠图像进行以下处理:
[0018] 对第i个人的第j张可靠的人脸图像进行预处理,其中0 < i < n+l,0 < j <m+l, m、η为正整数;
[0019] 对所述第i个人的第j张作小波分解,获得低频LL部分子图像,对所述作低频LL 部分子图像傅里叶变换,采用其振幅作为该可靠图像的频谱特征Si,
[0020] 根据在本申请一具体实施例中,所述对第i个人的第j张可靠的人脸图像进行预 处理指的是通过小波变换来对每一张可靠图像进行降维处理。
[0021] 根据在本申请一具体实施例中,所述计算输入图像的特征向量包括:
[0022] 对所述输入图像进行预处理;
[0023] 所述输入图像作小波分解,获得低频LL部分子图像,对所述作低频LL部分子图像 傅里叶变换,采用其振幅作为该输入图像的频谱特征Y'。
[0024] 根据在本申请一具体实施例中,所述可靠声音的特征提取包括:
[0025] (1)将所述可靠声音对应的音频信号x(i)划分成一系列连续的帧,对每帧信号做 傅里叶变换;
[0026] (2)使用滤波器对音频信号进行处理,并移除所述音频信号的中间偏差;
[0027] (3)对所有滤波器输出的音频信号数据做非线性幂函数运算;
[0028] (4)对所述非线性幂函数运算结果进一步做离散余弦变换后得到声音特征参数。
[0029] 根据在本申请一具体实施例中,所述滤波器中使用的滤波函数为filter(t)= 8竹- 2'〇8(2 31妒0辣)),其中:参数0为滤波器的初始相位,11为滤波器的阶数; 当 t < 0 时,u (t) = 0,当 t > 0 时,u (t) = I ;B = I. 019*ERB (f0),ERB (f0)为滤波器的等 价矩形带宽,与滤波器中心频率fQ的关系为:ERB(f。)= 24. 7+0. 108f。。
[0030] 根据在本申请一具体实施例中,所述移除音频信号的中间偏差包括:
[0031] (1)在音频信号分帧后,把7个帧组成一个分段;
[0032] (2)使用26. 5ms作为海明窗口,重叠帧长为10ms,每帧的中间量Q(i,j)通过计算 段内帧能量P (i,j)的平均值得到:
[0033]
【主权项】
1. 一种用于智能机器人的身份鉴别方法,所述方法包括: 步骤一,建立识别数据库; 步骤二,输入待鉴别的人脸图像和声音信息; 步骤三,计算所述人脸图像和声音信息的特征向量; 步骤四,进行人脸和声音鉴定; 步骤五,输出身份鉴别结果。
2. 根据权利要求1所述的方法,其特征在于,所述建立识别数据库包括分别建立人脸 识别子数据库和声音识别子数据库。
3. 根据权利要求2所述的方法,其特征在于,所述建立人脸识别子数据库包括:采集所 有人的可靠图像、可靠图像的人脸特征提取以及在数据库中记录人脸特征信息。
4. 根据权利要求2所述的方法,其特征在于,所述建立声音识别子数据库包括:采集 所有人的可靠声音、可靠声音的特征提取以及在所述人脸识别子数据库中记录声音特征信 息。
5. 根据权利要求3所述的方法,其特征在于,所述可靠图像的人脸特征提取包括:对于 每张输入的可靠图像进行以下处理: 对第i个人的第j张可靠的人脸图像进行预处理,其中〇 <i<n+l,0 <j<m+l,m、n为正整数; 对所述第i个人的第j张作小波分解,获得低频LL部分子图像,对所述作低频LL部分 子图像傅里叶变换,采用其振幅作为该可靠图像的频谱特征Si>j。
6. 根据权利要求5所述的方法,其特征在于,所述对第i个人的第j张可靠的人脸图像 进行预处理指的是通过小波变换来对每一张可靠图像进行降维处理。
7. 根据权利要求6所述的方法,其特征在于,所述计算输入图像的
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1