具有生物计量鉴别入侵和进入控制的系统及方法

文档序号:8906249阅读:218来源:国知局
具有生物计量鉴别入侵和进入控制的系统及方法
【专利说明】具有生物计量鉴别入侵和进入控制的系统及方法
[0001]相关申请的交叉引用
[0002]本申请要求2014年2月28日提交的美国临时专利申请序列号61/946283的权益,其全部内容通过引用被合并于此,如同完全在此阐述。
技术领域
[0003]本发明一般涉及一种安全检测和控制系统,并且更具体地涉及一种系统和方法,其可以检测、处理并且响应于视觉和声响(audible)输入的结合。
【背景技术】
[0004]在物理安全领域,当进入受保护的住所、公寓或营业地点时,解除(disarm)报警系统通常包括用户键入预先指定的4位数的PIN码。不幸的是,这种常见的行为非常经常是错误报警以及客户受挫的来源,错误报警以及客户受挫源于输错PIN、在粘滞/间歇键座上的双键输入、或者在进入门口时拿不稳或掉落可能在手中的物品。使情况更糟糕是,用户可能在严格的时间压力下努力完成这个操作,以在预定的进入计时器(诸如例如30秒)期满以及向中心站呼叫报警之前停用报警系统。因此,在本领域中需要机会使解除报警过程更容易,压力更小,并且提供改进的用户体验一一通过仅允许被授权的个人解除所述系统而始终维护整个系统的安全。
[0005]所需要的是在门口的“好人/坏人检测器”的等同物,其可以有助于解除报警系统,同时维护正确的授权个人。这样的检测器(其可以是整个报警系统的一部分)应该通过使用个人独特的物理特性(基于生物计量学)而以理想的方式工作,不必持有可能丢失或被盗的“密钥卡”、进入卡或其他ID令牌。根据这样的检测,可以保持无手操作以允许携带物品或包裹,或者允许在寒冷的天气佩戴手套。将进一步有利的是,这样的进入和授权过程快速、方便以及不妨碍用户在门口的进入或外出。
[0006]附图的简要描述
[0007]图1是图示了根据本文所阐述的实施例的系统的示意图的框图。
[0008]图2是图示了根据本文所提出的实施例的第一方法的第一流程图。
[0009]图3是图示了根据本文所提出的实施例的另一方法的第二流程图。
【具体实施方式】
[0010]虽然本发明容许许多不同形式的实施例,但其以如下理解在附图中被示出并且将在本文对其具体实施例进行详细描述:本公开被认为是本发明原理的范例,而不是为了将本发明限制为所说明的具体实施例。
[0011]如本文所提出的,本发明的实施例涉及安全检测和控制系统及方法,其可以检测、处理并且响应于视觉和声响输入的结合。虽然这样的视觉和声响输入通常在本文中被描述为面部和语音识别特征,但是本领域普通技术人员将理解的是,本发明的实施例不限于此方面,并且可以不受限制地结合任何类型的视觉或声响输入检测一起使用。
[0012]本文中所述的实施例可以提供面部+语音生物计量融合鉴别,其可以作为这样的“好人/坏人检测器”。根据这样的实施例,在这样的系统中可以达到至少两个基本目标:
(I)通过符合公认的行业和监管标准而在适当授权或拒绝指定个人方面继续确保最高置信度,以及(2)通过向授权个人提供快速和方便的方式以解除报警系统并获得进入而保持积极的用户体验。
[0013]现在参照附图,图1图示了根据本文所提出实施例的示例性系统或设备10。所述设备10可以包括视觉输入装置12,诸如例如具有视野11的用于捕捉或记录视觉图像的摄像机或者其他装置。所述设备10可以进一步包括声响输入装置14,诸如例如用于捕捉视野11附近声音的传感器、检测器或麦克风。视觉和声响输入装置12、14可以位于入口通道附近,所述入口通道表征门(D)或其他类型的物理屏障,其可以在打开和关闭位置之间移动以允许或阻挡通过入口通道进入或离开。门(D)可以包括进入控制装置16,诸如例如机械、机电或磁性锁、阴极锁或电子控制器,其可以确保门(D)在关闭位置,以电子方式接合或分离进入控制装置16或者致动或控制门(D)或物理屏障打开或关闭。
[0014]视觉和声响输入装置12、14可以电耦合到监控系统18,监控系统18具有一个或多个控制电路和/或可编程处理器。监控系统18物理上可以位于本地或相对于视觉和声响输入装置12、14的远程位置,并且可以接收来自输入装置12、14的电子输入信号以及发送电子门控信号到进入控制装置16。所述监控系统18还可以耦合到一个或多个检测器22,所述检测器22位于整个建筑或设施的其他位置。
[0015]系统10还可以连接到手动可操作输入构件20 (例如,键盘),其可以允许用户装备(arm)或解除(disarm)监控系统18。其他电路也可以被提供并且耦合到控制电路,以评估声响或视觉指令中的至少一个从而装备或解除监控系统。
[0016]根据本文所提出的实施例,系统10可以包括面部识别处理路径(视频中心),语音识别处理路径(音频中心)以及融合计算器/决策装置。因此,监控系统18的控制电路可以响应于从输入装置12、14接收的视觉和声响输入两者而实现认证过程。
[0017]在执行这个认证过程中,控制电路可以接收和识别来自对象的语音命令以及对象面部特征的至少一个视觉图像,并且可以建立面部特征和语音命令的元素的评分。例如,来自视觉输入装置的电信号可以与来自声响输入装置的信号结合,以提供多方面的认证指示符,该认证指示符可以通过控制电路与预存规则集进行比较。在一个实施例中,例如,预存规则集可以是一组阈值。因此,控制电路可以结合来自输入装置12、14的电信号以登记授权的对象,并且生成对象相应的面部特征和语音元素的模板。
[0018]图2是图示了根据本文所提出的实施例的用于认证对象的示例性方法100的流程图。根据这样的方法100,系统可以响应于识别出预定类型的图像或接收到音频触发中的一个而启动用户认证过程的操作102。在认证对象时,系统可以在面部观察区域提供基本上恒定的照明度和/或从面部观察区域获得对象的图像序列104,以及使用所述序列检测面部形状106。同时,系统可以在可能利用背景噪声消除的情况下获得音频输入或信号103,例如来自对象的通行短语,以及可以处理音频输入以检测预定的音频特性105,从而创建说话人身份评分,说话人身份评分可以用于检测对象的身份。
[0019]系统还可以把来自所检测的面部形状的信息和来自对象的声响说话人身份评分相结合108,并且自动地确定相关的置信度评分110。根据本发明的实施例,置信度评分可以与预定阈值进行比较112。这种比较的结果是,可以关于允许进入、请求额外的确认(例如PIN输入)还是启动报警而进行确定114。
[0020]图3图示了根据本文所提出实施例的方法200的进一步细节。根据这个方法200,可以提供具有如下各项的检测器/传感器单元:用于捕捉图像的摄像机以及用于捕捉语音信号以供识别(文本相关或文本无关)的麦克风或声学换能器或传感器。授权的对象可以在系统中登记204,以生成对象面部特征和语音元素的模板。在认证对象时,可以捕捉对象面部特征的至少一个视觉图像以及来自对象的语音命令206,并且可以识别面部特征和语音命令的预定元素208。
[0021]在处理所捕捉到的输入时,可以建立所捕捉面部特征和语音命令的元素的评分210,以及基于最小和最大评分使该评分标准化212。基于面部和语音评分,可以表征面部和语音元素的质量214,并且可以从质量矩阵选择融合权重并且计算融合评分216。可以将融合评分与登记的授权对象的模板进行比较218。在检测到模板匹配的情况下,系统可以被解除武装220。相反,在没有检测到模板匹配的情况下,可以拒绝进入和/或生成报警222。
[0022]针对本文所提出类型的进入控制系统单元的会议行业公认的物理安全标准通过UL294 标准建立。UL294 要求 1/10000 的 FAR(0.01%差错)和 1/1000 的 FRR(0.1%差错)。满足这个要求可以通过采用面部识别评分和语音模式识别评分的结合融合而实现。目前最好的面部识别技术具有大约1%的差错率。目前最好的语音识别技术具有大约10%的差错率。然而,当结合基于置信度评分的面部匹配+语音匹配评分的融合时,已经确定的是可以实现安全行业所要求以及UL294中所述的期望的1/10
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1