模式识别系统和方法与流程

文档序号:11142344阅读:849来源:国知局
模式识别系统和方法与制造工艺

本发明涉及用于例如视觉模式的模式识别的方法和设备。本发明的一个应用为用于皮肤病学的应用。



背景技术:

人工神经网络(ANN)是计算模型并且由动物中枢神经系统,特别是脑而启发,其具有机械学习和模式识别的能力。人工神经网络通常呈现为由“突触”连接的节点或“神经元”的系统,其通过从输入通过ANN提供信息可以计算来自输入的值。突触是这样的机构,通过该机构,神经元中的一个将信号传递到神经元中的另一个。

ANN的一个例子是用于识别笔迹。一组输入神经元可通过表示字母或数字的输入图像的照相机中的像素被激活。随后这些输入神经元的激活被传递、加权并通过ANN的设计者确定的一些函数而转变为其他神经元等,直到最后输出神经元被激活,其确定被成像的哪个字符(字母或数字)。ANN已经用于解决各种各样的使用普通的基于规则的程序难以解决的任务,包括计算机视觉和语音识别。

ANN没有单独且正式的定义。通常一类统计模型如果该类由一系列自适应权重(由学习算法调整的数值参数)组成,并能够近似为统计模型的输入的非线性函数,则这类统计模型将被称为“神经”。自适应权重可以被认为是神经元之间的连接(突触)的强度。

ANN必须被训练以产生可理解的结果。有三个主要的学习范型:监督学习、非监督学习和强化学习。

在监督学习中,学习范例共同具有例如一组图像的一组预先分析的数据,其由ANN分析并且ANN中的神经元之间的连接(突触)的权重适于使得ANN的输出与已知图像相关。有涉及该训练的成本。ANN的结果的效率的提高可通过在训练组使用更大数量的数据项而获得。然而,所需要的项的数量越大,为了得到正确的结果进行分析的计算能力和时间将增加。因此需要在训练ANN花费的时间和结果的准确性之间建立权衡。

人工神经网络的最新发展包括所谓的“深度学习”。深度学习是试图使用输入的分层模型的一组算法。Jeffrey Heaton,多伦多大学,在发表在认知科学趋势(Trends in Cognitive Sciences)2007年第11卷,第10期,第428至434页的题为“学习表征的多层次(Learning Multiple Layers of Representation)”的综述文章中讨论了深度学习。该公开描述了含有上下连接并且在多层神经网络的训练的同时产生传感数据,而不是仅仅进行分类数据的多层神经网络。

现有技术的ANN中的神经元活性被计算为一系列离散时间的步骤,而不是通过使用连续参数。神经元的活性水平通常由所谓的“活性值”限定,它被设定为0或1,其描述了在时间步长t的“动作电位”。神经元之间的连接,即突触,用通常选择具有在区间[-1.0,+1.0]中的值的加权系数来加权。加权系数的负值代表“抑制性突触”并且加权系数的正值表示“刺激性值”。ANN中的活性值的计算使用简单的线性求和模型,其中在神经元处的突触上接收的加权的一些或全部活动的输入,与神经元(固定的)阈值比较。如果求和结果大于所述阈值,下面的神经元被激活。

在国际专利申请号WO 199 8027 511(Geiger)中描述了学习系统的一个实施例,其教导了不论大小或位置检测图像特性的方法。该方法包括使用多个信号生成装置,其输出以使用非线性组合的函数评价特性的形式表征图像信息。

国际专利申请号WO 2003 017252涉及用于识别语音声音序列或字符序列的方法。语音声音序列或字符序列首先供给到神经网络,并且通过考虑存储的语音和/或词汇信息由语音序列或字符序列形成特征的序列,其基于字符串序列。该装置通过使用已经预先编程的大量知识存储而识别语音字符序列。

Hans Geiger和Thomas Waschulzak发表在Informatik-Fachreichte,Springer-Verlag,1990年,第143-152页的一篇题为“结构联结系统的理论与应用”(Theorie und Anwen-dung strukturierte konnektionistische Systeme)的文章还描述了神经网络的实现。该文章的ANN的神经元具有0和255之间的活性值。神经元的每一个的活性值随时间改变,使得即使至神经元的输入保持不变。神经元的输出活性值会随时间而改变。该文章教导了节点中的任一个的活性值至少部分地依赖较早活动的结果的概念。文章还包括系统可开发的方式的简要细节。



技术实现要素:

本公开所描述的模式识别的方法和设备的原理基于所谓的生物学-激发神经网络(BNN)。BNN中的神经元中的任一个的活性模拟为生物物理过程。神经元的基本神经属性是“膜电压”,这在(湿的)生物学中受膜中的离子通道影响。神经元的动作电位依赖于该膜电压而产生,但是还包括一个随机(任意)成分,其中仅计算动作电位的概率。动作电位本身以任意方式生成。该膜在生物学上具有一些额外的电-化学性质的影响,诸如绝对和相对不应期、适应和增感,其自动地包含在本公开的BNN中。

从神经元的一个传递到神经元的另一个的基本信息不仅是动作电位(或激发率,将在下文描述),而且为动作电位的时间依赖模式。动作电位的此时间依赖模式被描述为单独的尖峰脉冲模型(SSM)。这意味着,来自神经元中的任何两个的输入之间的相互作用比活动的简单的线性求和更加复杂。

神经元(突触)之间的连接可具有不同的类型。突触不仅仅是接近刺激的或栖息的(ANN就是这种情况),也可能有其它的特性。例如,连接单个的神经元的树突树的拓扑也可以被考虑。来自在树突树中的树突上的两个输入神经元的突触的相对位置也可以对两个神经元之间的方向产生很大影响。

本公开的方法和设备可以在皮肤疾病和皮肤状况的确定中使用。

附图说明

图1示出了本公开的系统的实施例。

具体实施方式

本发明在附图的基础上描述。应当理解的是,本文中所描述的本发明的实施例和方面仅仅为示例,并且不以任何方式限定权利要求的保护范围。本发明由权利要求及其等同物限定。应该理解的是,本发明的一个方面或实施方式的特征可以与本发明的不同的一个或多个方面和/或实施方式的特征相结合。

图1示出了本发明的模式识别系统10的第一实施例。模式识别系统10具有多个传感器20,其具有接收来自模式15的信号的传感器输入25。模式15可以为视觉模式或者听觉模式。因此传感器输入25可以为光波或者声波,并且多个传感器20可以为例如麦克风的听觉传感器,或者例如视频或者静物照像机的视觉传感器。

传感器20产生传感器输出,其作为至多个第一激活细胞30的第一输入32。第一激活细胞30以一对一的关系与传感器20连接或者以一对多的关系与传感器20连接。换句话说,第一激活细胞30中的一个连接至一个或者多个传感器20。连接的数量取决于传感器20的数量,例如照相机中的像素的数量,以及第一激活细胞30的数量。在本发明的一个方面中,有来自视频照相机的四个像素,形成传感器20,并且该四个像素通常地连接至第一激活细胞30中的一个。

第一激活细胞30具有第一输出37,其包括以输出频率发射的多个尖峰脉冲。在“休息模式”中,即,在第一输入32上没有来自传感器20的传感器信号,第一激活细胞30以示例的200Hz的输出频率产生多个尖峰脉冲。因此,第一激活细胞30为单个尖峰脉冲模型的实施例。取决于来自传感器20的传感器信号的强度,第一输入32上的传感器信号的施加增加输出频率,例如高至400Hz。在本发明的一个方面中,传感器信号在第一输入32处的施加和移除大致立即地改变输出频率。由此,第一激活细胞30几乎立即对模式15中的改变作出反应。

多个第一激活细胞30以多对多的关系与多个第二激活细胞40连接。为简洁起见,图1中仅示出了第二激活细胞40中的一个与示例性数量的第一激活细胞30之间的连接。经历一段时间后,来自第一激活细胞中的连接的那些的第一输出37在连接的第二激活细胞40处相加。

输出37的值也被合并,使得来自(在这种情况下)三个中心第一激活细胞30的输出37’被添加,而来自第一激活细胞30的外部的那些的输出37”从总输出37减去。换句话说,中心三个传感器20’正向地促成在第二激活细胞40的输入42处接收的信号,而来自外部的传感器20”的信号被减去。这个加/减的效果为包括单一的、不变的可见形状和颜色的模式15将例如激活第一激活细胞30中的至少一些,但不激活第二激活细胞40,因为来自第一激活细胞30的输出信号37将彼此抵消。应该理解的是,三个中心第一激活细胞30和外部的那些第一激活细胞30仅为示例。可以使用更多数量的第一激活细胞30。

输出37’和37”仅为输出37可以被常规地合并的方式中的一个示例。在说明书的引言中解释的,神经元或激活细胞之间的连接(突触)一般不在线性求和模型中结合,而具有随机成分。在其中第一激活细胞30连接至传感器20和第二激活细胞40的本发明的此随机方面仅为本发明的一个方面。对于本发明的使用情况,连接可以酌情修改。

第二激活细胞40具有不同的激活水平和响应时间。第二激活细胞40还以一定的频率产生尖峰脉冲,并且该频率取决于输入信号42处的尖峰脉冲的频率而增加。第二激活细胞40的输出频率和输入信号42的输入频率之间没有一对一的关系。通常,输出频率将随输入信号42的增加而增加并且在阈值处饱和。依赖关系从一个第二激活细胞40改变至另一个第二激活细胞40,并且具有随机或任意成分。第二激活细胞40的响应时间也改变。部分的第二激活细胞40对输入信号42的改变几乎立即地作出反应,而其他的第二激活细胞40在第二激活细胞作出反应之前需要一些时间。部分的第二激活细胞40转而休息并且当输入信号42被移除时,不发出具有增加的尖峰脉冲频率的第二输出信号47,而即使输入信号42被移除,其他的第二激活细胞40仍旧被激活。由此,第二激活细胞40的激活持续时间跨越多个激活细胞40而改变。第二激活细胞40还具有“记忆”,其中他们的激活潜能取决于激活潜能的在先值。激活潜能的在先值由衰退因子进一步衡量,使得第二激活细胞40的较新的激活比所有的更强烈地影响激活潜能。

第二输出47被传递至设置在多个层80中的多个第三激活细胞70。多个层80的每个包括中间层85,其连接至第二输出47和一个或多个另外的层87,一个或多个另外的层87连接至层87的另一些中的第三激活细胞70。在附图的示例中,仅示出五个层80,但其仅为说明性的。在本发明用于视觉模式15的识别的一个方面中,呈现了七个层。同样可以具有更多数量的层80,但是这会增加所需的计算功率量。

第二输出47以多对多的关系与第二激活细胞40连接。

与针对第二激活细胞40所讨论的类似,第三激活细胞70也具有不同的激活水平和不同的激活时间。第二激活细胞40的功能是识别模式15中由传感器20识别的特征,而第三激活细胞70的功能是对特征的组合进行分类。

在层80的一个中的第三激活细胞70以多对多的关系与层80中的另一个中的第三激活细胞70连接。在不同层80中的第三激活细胞70之间的连接这样设置,使得一些连接是正向的且彼此增强,而其他的连接为反向的且彼此削弱。第三激活细胞70也有尖峰脉冲输出,其的频率取决于它们的输入的值。

第三激活细胞70与第二激活细胞40的输出之间还有反馈回路,其用作自控机制。第三激活细胞70和第二激活细胞之间的反馈基本上用于区分模式15中的不同的特征,并减少重叠信息。这是通过使用反馈机制以首先加强与模式15中的特定特征相关的第二激活细胞40以允许特征被正确地处理和识别而完成的。随后反馈减少用于识别的特征的第二激活细胞40的输出,并且加强与另一特征相关的第二激活细胞的值。随后,该另一特征可被识别。为了解决模式15中的任一重叠特征,该反馈是必要的,否则将导致不正确的分类。

模式识别系统10进一步包括用于输入与模式15相关的信息项95的输入装置90。信息项可包括一般地接附至模式15和/或接附至模式15中的一个或多个特征的名称或者标签。输入装置90连接至处理器100,其还接受第三输出77。该处理器将与特定的显示的模式15相关的第三输出77和输入的信息项95作比较,并且可以将特定的显示的模式15和输入的信息项相关联。该关联被记住,使得如果由传感器20检测到未知的模式15,并且第三输出77大致相似于该关联,处理器100可以确定未知的模式事实上就是已知的模式15,并且输出关联的信息项95。

模式识别系统10可以通过使用非监督的学习过程来训练,以识别大量的模式15。这些模式15将产生不同的第三输出77,并且信息项95和模式15之间的关联被存储。

实施例1:视觉模式识别

当前公开的系统和方法可以被用于确定且分类视觉模式15。

在系统和方法的本实施例中,静止照相机形成传感器20。传感器20对光的颜色和强度作出反应。传感器20计算三个值。第一值取决于亮度,而第二和第三值由色差(红-绿和蓝-绿)算出。色差值为约50%分布。第一激活细胞30的触发取决于色差和亮度的组合。传感器20和第一激活细胞30可以被认为是相当于人的视网膜。

来自第一激活细胞30的第一输出37被传输至第二激活细胞40,并随后传输至第三激活细胞70。第二激活细胞40可以与人类外侧膝状体(LGN)等同,并且激活细胞70可以与人类皮质等同。第一激活细胞30的激活电势取决于原始模式15。这些信号被传输至下级,并且首先第三激活细胞80的明显的随机序列似乎被激发。在一段时间后激发稳定,并且在多个层80内形成“结构”,其反映由传感器20成像的模式15。

标签可以与模式15关联。因此多个层80内的结构对应于模式15。标签将由诸如键盘的输入装置90输入。

对于不同的模式15重复该过程。此不同的模式15在多个层80内形成不同的结构。随后可以使用不同的模式15继续学习过程。

一旦完成学习,未知的模式15可以被置于传感器20前。该未知的模式15在第一激活细胞30中产生信号,其传输至第二激活细胞40以识别未知的模式15中的特征,并且随后进入多个层80以使模式15的分类成为可能。多个层80中的信号可以被分析,并且多个层80内大部分对应于未知的模式15的结构被识别。因此系统10可以输出与结构关联的标签。因此未知模式15被识别。

如果因为新的类型的结构已在多个层80中形成而系统10无法识别未知的模式15,那么系统10可以给予适当的警告并且可以启动人为干预,以便对未知的模式15分类或解决其他冲突。随后,用户可以手动查看未知的模式15,并通过将标签与未知的模式关联而对该未知的模式分类或者拒绝该未知的模式。

考虑到视觉模式15中两条重叠的线,第二激活细胞40和第三激活细胞70之间的反馈可以容易地理解。首先第一激活细胞30将围绕两条重叠的线登记视觉模式15中的不同,但不能区别特征的类型,即,在重叠的线中区分出两条不同的线。相似地,相邻的第二激活细胞40将被激活,因为两条重叠的线的重叠性质。如果全部的第二激活细胞40和第三激活细胞70同样地做出反应,那么将不可能在两条重叠的线之间区分。然而,上文已经解释,第二激活细胞40和第三激活细胞70的激活存在任意或随机因素。这样的随机因素导致部分的第二激活细胞40和/或第三激活细胞70被早于其他而激活。第二激活细胞40或第三激活细胞70之间的相互干扰将加强和/或减弱激活潜能并且由此那些对一个重叠的线做出反应的第二激活细胞40或第三激活细胞70将首先互相地彼此加强,以允许识别特征。激活潜能的衰退意味着在短时间(毫秒)之后,那些与识别的重叠的线关联的第二激活细胞40或第三激活细胞70减少强度并且与至此仍未识别的重叠的线相关的其它第二激活细胞40或其它第三激活细胞70被激活以允许该一个重叠的线被识别。

实施例2:皮肤情况的识别

实施例1的系统可以用于识别不同类型的皮肤(皮肤病学的)情况。在此实施例中,使用形式为存储的具有关联标签的不同类型的皮肤情况的黑白或彩色数字图像的一系列模式15训练系统10。在第一步中,使用常规的图像处理方法处理数字图像,使得其余的图像仅聚焦在异常皮肤情况的区域。合格的医生将图像与指示该异常皮肤情况的标签关联,并如上所述训练系统。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1