影像场景辨识方法

文档序号：7682464阅读：317来源：国知局

专利名称：影像场景辨识方法
技术领域：
本发明涉及一种影像辨识方法，特别是涉及一种影像自动场景辨识方法。
背景技术：
目前，一般数字影像获取器如数字相机等在摄影时容易受到使用者的技术与影像周围光源与背景的影响，而使得影像失真。因此，一般数字影像获取器如数字相机等多半使用许多场景模式以辅助使用者加强所拍摄的影像品质。一般常见的场景模式如山、海、花、雪地与人物等是事先设定好对焦、曝光、色彩调整或白平衡等参数，其都预设于数字影像获取器当中以供使用者依照摄影时的现实情况来选择使用。
然而，一般数字影像获取器虽具有诸多场景模式供使用者依现实情况选择较为适宜的模式来做拍摄，但是使用者必须手动调整场景模式才能选用，当使用者疏忽或者是无法自行判断适当的场景模式时，将造成拍摄影像品质无法有效提升，甚至使得影像品质更加不良。
如上所述，由于一般数字影像获取器无法自动辨识拍摄时的影像场景，使用者必须自行判断现实状况后手动选用适当的场景模式，因此造成使用者于拍摄上相当不便。

发明内容
本发明所要解决的技术问题在于提供一种影像场景辨识方法，以解决先前技术中的一般数字影像获取器无法自动辨识拍摄时的影像场景而使得使用者必须自行判断现实状况后手动选用适当的场景模式的问题。
为了解决上述技术问题，本发明提供一种影像场景辨识方法，其特点在于，
该步骤包括检测一影像；分割该影像以得到多个影像单元；取得每一该影像单元的一色彩特征与一结构特征；根据每一该影像单元的该色彩特征与该结构特征定义出每一该影像单元的一标的类别；以及分析该影像所包含的每一该影
3像单元的该标的类别以选定相应该影像的一场景模式。
上述影像场景辨识方法，其特点在于，该定义该标的类别的步骤包括利用一数据库比较及定义出每一该影像单元的该标的类别。
上述影像场景辨识方法，其特点在于，还包括利用一类神经网络建立该数据库。
上述影像场景辨识方法，其特点在于，建立该数据库的步骤，包括提供大量的标准的该标的类别给该类神经网络；以及通过该类神经网络学习提供的该标准的该标的类别而建立该数据库。
上述影像场景辨识方法，其特点在于，选定相应该影像的该场景模式的步骤，包括通过分析与统计所有该影像单元所属的该标的类别的数量与配置情形而选定该场景模式。
上述影像场景辨识方法，其特点在于，还包括提供至少一标准的该标的类别给该类神经网络；以及通过该类神经网络学习提供的该标准的该标的类别而更新该数据库的内容。
通过本发明的技术手段，可达到自动辨识影像场景，进而增加数字摄影的便利性以及提高拍摄影像的品质。因此，使用者在使用应用本发明的数字影像获取器进行拍摄时，不必手动选用场景模式，可由数字影像获取器自动辨识并选定场景模式。
以下结合附图和具体实施例对本发明进行详细描述，但不作为对本发明的限定。

图1为本发明一实施例的影像场景辨识方法流程图2为本发明一实施例的影像场景辨识模型示意图3为本发明一实施例的类神经网络数据库学习模型示意图4为本发明一实施例的类神经网络数据库建立流程图；以及
图5为本发明一实施例的类神经网络数据库更新流程图。
其中，附图标记-
100 影像 110 影像单元
120 色彩特征 130 结构特征200 数据库 250 类神经网络
300 标的类别 400 场景模式
具体实施例方式
请参照图1，为根据本发明一实施例的影像场景辨识方法的流程图。
如图1所示，步骤IO，一开始先对一影像进行检测。接着，步骤20，分割影像以得到多个影像单元。步骤30，跟着取得每一影像单元的一色彩特征与一结构特征。然后，步骤40，根据每一影像单元的色彩特征与结构特征定义出每一影像单元的标的类别。最后，步骤50，分析及统计影像所包含的每一影像单元的标的类别以选定相应影像的一场景模式，作为影像的场景模式。
请参照图2，为在根据本发明的影像场景辨识方法上，一实施例的影像场景辨识模型的示意图。如图2所示，首先检测一影像100并将影像100分割成九个影像单元110。
在此为了方便说明仅分割成九个影像单元110，然其并非用以限定本发明
的实施方式，仅为示例性说明，在实施上还可分割成更多个影像单元iio。
接着，在得到九个影像单元110之后，抽取每一影像单元110的两种主要特征，也即取得每一影像单元110的色彩特征120与结构特征130。
其中，色彩特征120如蓝、绿与黄等颜色。结构特征130如物质的表面组成等结构。
然后，根据每一影像单元110的色彩特征120与结构特征130，利用一数据库200定义出每一影像单元110的标的类别300，因此可得到九个标的类别 300。于数据库200中会储存有每种标的类别300与其所对应的色彩特征120 与结构特征130。
其中，标的类别300如天空、皮肤、水与沙等类别。
最后，分析所得到的九个标的类别300，通过统计结果选定一场景模式 400，以作为影像100的场景。
其中，场景模式400如海景、雪景、高山、蓝天、花海与人物等。
于本实施例中，影像场景辨识模型先通过检测得到一影像100，再将影像 100分割成九个影像单元110，每一影像单元110抽取出色彩特征120与结构特征130，接着通过数据库200定义出九个标的类别300，最后通过分析统计而得到相应于影像100的一场景模式400。
以拍摄海滩上的人物为例，一开始先对包含沙滩、海水与人物的影像进行检测。然后将检测到的影像分割成多个影像单元。此时，每一个影像单元所包含的部分都不一样，有的是人物的皮肤，有的是海水或沙子。换句话说，影像在分割后可产生有包含皮肤的影像单元、包含沙子的影像单元与包含海水的影像单元。然后将包含皮肤的影像单元、包含沙子的影像单元与包含海水的影像单元各自抽取出色彩特征与结构特征。其中，皮肤、沙子与海水的色彩特征都不同，结构特征也不一样。然后根据每一影像单元的色彩特征与结构特征定义出每一影像单元的标的类别。例如根据色彩特征与结构特征会将包含皮肤的影像单元判定为代表皮肤的标的类别、将包含沙子的影像单元判定为代表沙子的标的类别，而将包含海水的影像单元判定为代表海水的标的类别。最后分析与统计影像所包含的每一影像单元所对应的标的类别，如皮肤、沙子与海水的数量与配置情形，而辨识影像场景是海滩上的人物照，进而影像获取器如相机的场景模式将自动设定为海滩人物照模式。
请参照图3，为在根据本发明的影像场景辨识方法中，一实施例的类神经
网络数据库的学习模型的示意图。
如图3所示，一开始先将多个标的类别300，如天空、皮肤、水与沙等，个别抽取出色彩特征120与结构特征130等资料。然后，将每一个标的类别 300的色彩特征120与结构特征130的资料输入到类神经网络250以供学习之用。最后类神经网络250通过学习过程而建立一数据库200，即类神经网络数据库，以供于场景辨识过程中比对出各影像单元的标的类别300。
类神经网络250是一种模仿人类神经系统且具有学习能力的运算结构，由许多运算单元之间众多连结所组成，运算单元是以平行且分散的方式运作，可以同时处理大量的数据。
请参照图4，为在根据本发明的影像场景辨识方法中，一实施例的类神经
网络数据库建立流程图。
如图4所示，步骤60，可提供大量的标的类别300供类神经网络250，步
骤70，让类神经网络250学习并建立数据库200，以供辨识各标的类别犯0。再者，此类神经网络250也可内建于前述实施例的影像场景辨识模型中。请参照图5，为在根据本发明的影像场景辨识方法中，一实施例的类神经
6网络数据库更新流程图。
如图5所示，步骤80，使用者可将取得的至少一标准标的类别300提供给类神经网络250，步骤90，类神经网络250进而学习并更新数据库200中所储存的标的类别300与色彩特征120和结构特征130的对应关系。
综上所述，通过本发明的技术手段，可达到自动辨识影像场景，以增加数字摄影的便利性以及提高拍摄影像的品质。简言之，使用者在使用应用本发明的数字影像获取器进行拍摄时不必手动选用场景模式，可由数字影像获取器根据本发明的影像场景辨识方法而自动辨识并选定较佳场景模式。
当然，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员可根据本发明做出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明权利要求的保护范围。
权利要求
1、一种影像场景辨识方法，其特征在于，该步骤包括检测一影像；分割该影像以得到多个影像单元；取得每一该影像单元的一色彩特征与一结构特征；根据每一该影像单元的该色彩特征与该结构特征定义出每一该影像单元的一标的类别；以及分析该影像所包含的每一该影像单元的该标的类别以选定相应该影像的一场景模式。
2、根据权利要求1所述的影像场景辨识方法，其特征在于，该定义该标的类别的步骤包括利用一数据库比较及定义出每一该影像单元的该标的类别。
3、根据权利要求2所述的影像场景辨识方法，其特征在于，还包括利用一类神经网络建立该数据库。
4、根据权利要求3所述的影像场景辨识方法，其特征在于，建立该数据库的步骤，包括提供大量的标准的该标的类别给该类神经网络；以及通过该类神经网络学习提供的该标准的该标的类别而建立该数据库。
5、根据权利要求1所述的影像场景辨识方法，其特征在于，选定相应该影像的该场景模式的步骤，包括通过分析与统计所有该影像单元所属的该标的类别的数量与配置情形而选定该场景模式。
6、根据权利要求3所述的影像场景辨识方法，其特征在于，还包括提供至少一标准的该标的类别给该类神经网络；以及通过该类神经网络学习提供的该标准的该标的类别而更新该数据库的内容。
全文摘要
本发明涉及一种影像场景辨识方法，该步骤包括检测一影像；分割该影像以得到多个影像单元；取得每一该影像单元的色彩特征与结构特征；根据每一该影像单元的该色彩特征与该结构特征定义出每一该影像单元的标的类别；以及分析该影像所包含的每一该影像单元的该标的类别以选定相应该影像的场景模式。通过本发明，可达到自动辨识影像场景，进而增加数字摄影的便利性以及提高拍摄影像的品质，使用者不必手动选用场景模式，可由数字影像获取器自动辨识并选定场景模式。
文档编号H04N5/232GK101489044SQ200810002369
公开日2009年7月22日申请日期2008年1月15日优先权日2008年1月15日
发明者林升甫, 陈皇村申请人:华晶科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈皇村;林升甫
技术所有人：华晶科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。