专利名称:影像场景辨识方法
技术领域:
本发明涉及一种影像辨识方法,特别是涉及一种影像自动场景辨识方法。
背景技术:
目前, 一般数字影像获取器如数字相机等在摄影时容易受到使用者的技术 与影像周围光源与背景的影响,而使得影像失真。因此, 一般数字影像获取器 如数字相机等多半使用许多场景模式以辅助使用者加强所拍摄的影像品质。一 般常见的场景模式如山、海、花、雪地与人物等是事先设定好对焦、曝光、色 彩调整或白平衡等参数,其都预设于数字影像获取器当中以供使用者依照摄影 时的现实情况来选择使用。
然而,一般数字影像获取器虽具有诸多场景模式供使用者依现实情况选择 较为适宜的模式来做拍摄,但是使用者必须手动调整场景模式才能选用,当使 用者疏忽或者是无法自行判断适当的场景模式时,将造成拍摄影像品质无法有 效提升,甚至使得影像品质更加不良。
如上所述,由于一般数字影像获取器无法自动辨识拍摄时的影像场景,使 用者必须自行判断现实状况后手动选用适当的场景模式,因此造成使用者于拍 摄上相当不便。
发明内容
本发明所要解决的技术问题在于提供一种影像场景辨识方法,以解决先前 技术中的一般数字影像获取器无法自动辨识拍摄时的影像场景而使得使用者 必须自行判断现实状况后手动选用适当的场景模式的问题。
为了解决上述技术问题,本发明提供一种影像场景辨识方法,其特点在于,
该步骤包括检测一影像;分割该影像以得到多个影像单元;取得每一该影像 单元的一色彩特征与一结构特征;根据每一该影像单元的该色彩特征与该结构 特征定义出每一该影像单元的一标的类别;以及分析该影像所包含的每一该影
3像单元的该标的类别以选定相应该影像的一场景模式。
上述影像场景辨识方法,其特点在于,该定义该标的类别的步骤包括利 用一数据库比较及定义出每一该影像单元的该标的类别。
上述影像场景辨识方法,其特点在于,还包括利用一类神经网络建立该 数据库。
上述影像场景辨识方法,其特点在于,建立该数据库的步骤,包括提供 大量的标准的该标的类别给该类神经网络;以及通过该类神经网络学习提供的 该标准的该标的类别而建立该数据库。
上述影像场景辨识方法,其特点在于,选定相应该影像的该场景模式的步 骤,包括通过分析与统计所有该影像单元所属的该标的类别的数量与配置情 形而选定该场景模式。
上述影像场景辨识方法,其特点在于,还包括提供至少一标准的该标的 类别给该类神经网络;以及通过该类神经网络学习提供的该标准的该标的类别 而更新该数据库的内容。
通过本发明的技术手段,可达到自动辨识影像场景,进而增加数字摄影的 便利性以及提高拍摄影像的品质。因此,使用者在使用应用本发明的数字影像 获取器进行拍摄时,不必手动选用场景模式,可由数字影像获取器自动辨识并 选定场景模式。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的 限定。
图1为本发明一实施例的影像场景辨识方法流程图2为本发明一实施例的影像场景辨识模型示意图3为本发明一实施例的类神经网络数据库学习模型示意图4为本发明一实施例的类神经网络数据库建立流程图;以及
图5为本发明一实施例的类神经网络数据库更新流程图。
其中,附图标记-
100 影像 110 影像单元
120 色彩特征 130 结构特征200 数据库 250 类神经网络
300 标的类别 400 场景模式
具体实施例方式
请参照图1,为根据本发明一实施例的影像场景辨识方法的流程图。
如图1所示,步骤IO, 一开始先对一影像进行检测。接着,步骤20,分 割影像以得到多个影像单元。步骤30,跟着取得每一影像单元的一色彩特征 与一结构特征。然后,步骤40,根据每一影像单元的色彩特征与结构特征定 义出每一影像单元的标的类别。最后,步骤50,分析及统计影像所包含的每 一影像单元的标的类别以选定相应影像的一场景模式,作为影像的场景模式。
请参照图2,为在根据本发明的影像场景辨识方法上, 一实施例的影像场 景辨识模型的示意图。如图2所示,首先检测一影像100并将影像100分割成 九个影像单元110。
在此为了方便说明仅分割成九个影像单元110,然其并非用以限定本发明
的实施方式,仅为示例性说明,在实施上还可分割成更多个影像单元iio。
接着,在得到九个影像单元110之后,抽取每一影像单元110的两种主要 特征,也即取得每一影像单元110的色彩特征120与结构特征130。
其中,色彩特征120如蓝、绿与黄等颜色。结构特征130如物质的表面组 成等结构。
然后,根据每一影像单元110的色彩特征120与结构特征130,利用一数 据库200定义出每一影像单元110的标的类别300,因此可得到九个标的类别 300。于数据库200中会储存有每种标的类别300与其所对应的色彩特征120 与结构特征130。
其中,标的类别300如天空、皮肤、水与沙等类别。
最后,分析所得到的九个标的类别300,通过统计结果选定一场景模式 400,以作为影像100的场景。
其中,场景模式400如海景、雪景、高山、蓝天、花海与人物等。
于本实施例中,影像场景辨识模型先通过检测得到一影像100,再将影像 100分割成九个影像单元110,每一影像单元110抽取出色彩特征120与结构 特征130,接着通过数据库200定义出九个标的类别300,最后通过分析统计而得到相应于影像100的一场景模式400。
以拍摄海滩上的人物为例, 一开始先对包含沙滩、海水与人物的影像进行 检测。然后将检测到的影像分割成多个影像单元。此时,每一个影像单元所包 含的部分都不一样,有的是人物的皮肤,有的是海水或沙子。换句话说,影像 在分割后可产生有包含皮肤的影像单元、包含沙子的影像单元与包含海水的影 像单元。然后将包含皮肤的影像单元、包含沙子的影像单元与包含海水的影像 单元各自抽取出色彩特征与结构特征。其中,皮肤、沙子与海水的色彩特征都 不同,结构特征也不一样。然后根据每一影像单元的色彩特征与结构特征定义 出每一影像单元的标的类别。例如根据色彩特征与结构特征会将包含皮肤的 影像单元判定为代表皮肤的标的类别、将包含沙子的影像单元判定为代表沙子 的标的类别,而将包含海水的影像单元判定为代表海水的标的类别。最后分析 与统计影像所包含的每一影像单元所对应的标的类别,如皮肤、沙子与海水的 数量与配置情形,而辨识影像场景是海滩上的人物照,进而影像获取器如相机 的场景模式将自动设定为海滩人物照模式。
请参照图3,为在根据本发明的影像场景辨识方法中, 一实施例的类神经
网络数据库的学习模型的示意图。
如图3所示, 一开始先将多个标的类别300,如天空、皮肤、水与沙等, 个别抽取出色彩特征120与结构特征130等资料。然后,将每一个标的类别 300的色彩特征120与结构特征130的资料输入到类神经网络250以供学习之 用。最后类神经网络250通过学习过程而建立一数据库200,即类神经网络数 据库,以供于场景辨识过程中比对出各影像单元的标的类别300。
类神经网络250是一种模仿人类神经系统且具有学习能力的运算结构,由 许多运算单元之间众多连结所组成,运算单元是以平行且分散的方式运作,可 以同时处理大量的数据。
请参照图4,为在根据本发明的影像场景辨识方法中, 一实施例的类神经
网络数据库建立流程图。
如图4所示,步骤60,可提供大量的标的类别300供类神经网络250,步
骤70,让类神经网络250学习并建立数据库200,以供辨识各标的类别犯0。 再者,此类神经网络250也可内建于前述实施例的影像场景辨识模型中。 请参照图5,为在根据本发明的影像场景辨识方法中, 一实施例的类神经
6网络数据库更新流程图。
如图5所示,步骤80,使用者可将取得的至少一标准标的类别300提供 给类神经网络250,步骤90,类神经网络250进而学习并更新数据库200中所 储存的标的类别300与色彩特征120和结构特征130的对应关系。
综上所述,通过本发明的技术手段,可达到自动辨识影像场景,以增加数 字摄影的便利性以及提高拍摄影像的品质。简言之,使用者在使用应用本发明 的数字影像获取器进行拍摄时不必手动选用场景模式,可由数字影像获取器根 据本发明的影像场景辨识方法而自动辨识并选定较佳场景模式。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情 况下,熟悉本领域的技术人员可根据本发明做出各种相应的改变和变形,但这 些相应的改变和变形都应属于本发明权利要求的保护范围。
权利要求
1、一种影像场景辨识方法,其特征在于,该步骤包括检测一影像;分割该影像以得到多个影像单元;取得每一该影像单元的一色彩特征与一结构特征;根据每一该影像单元的该色彩特征与该结构特征定义出每一该影像单元的一标的类别;以及分析该影像所包含的每一该影像单元的该标的类别以选定相应该影像的一场景模式。
2、 根据权利要求1所述的影像场景辨识方法,其特征在于,该定义该标 的类别的步骤包括利用一数据库比较及定义出每一该影像单元的该标的类 别。
3、 根据权利要求2所述的影像场景辨识方法,其特征在于,还包括利用一类神经网络建立该数据库。
4、 根据权利要求3所述的影像场景辨识方法,其特征在于,建立该数据 库的步骤,包括提供大量的标准的该标的类别给该类神经网络;以及 通过该类神经网络学习提供的该标准的该标的类别而建立该数据库。
5、 根据权利要求1所述的影像场景辨识方法,其特征在于,选定相应该 影像的该场景模式的步骤,包括通过分析与统计所有该影像单元所属的该标的类别的数量与配置情形而选定该场景模式。
6、 根据权利要求3所述的影像场景辨识方法,其特征在于,还包括提供至少一标准的该标的类别给该类神经网络;以及通过该类神经网络学习提供的该标准的该标的类别而更新该数据库的内容。
全文摘要
本发明涉及一种影像场景辨识方法,该步骤包括检测一影像;分割该影像以得到多个影像单元;取得每一该影像单元的色彩特征与结构特征;根据每一该影像单元的该色彩特征与该结构特征定义出每一该影像单元的标的类别;以及分析该影像所包含的每一该影像单元的该标的类别以选定相应该影像的场景模式。通过本发明,可达到自动辨识影像场景,进而增加数字摄影的便利性以及提高拍摄影像的品质,使用者不必手动选用场景模式,可由数字影像获取器自动辨识并选定场景模式。
文档编号H04N5/232GK101489044SQ200810002369
公开日2009年7月22日 申请日期2008年1月15日 优先权日2008年1月15日
发明者林升甫, 陈皇村 申请人:华晶科技股份有限公司