声音处理装置、声音处理系统及声音处理方法_6

文档序号:9713989阅读:来源:国知局
分检测预定声音;及处理部,在通过上述声音检测部检测到上述预定声音的情况下,进行预定处理。
[0249]根据该结构,声音处理装置伴随着预定声音的检测而实施各种动作,因此能够促进收音到的声音数据及拍摄到的图像数据的有效利用,能够提高监视者的便利性。
[0250]而且,本发明的一方式的声音处理系统可以构成为,上述数据取得部从上述收音装置取得上述声音数据,从上述拍摄装置取得上述图像数据,上述声音处理装置具备记录部,该记录部记录上述声音数据、上述图像数据及用于检索包括上述预定声音的声音数据的检索用标志。
[0251]根据该结构,例如,根据实时的声音数据或图像数据,能够清晰地听取到监视区域的声音。因此,能够提高实时的监视精度。而且,例如,将实时的声音数据或图像数据与检索用标志一起记录,由此,将来能够容易地检索所希望的声音数据或图像数据,能够缩短验证时间。
[0252]而且,本发明的一方式的声音处理系统可以构成为,具备记录数据的记录装置,上述记录装置具备记录部,该记录部将由上述收音部收音到的声音数据与由上述拍摄部拍摄到的图像数据建立对应地记录,并记录用于检索包括上述预定声音的声音数据的检索用标志,上述数据取得部从上述记录部取得上述声音数据、上述图像数据及上述检索用标志。
[0253]根据该结构,能够清晰地听取过去的图像的监视区域的声音。因此,例如,能够提高使用了过去的图像的监视区域的声音解析的精度。而且,通过对记录的声音数据或图像数据附加检索用标志,将来能够使所希望的声音数据或图像数据的检索容易。而且,在已经记录检索用标志的情况下,能够使用检索用标志,容易地检索所希望的声音数据或图像数据。
[0254]而且,本发明的一方式的声音处理方法是声音处理装置的声音处理方法,该声音处理方法包括以下步骤:取得由包括多个麦克风的收音部从预定区域内的声源收音到的声音数据及由拍摄上述预定区域内的至少一部分的图像的拍摄部拍摄到的图像数据;指定与基于上述图像数据而显示的图像上的指定部位对应的以上述收音部为基准的方向;指定与基于上述图像数据而显示的图像上的指定部位对应的上述预定区域内的预定范围;及在所指定的上述预定范围内,增强所指定的上述方向的上述声音数据的声音成分。
[0255]根据该方法,监视者在指定监视区域的方向及大小的范围且在与监视区域对应的方向及大小的范围内形成了指向性的状态下,能够监视异常的有无。由此,能够促进收音到的声音数据及图像数据的有效利用,提高监视者的便利性。
[0256]工业实用性
[0257]本发明对于能够促进声音数据及图像数据的有效利用并提高便利性的声音处理装置、声音处理系统及声音处理方法等是有用的。
[0258]附图标记说明
[0259]10阵列麦克风
[0260]11A、11B、11C 麦克风
[0261]12A、12B、12C 放大器
[0262]13A、13B、13C A/D 转换器
[0263]14A、14B、14C 声音编码器
[0264]15网络处理部
[0265]20相机
[0266]21透镜
[0267]22传感器
[0268]23图像编码器
[0269]24网络处理部
[0270]30、30B监视控制装置
[0271]31网络处理部
[0272]32图像译码器
[0273]33图像输出部
[0274]34图像识别部
[0275]35收音坐标指定部
[0276]36声音译码器
[0277]37指向性处理部
[0278]38收音角度运算部
[0279]39检测部
[0280]40声源推定部
[0281]42声音输出部
[0282]43数据记录部
[0283]44范围指定部
[0284]45范围角度运算部
[0285]50网络
[0286]60操作者
[0287]61监视器
[0288]62触摸面板
[0289]63扬声器
[0290]70记录器
[0291]71网络处理部
[0292]72数据记录部
[0293]80声源
[0294]90收音单元
[0295]91单元框体
[0296]100、10B监视系统
[0297]101顶棚面
[0298]102地板面
[0299]121框体入射面
[0300]PA声源
[0301 ]P11、P12、P13人物
[0302]Al收音范围
[0303]Θ1收音角度
[0304]02、02a、02b范围角度
【主权项】
1.一种声音处理装置,具备: 数据取得部,取得由包括多个麦克风的收音部从预定区域内的声源收音到的声音数据及由拍摄所述预定区域内的至少一部分的图像的拍摄部拍摄到的图像数据; 第一指定部,指定与基于所述图像数据而显示的图像上的指定部位对应的以所述收音部为基准的方向; 第二指定部,指定与基于所述图像数据而显示的图像上的指定部位对应的所述预定区域内的预定范围;及 指向性处理部,在所指定的所述预定范围内,增强所指定的所述方向的所述声音数据中的声音成分。2.根据权利要求1所述的声音处理装置,其中, 所述声音处理装置还具备: 声音检测部,根据由所述指向性处理部增强后的所述方向及所述范围的声音成分检测预定声音;及 处理部,在通过所述声音检测部检测到所述预定声音的情况下,进行预定处理。3.根据权利要求2所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部将检索用标志记录于记录部,所述检索用标志用于从记录所述声音数据及所述图像数据的所述记录部检索包括所述预定声音的声音数据或包括所述预定声音的声源的图像数据。4.根据权利要求3所述的声音处理装置,其中, 所述处理部取得与记录于所述记录部的检索用标志所包含的预定检索用标志对应的记录于所述记录部的声音数据或图像数据。5.根据权利要求3或4所述的声音处理装置,其中, 所述检索用标志包括所述预定声音的类别、以所述收音部为基准的所述预定声音的声源的方向、包括以所述收音部为基准的所述预定声音的声源的所述范围的大小及通过所述声音检测部检测到所述预定声音的时刻中的至少一个信息。6.根据权利要求2?5中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部使提示部提示包括检测到所述预定声音的内容的警告信息。7.根据权利要求2?6中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部将包括所述预定声音的声音数据记录于记录部。8.根据权利要求2?7中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部对通过所述指向性处理部增强声音成分的方向及所述范围的大小中的至少一方进行变更。9.根据权利要求2?8中任一项所述的声音处理装置,其中, 所述声音处理装置还具备推定部,所述推定部推定发出所述预定声音的声源的位置,并使提示部提示推定出的位置的信息。10.根据权利要求2?9中任一项所述的声音处理装置,其中, 所述声音处理装置还具备推定发出所述预定声音的声源的位置的推定部, 所述指向性处理部增强从由所述推定部推定出的所述声源的位置的方向到来的声音成分。11.根据权利要求2?10中任一项所述的声音处理装置,其中, 在由所述指向性处理部增强后的声音成分的信号等级为第一预定信号等级以上或第二预定信号等级以下的情况下,所述声音检测部检测该声音成分作为所述预定声音。12.根据权利要求2?11中任一项所述的声音处理装置,其中, 所述声音检测部根据由所述指向性处理部增强后的声音成分中的至少一个声音成分检测预定关键字作为所述预定声音。13.根据权利要求12所述的声音处理装置,其中, 所述处理部对包括检测到的所述预定关键字的声音数据中的所述预定关键字的部分进行加工。14.根据权利要求12所述的声音处理装置,其中, 所述处理部将包括检测到的所述预定关键字的声音数据记录于记录部。15.根据权利要求2?10中任一项所述的声音处理装置,其中, 所述声音检测部检测由所述指向性处理部增强后的声音成分中的至少一个声音成分所包含的预定异常音作为所述预定声音。16.根据权利要求2?5中任一项所述的声音处理装置,其中, 所述声音处理装置具备对所述图像数据进行图像识别的图像识别部, 所述处理部根据所述图像识别部的图像识别结果来进行所述预定处理。17.根据权利要求16所述的声音处理装置,其中, 所述图像识别部在所述图像数据中识别所述预定声音的声源的类别。18.根据权利要求16或17所述的声音处理装置,其中, 所述图像识别部在所述图像数据中识别所述预定声音的声源的移动的有无。19.根据权利要求16?18中任一项所述的声音处理装置,其中, 在通过所述图像识别部对所述图像数据进行了图像识别的情况下,所述处理部将检索用标志记录于记录部,所述检索用标志用于从记录所述声音数据及所述图像数据的所述记录部检索包括所述预定声音的声音数据或包括所述预定声音的声源的图像数据。20.根据权利要求19所述的声音处理装置,其中, 所述处理部使用记录于所述记录部的检索用标志所包含的预定检索用标志,与所述预定检索用标志对应地取得记录于所述记录部的声音数据或图像数据。21.根据权利要求19或20所述的声音处理装置,其中, 所述检索用标志包括所述声源的类别、所述声源的移动的有无及包括所述声源的缩略图像中的至少一个。22.根据权利要求16?21中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部根据所述图像识别部的图像识别结果,使提示部提示包括检测到所述预定声音的内容的警告信息。23.根据权利要求16?22中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部根据所述图像识别部的图像识别结果,将包括所述预定声音的声音数据记录于记录部。24.根据权利要求16?23中任一项所述的声音处理装置,其中, 在检测到所述预定声音的情况下,所述处理部根据所述图像识别部的图像识别结果,对通过所述指向性处理部增强声音成分的方向及范围中的至少一方进行变更。25.—种声音处理系统,具备: 收音装置,包括使用多个麦克风从预定区域内的声源对声音数据进行收音的收音部; 拍摄装置,包括拍摄所述预定区域内的至少一部分的图像的拍摄部;及 声音处理装置,对由所述收音部收音到的声音数据进行处理, 所述声音处理装置具备: 数据取得部,取得由所述收音部收音到的声音数据及由所述拍摄部拍摄到的图像数据; 第一指定部,指定与基于所述图像数据而显示的图像上的指定部位对应的以所述收音部为基准的方向; 第二指定部,指定与基于所述图像数据而显示的图像上的指定部位对应的所述预定区域内的预定范围;及 指向性处理部,在所指定的所述预定范围内,增强所指定的所述方向的声音数据中的声音成分。26.根据权利要求25所述的声音处理系统,其中, 所述声音处理装置还具备: 声音检测部,根据由所述指向性处理部增强后的所述方向及所述范围的声音成分检测预定声音;及 处理部,在通过所述声音检测部检测到所述预定声音的情况下,进行预定处理。27.根据权利要求26所述的声音处理系统,其中, 所述数据取得部从所述收音装置取得所述声音数据,从所述拍摄装置取得所述图像数据, 所述声音处理装置具备记录部,所述记录部记录所述声音数据、所述图像数据及用于检索包括所述预定声音的声音数据的检索用标志。28.根据权利要求26所述的声音处理系统,其中, 所述声音处理系统还具备记录数据的记录装置, 所述记录装置具备记录部,所述记录部将由所述收音部收音到的声音数据与由所述拍摄部拍摄到的图像数据建立对应地记录,并记录用于检索包括所述预定声音的声音数据的检索用标志, 所述数据取得部从所述记录部取得所述声音数据、所述图像数据及所述检索用标志。29.—种声音处理方法,是声音处理装置的声音处理方法,所述声音处理方法包括以下步骤: 取得由包括多个麦克风的收音部从预定区域内的声源收音到的声音数据及由拍摄所述预定区域内的至少一部分的图像的拍摄部拍摄到的图像数据; 指定与基于所述图像数据而显示的图像上的指定部位对应的以所述收音部为基准的方向; 指定与基于所述图像数据而显示的图像上的指定部位对应的所述预定区域内的预定范围;及 在所指定的所述预定范围内,增强所指定的所述方向的所述声音数据中的声音成分。
【专利摘要】提供一种能够促进声音数据及图像数据的有效利用并提高便利性的声音处理装置。具备:数据取得部,取得由包括多个麦克风的收音部从预定区域内的声源收音到的声音数据及由拍摄上述预定区域内的至少一部分的图像的拍摄部拍摄到的图像数据;第一指定部,指定与基于上述图像数据而显示的图像上的指定部位对应的以上述收音部为基准的方向;第二指定部,指定与基于上述图像数据而显示的图像上的指定部位对应的上述预定区域内的预定范围;及指向性处理部,在所指定的上述预定范围内,增强所指定的上述方向的上述声音数据中的声音成分。
【IPC分类】H04R1/40, G10L25/51, H04R3/00, G10L21/0272, H04N7/18
【公开号】CN105474666
【申请号】CN201480044955
【发明人】岸本伦典, 渡边泰章, 高桑诚, 中村学, 首藤秀树, 田村健二, 山崎龙次, 齐藤宽夫, 秋山明宽
【申请人】松下知识产权经营株式会社
【公开日】2016年4月6日
【申请日】2014年4月25日
【公告号】WO2015162645A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1