专利名称:一种通过特定语音触发的法庭庭审视频实时标引方法
技术领域:
本发明属于视频处理技术领域,具体涉及一种通过特定语音触发的法庭庭审视频 实时标引方法。
背景技术:
法院的法庭审理过程需要进行现场录像,庭审现场录像对于提高庭审效率和案件 审理质量是非常重要的。法庭的审理要求全面、真实、客观、公正,如果有音像资料作以佐证 的话就更能直观、有效的印证案件审理的真实过程,从而为后续的监督检查以及庭审资料 调用提供方便。而且,影像资料的保存作为一种真实历史的记录,可以为未来法庭庭审工作 的发展提供借鉴和参考。法庭的庭审过程一般都比较长,短则2 3个小时,长的可以花费半天甚至一天的 时间,而庭审的现场录像是一个连续的过程,将最终形成一段时间很长的录像视频。随着数 字化技术的发展,传统的录像带形式的录制方式已经逐渐被数字化录像方式所取代,数字 摄像机将整个录制的现场过程形成一个视频文件,将视频文件存储在存储器中,以备后续调看。法庭的审理都存在着一套比较规范的程序,我国的法庭审理过程一般包括如下步 骤宣布开庭一核实当事人身份并告知权利义务一法庭调查一举证质证一法庭辩论一法庭 调解一宣判一闭庭。在进行庭审视频的观看过程中,如果希望针对其中的某个环节进行观 看,在视频文件通过视频播放软件播放时,可以通过改变播放进度的形式来选择相应的视 频片段,这是目前所有播放软件都支持的功能。但是,这种改变播放进度的形式一般只能以 时间作为参考依据,观看者首先要估计希望观看的片段在什么时间点,然后再根据时间点 进行查找,这样就会比较繁琐,特别是在视频文件比较长的情况下查找的效率相对较低。由于法庭审理有着较规范的程序,因此,目前有一种做法是在庭审过程录制完成 后,由工作人员再从头至尾浏览一遍整个视频文件,并对庭审的每一个步骤加入视频标引, 从而为后续的观看提供方便。但这种方式不仅增加了工作人员的劳动强度,而且,耗时较 长,工作效率比较低下。
发明内容
本发明的目的在于针对现有技术的缺陷,提供一种通过特定语音触发的法庭庭审 视频实时标引方法,按庭审环节将长时间的庭审录像视频进行实时标引,以方便后续视频 调看时视频片段的快速定位。本发明的技术方案如下一种通过特定语音触发的法庭庭审视频实时标引方法,包括如下步骤(1)根据法庭庭审的规定环节,确定每个环节开始时法官的标准语句;(2)在法庭现场视频的录制过程中,实时的捕捉法官所发出的语音信息;(3)语音识别装置识别法官的语音信息,当与每个环节开始时法官的标准语句相符时,输出语音识别结果信息;(4)通过语音识别结果信息触发标引操作,对视频文件的对应视频帧进行标引关联。进一步,如上所述的通过特定语音触发的法庭庭审视频实时标引方法,在步骤(2) 中使用数字化摄像装置对整个庭审过程进行不间断的连续拍摄,形成视频文件,并将文件 实时发送存储在视频服务器的存储器中。进一步,如上所述的通过特定语音触发的法庭庭审视频实时标引方法,在步骤(3) 中,先将法官的语音信息由模拟信号转换为数字信号,然后进行特定语音信息的识别。进一步,如上所述的通过特定语音触发的法庭庭审视频实时 标引方法,在步骤(4) 中,首先对语音识别装置的语音识别结果信息进行重复性检测,通过检测的语音识别结果 信息用于触发标引操作。进一步,如上所述的通过特定语音触发的法庭庭审视频实时标引方法,步骤(4) 中标引关联的具体方法为,建立一个XML文件,XML文件的内容节点以庭审的规定环节名称 命名,当语音识别结果信息触发标引操作时,将当前视频帧与XML文件的当前节点内容相 对应,实现标引关联。进一步,如上所述的通过特定语音触发的法庭庭审视频实时标引方法,其中,在视 频录制结束后,将起标引作用的XML文件与视频文件整体打包。本发明的有益效果如下本发明通过对法官说出的特定语句进行语音识别,从而 了解法庭审理的进程,确定每一个规定环节的开始时刻,通过信号触发实时标引的方式对 庭审录像进行实时标引,最终形成一个带有庭审环节标签的视频文件。通过在视频播放器 上设计一个简单的插件,用于读取标引信息,就可以将庭审的环节标签显示在播放器的进 度栏,从而为庭审录像的后续观看定位提供了极大的方便。本发明原理简单,易于实现,非 常有助于庭审视频录像的处理,并能够减轻工作人员劳动强度,提高视频文件的处理效率。
图1为本发明的方法流程图;图2为语音识别的流程图;图3为实时标引方式的原理图。
具体实施例方式下面结合附图和具体实施例对本发明进行详细的描述。本发明所提供的通过特定语音触发的法庭庭审视频实时标引方法,用于庭审录像 现场当中,其主要功能是对法庭庭审的数字化录像视频进行实时的环节标引,以便于后续 视频观看中的快速定位,该方法的流程如图1所示,包括如下步骤(1)根据法庭庭审的规定环节,确定每个环节开始时法官的标准语句,例如,开庭 时法官宣读“现在开庭”,法庭辩论环节开始时法官宣读“现在进行法庭辩论”;(2)在法庭现场视频的录制过程中,实时的捕捉法官所发出的语音信息,本发明使 用数字化摄像装置对整个庭审过程进行不间断的连续拍摄,形成视频文件,并将文件实时 发送存储在视频服务器的存储器中;
(3)语音识别装置识别法官的语音信息并进行判断,当与每个环节开始时法官的 标准语句相符时,输出语音识别结果信息;(4)对语音识别装置的语音识别结果信息进行重复性检测,通过检测的语音识别 结果信息用于触发标引操作,对视频文件的对应视频帧进行标引关联。本发明的语音识别装置并不是对法官的所有话语都进行识别,而是只针对特定语 音信息进行识别。由于庭审一般都有着比较规范的程序,在每个程序开始的时候,规定法官 都要用标准语句进行宣读以表明现在进入相应程序,例如,开庭时法官宣读“现在开庭”,法 庭辩论环节开始时法官宣读“现在进行法庭辩论”。这样,语音识别装置可以预先设定好需 要识别的特定语音信息是什么,只有当捕捉到这些规定好的特定语音信息之后,才进行语 音信息的输出。结合以上特点,语音识别装置的语音识别流程如图2所示,首先通过语音接 收单元接收模拟语音信息,然后通过模数转换单元将模拟信号转换为数字信号,接下来由 特定语音信息识别单元判断语音信息是否为标准语句,如果是标准语句则通过语音信息输 出单元进行输出。另外,在具体的庭审过程中,由于某些不太规范的人为因素,特定语音信息识别单 元很可能会捕捉到多次同一特定语音信息,并将该信息进行了多次输出。因此,有必要对语 音识别装置输出的语音识别结果信息进行重复性检测,如果发现有重复的语音信号又一次 被输入时,将该信号截断,不发送给实时标引模块,这样就保证了在一次庭审录制过程中对 于一个规定环节只标引一次。实时标引过程根据检测合格的语音识别装置的识别结果触发标引操作,对视频文 件的对应视频帧进行标引关联。本发明中,将特定的语音信息作为标引的触发机制,视频服 务器中设置实时标引模块,并在实时标引模块中事先已经定义了需要标引的具体内容,即 每个庭审环节的名称,一种具体的实施方式是,在实时标引模块中设置一个XML文件,XML 即为可扩展的标记语言(eXtensibIeMarkup Language),是一套定义语义标记的规则,这些 标记可以将文档分成许多部件并对这些部件加以标识。如图3所示,本发明的XML文件的 内容节点以庭审的规定环节名称命名,当实时标引模块收到一个语音识别结果信号时,即 触发了相应的标引操作,系统便将视频文件中当前视频帧与XML文件的当前节点内容相对 应,实现标引关联。下一个语音识别结果信号来到时,再将这一时刻的视频帧与依次排列的 另一个节点内容相对应,实现下一个环节的标引关联。这一技术原理简单,对于本领域的技 术人员来说非常容易实现。针对上述标引方式,在视频服务器中,还设有一个视频文件打包模块,用于将起标 引作用的XML文件与数字化摄像装置生成的视频文件整体打包。这样,就形成了一个可以 实际被媒体播放器读取播放的完整的视频文件。对于视频播放器软件来说,应该针对上述标引关联专门设计一个播放插件,通过 该插件,可以将庭审的环节标签显示在播放器的进度栏,这样,在观看视频文件的时候,可 以非常直观的找到庭审的某个环节的视频片段,便于观看的迅速定位。例如,观看者希望看 一下法庭辩论环节的情况,就可以拖动进度栏游标,将之放于“法庭辩论”的标识处,播放软 件便可以迅速的根据该标引信息,找到对应的片段起点视频帧,从该视频帧开始播放,非常 方便实用。上述功能插件的设计对于本领域的技术人员来说是现有技术,此处不再进行过 多的描述。
本发明所述的方法并不限于具体实施方式
中所述的实施例, 本领域技术人员根据 本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。
权利要求
一种通过特定语音触发的法庭庭审录像视频实时标引方法,包括如下步骤(1)根据法庭庭审的规定环节,确定每个环节开始时法官的标准语句;(2)在法庭现场视频的录制过程中,实时的捕捉法官所发出的语音信息;(3)语音识别装置识别法官的语音信息,当与每个环节开始时法官的标准语句相符时,输出语音识别结果信息;(4)通过语音识别结果信息触发标引操作,对视频文件的对应视频帧进行标引关联。
2.如权利要求1所述的通过特定语音触发的法庭庭审录像视频实时标引方法,其特征 在于在步骤(2)中使用数字化摄像装置对整个庭审过程进行不间断的连续拍摄,形成视 频文件,并将文件实时发送存储在视频服务器的存储器中。
3.如权利要求1所述的通过特定语音触发的法庭庭审录像视频实时标引方法,其特征 在于在步骤(3)中,先将法官的语音信息由模拟信号转换为数字信号,然后进行特定语音 信息的识别。
4.如权利要求1所述的通过特定语音触发的法庭庭审录像视频实时标引方法,其特征 在于在步骤(4)中,首先对语音识别装置的语音识别结果信息进行重复性检测,通过检测 的语音识别结果信息用于触发标引操作。
5.如权利要求4所述的通过特定语音触发的法庭庭审录像视频实时标引方法,其特征 在于步骤⑷中标引关联的具体方法为,建立一个XML文件,XML文件的内容节点以庭审 的规定环节名称命名,当语音识别结果信息触发标引操作时,将当前视频帧与XML文件的 当前节点内容相对应,实现标引关联。
6.如权利要求5所述的通过特定语音触发的法庭庭审录像视频实时标引方法,其特征 在于在视频录制结束后,将起标引作用的XML文件与视频文件整体打包。
全文摘要
本发明属于视频处理技术领域,具体涉及一种通过特定语音触发的法庭庭审视频实时标引方法。该方法根据法庭庭审的规定环节,确定每个环节开始时法官的标准语句;在法庭现场视频的录制过程中,实时的捕捉法官所发出的语音信息;语音识别装置识别法官的语音信息,当与每个环节开始时法官的标准语句相符时,输出语音识别结果信息;通过语音识别结果信息触发标引操作,对视频文件的对应视频帧进行标引关联。本发明按庭审环节将长时间的庭审录像视频进行实时标引,以方便后续视频调看时视频片段的快速定位,并且能够减轻工作人员劳动强度,提高视频文件的处理效率。
文档编号G11B27/32GK101833977SQ200910079820
公开日2010年9月15日 申请日期2009年3月12日 优先权日2009年3月12日
发明者商文彬, 羊文广, 羊美华, 黄琼 申请人:新奥特硅谷视频技术有限责任公司