音视频文件转录方法、装置及存储介质、服务器与流程

文档序号:16318026发布日期:2018-12-19 05:33阅读:257来源:国知局
音视频文件转录方法、装置及存储介质、服务器与流程

本发明涉及数据处理领域,具体涉及一种音视频文件转录方法、装置及存储介质、服务器。

背景技术

随着多媒体及互联网技术的发展,越来越多的原先的需要现场完成的业务可以转由线上完成,例如,办理需要对人物进行身份识别的业务时,原本需要用户到现场通过现场的终端实现音视频录制、身份识别,目前该些业务已可转移到线上完成,而该些录制的音视频需要保存作为后续用户资料使用。目前在线上执行业务需要进行音视频录制时,通过分光器将接收到的音视频流传输到转录服务器上,在转录服务器上实时对所述音视频流进行解析、转成可读的音视频格式,这种转录方式对服务器配置要求较高,并且对音视频的转录速度随着接收到的音视频流的流量增加而降低,同时也会存在网卡流量堵塞的问题。



技术实现要素:

为克服以上技术问题,特别是现有技术无法高效地对接收到的音视频流进行筛选、转录的问题,特提出以下技术方案:

第一方面,本发明提供了一种音视频文件转录方法,包括:

接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中;

解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;

分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。

进一步的,所述解析所述第一临时文件之前,还包括:

当所述第一临时文件的数量大于第一峰值时,将后续的处理步骤分配到第一地理范围内的服务器上执行;

当所述第一临时文件的数量大于第二峰值时,将后续的处理步骤分配到第二地理范围内的服务器上执行。

进一步的,所述根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,还包括:

统计所述持久化文件的正确率,根据所述正确率修改所述包含ip端口及分机规则的预设条件。

进一步的,所述根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,还包括:

将所述第二临时文件移除。

第二方面,本发明提供一种音视频文件转录装置,包括:

接收模块:用于接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中;

解析模块:用于解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;

转录模块:用于分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。

进一步的,所述装置还包括:

分发模块:用于在解析模块解析所述第一临时文件之前,执行当所述第一临时文件的数量大于第一峰值时,将后续的处理步骤分配到第一地理范围内的服务器上执行;当所述第一临时文件的数量大于第二峰值时,将后续的处理步骤分配到第二地理范围内的服务器上执行。

进一步的,所述装置还包括:

统计模块:用于在转录模块执行根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,统计所述持久化文件的正确率,根据所述正确率修改所述包含ip端口及分机规则的预设条件。

进一步的,所述装置还包括:

移除模块:用于在转录模块执行根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,将所述第二临时文件移除。

第三方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的音视频文件转录方法。

第四方面,本发明还提供了一种服务器,所述服务器包括一个或多个处理器、存储器、一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的音视频文件转录方法。

本发明与现有技术相比,具有以下有益效果:

本发明提供了一种音视频文件转录方法,通过分块化、异步化地处理接收到的视频呼叫中心产生的第一网络包,然后将所述第一网络包写如到第一临时文件中,再对所述第一网络包进行分离筛选,筛选出业务使用产生的音视频网络包,然后将该些音视频网络包转录为持久化文件,每个步骤都可以是基于多任务、多线程并发实现,避免单一步骤处理效率瓶颈而引起整体的音视频转录效率下降,其中解析第一临时文件和转录第二临时文件的功能可以实现分布式、异步处理,不再受接收第一网络包的网络流的时效限制,从而降低服务器负荷,提高转录效率。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明音视频文件转录方法的一实施例流程示意图;

图2为本发明音视频文件转录方法的另一实施例流程示意图;

图3为本发明音视频文件转录装置的一实施例示意图;

图4为本发明服务器的一实施例结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本领域技术人员应当理解,本发明所称的“应用”、“应用程序”、“计算机程序”以及类似表述的概念,是业内技术人员所公知的相同概念,是指由一系列计算机指令及相关数据资源有机构造的适于电子运行的计算机软件。除非特别指定,这种命名本身不受编程语言种类、级别,也不受其赖以运行的操作系统或平台所限制。理所当然地,此类概念也不受任何形式的终端所限制。

本发明实施例提供一种音视频文件转录方法,如图1所示,所述方法包括以下步骤:

s10:接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中。

视频呼叫中心通过提供视频服务供业务部门完成远程视频业务办理,如完成面签、核身等业务,在视频呼叫中心工作的过程中会产生第一网络包,所述第一网络包可以是视频呼叫中心所录制的语音及视频资料产生的第一网络包,或者是视频呼叫中心运行时所产生与音视频业务无关的第一网络包,为了避免信息的遗漏,最大可能地保存有用的信息,本实施例中,基于视频呼叫中心的音视频文件转录系统中的第一进程接收视频呼叫中心产生的所有第一网络包,然后对所述第一网络包都进行存储,按照预定顺序将所述第一网络包写入到第一临时文件中,例如按照第一网络包产生的时间顺序将所述第一网络包写入到第一临时文件中。

s20:解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件。

在将视频呼叫中心所产生的第一网络包生成第一临时文件后,为了筛选出其中视频呼叫中心完成视频业务办理所产生的网络包,本实施例中,基于视频呼叫中心的音视频文件转录系统中的第二进程解析所述第一临时文件,便能获取所述第一临时文件中的第一网络包,然后对所述第一网络包进行解包后对所述第一网络包进行筛选,具体的,根据包含ip端口及分机规则的预设条件对第一网络包进行筛选,从所述第一网络包中筛选出可解析为视频或音频的第二网络包,视频呼叫中心提供了摄像头及电话的接入接口,视频呼叫中心提供通过摄像头拍摄进行视频业务办理,例如用户通过手机连接到视频呼叫中心,通过摄像头拍摄视频图像进行身份核实,此时用户手机通过特定的ip端口与视频呼叫中心连接后将视频图像发送至视频呼叫中心,视频呼叫中心即产生第一网络包;另外,视频呼叫中心提供通过电话进行业务办理,例如用户通过手机拨打电话进行业务办理,此时手机接入视频呼叫中心后将语音数据发送至视频呼叫中心,视频呼叫中心即产生第一网络包,通过包含ip端口的预设条件即可从所述第一网络包中筛选出可解析为视频的第二网络包,通过包含分机规则的预设条件即可从所述第一网络包中筛选出可解析为音频的第二网络包,然后将所述第二网络包对应的第一临时文件确定为第二临时文件,本实施例的一种实施方式,在解析所述第一临时文件时,通过对第一临时文件的副本进行解析,然后在确定第一临时文件为第二临时文件时,不再需要对解析得到的第一网络包重新打包;本实施例的另一种实施方式,在解析所述第一临时文件后,对第一网络包进行解包,然后筛选得到符合预设条件的第一网络包,再将所述符合条件的第一网络包重新打包封装成第二临时文件。

步骤s30:分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。

在确定了视频业务或语音业务所产生的网络包的第二临时文件后,本实施例中,基于视频呼叫中心的音视频文件转录系统中的第三进程对第二临时文件进行分析,分析出该临时文件的媒体格式,是语音文件还是视频文件,然后根据预设的媒体格式,如果是视频业务产生的第二临时文件,则将第二临时文件按照h.265或h.264转换成持久化的视频文件,如果是语音业务产生的第二临时文件,则将第二临时文件按照aac转换成持久化的音频文件,持久化文件即可永久保存在存储介质中,作为后续的证据链使用。

本实施例提供了一种音视频文件转录方法,通过分块化、异步化地处理接收到的视频呼叫中心产生的第一网络包,然后将所述第一网络包写如到第一临时文件中,再对所述第一网络包进行分离筛选,筛选出业务使用过程中产生的音视频网络包,然后将该些音视频网络包转录为持久化文件,每个步骤都可以是基于多任务、多线程并发实现,避免单一步骤处理效率瓶颈而引起整体的音视频转录效率下降,其中解析第一临时文件和转录第二临时文件的功能可以实现分布式、异步处理,不再受接收第一网络包的网络流的时效限制,从而降低服务器负荷,提高转录效率。

本发明的一种实施例,所述解析所述第一临时文件之前,还包括:

当所述第一临时文件的数量大于第一峰值时,将后续的处理步骤分配到第一地理范围内的服务器上执行;

当所述第一临时文件的数量大于第二峰值时,将后续的处理步骤分配到第二地理范围内的服务器上执行。

本发明实施例中,所述视频呼叫中心的音视频文件转录系统基于分布式的运行及管理,即所述视频呼叫中心的音视频文件转录系统运行于分布在多个区域的服务器上,优选的,再由一个中心服务器对该些分布式服务器进行统一管理,本实施例中,在解析所述第一临时文件之前,判断所述第一临时文件的数量是否达到预设峰值,若某一区域的所述第一临时文件的数量大于第一峰值时,该区域的服务器无法及时处理过于庞大的第一临时文件数量,此时将后续的处理步骤分配到第一地理范围内的服务器上执行,例如,当广州地区接受到的第一网络包然后写入到第一临时文件中后,发现广州地区的第一临时文件的数量大于第一峰值,此时将后续的处理步骤分配到广东地区内的服务器上执行,以降低广州地区服务器的负荷,同时多地区协同工作提高音视频文件的转录效率;进一步的,当所述第一临时文件的数量大于第二峰值时,将后续的处理步骤分配到第二地理范围内的服务器上执行,例如,当广州地区接受到的第一网络包然后写入到第一临时文件中后,发现广州地区的第一临时文件的数量大于第二峰值,此时将后续的处理步骤分配到华南地区内的服务器上执行,以降低广州及广东地区服务器的负荷,同时多地区协同工作提高音视频文件的转录效率。

本发明的一种实施例,如图2所示,所述根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,还包括:

s40:统计所述持久化文件的正确率,根据所述正确率修改所述包含ip端口及分机规则的预设条件。

在将第二临时文件转化为持久化文件后,统计所述持久化文件的正确率,具体的,统计所述持久化文件中的视频文件是否与视频业务对应,统计所述持久化文件中的音频文件是否与语音业务对应,例如,某一ip端口由于业务的更改已经不是被视频业务所使用,而根据ip端口的预设条件将第二临时文件转化为视频持久化文件后,该视频持久化文件无法打开、使用,此时该视频持久化文件为错误的持久化文件;同样的,若某一分机由于业务的更改已经不是被电话业务所使用,而根据分机规则的预设条件将第二临时文件转化为语音持久化文件后,该语音持久化文件与所需要保存的语音业务不相关,此时该语音持久化文件为错误的持久化文件,以此统计所述持久化文件的正确率,然后根据所述正确率修改所述包含ip端口及分机规则的预设条件,让需要保存的业务的音视频文件与所述预设条件更为匹配,避免对需要保存的业务的音视频文件遗漏,同时减少非需要保存的业务的文件。

本发明的一种实施例,所述根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,还包括:

s50:将所述第二临时文件移除。

在将第二临时文件转化为对应的媒体格式的持久化文件后,持久化文件已可以永久保存在存储介质中,此时为了节约服务器的存储资源,将已转化为持久化文件的第二临时文件移除,可以知道的是,该第二临时文件是从原来的第一临时文件中筛选出来的,此时亦是将所述第一临时文件移除,从而节约服务器的存储资源。

如图3所示,在另一种实施例中,本发明提供了一种音视频文件转录装置,包括:

接收模块10:用于接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中;

解析模块20:用于解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;

转录模块30:用于分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。

本实施例中,所述音视频文件转录装置包含接收模块10、解析模块20及转录模块30,三者可以异步执行所述功能,接收模块10将视频呼叫中心产生的第一网络包写入到第一临时文件后,解析模块20可以每间隔一定时间去获取所述第一临时文件,然后解析所述第一临时文件,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;同样的,解析模块20确定了第二临时文件后,转录模块30按照预定的时间间隔去获取、分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件,无需实时地将接受到的第一网络包进行解析、转录成持久化文件,通过异步处理的方式,让接收模块10、解析模块20、转录模块30各自完成应有的功能,相互合作又互不影响。

具体的,所述接收模块10接收视频呼叫中心产生的所有第一网络包,然后对所述第一网络包都进行存储,按照预定顺序将所述第一网络包写入到第一临时文件中;所述解析模块20解析所述第一临时文件,便能获取所述第一临时文件中的第一网络包,然后对上述第一网络包进行筛选,根据包含ip端口及分机规则的预设条件对第一网络包进行筛选,从所述第一网络包中筛选出可解析为视频或音频的第二网络包,通过包含ip端口的预设条件即可从所述第一网络包中筛选出可解析为视频的第二网络包,通过包含分机规则的预设条件即可从所述第一网络包中筛选出可解析为音频的第二网络包,然后将所述第二网络包对应的第一临时文件确定为第二临时文件;在解析模块20确定了视频业务或语音业务所产生的网络包的第二临时文件后,转录模块30对第二临时文件进行分析,分析出该临时文件的媒体格式,是语音文件还是视频文件,然后根据预设的媒体格式,如果是视频业务产生的第二临时文件,则将第二临时文件按照h.265或h.264转换成持久化的视频文件,如果是语音业务产生的第二临时文件,则将第二临时文件按照aac转换成持久化的音频文件,持久化文件即可永久保存在存储介质中,作为后续的证据链使用。

本发明的一种实施例,所述装置还包括:

分发模块:用于在解析模块20解析所述第一临时文件之前,执行当所述第一临时文件的数量大于第一峰值时,将后续的处理步骤分配到第一地理范围内的服务器上执行;当所述第一临时文件的数量大于第二峰值时,将后续的处理步骤分配到第二地理范围内的服务器上执行。

本发明的一种实施例,所述装置还包括:

统计模块40:用于在转录模块30执行根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,统计所述持久化文件的正确率,根据所述正确率修改所述包含ip端口及分机规则的预设条件。

本发明的一种实施例,所述装置还包括:

移除模块:用于在转录模块30执行根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件之后,将所述第二临时文件移除。

在另一种实施例中,本发明提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例所述的音视频文件转录方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、cd-rom、和磁光盘)、rom(read-onlymemory,只读存储器)、ram(randomaccessmemory,随即存储器)、eprom(erasableprogrammableread-onlymemory,可擦写可编程只读存储器)、eeprom(electricallyerasableprogrammableread-onlymemory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。

本发明实施例提供的一种计算机可读存储介质,可实现接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中;解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。通过提供一种音视频文件转录方法,通过分块化、异步化地处理接收到的视频呼叫中心产生的第一网络包,然后将所述第一网络包写如到第一临时文件中,再对所述第一网络包进行分离筛选,筛选出业务使用过程中产生的音视频网络包,然后将该些音视频网络包转录为持久化文件,每个步骤都可以是基于多任务、多线程并发实现,避免单一步骤处理效率瓶颈而引起整体的音视频转录效率下降,其中解析第一临时文件和转录第二临时文件的功能可以实现分布式、异步处理,不再受接收第一网络包的网络流的时效限制,从而降低服务器负荷,提高转录效率。

本发明实施例提供的计算机可读存储介质可以实现上述音视频文件转录方法的实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。

此外,在又一种实施例中,本发明还提供一种服务器,如图4所示,所述服务器包括处理器403、存储器405、输入单元407以及显示单元409等器件。本领域技术人员可以理解,图4示出的结构器件并不构成对所有服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器405可用于存储计算机程序401以及各功能模块,处理器403运行存储在存储器405的计算机程序401,从而执行设备的各种功能应用以及数据处理。存储器405可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、zip盘、u盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器405只作为例子而非作为限定。

输入单元407用于接收信号的输入及接收用户的输入,输入单元407可包括触控面板以及其它输入设备,触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元409可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元409可采用液晶显示器、有机发光二极管等形式。处理器403是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器403内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。在一种实施方式中,所述服务器包括一个或多个处理器403,以及一个或多个存储器405,一个或多个计算机程序401,其中所述一个或多个计算机程序401被存储在存储器405中并被配置为由所述一个或多个处理器103执行,所述一个或多个计算机程序401配置用于执行以上实施例所述的音视频文件转录方法。图4中所示的一个或多个处理器403能够执行、实现图3中所示的接收模块10、解析模块20、转录模块30、统计模块40的功能。

本发明实施例提供的一种服务器,可实现接收视频呼叫中心产生的第一网络包,将所述第一网络包按照预定顺序写入到第一临时文件中;解析所述第一临时文件,获取所述第一临时文件中的第一网络包,根据包含ip端口及分机规则的预设条件从所述第一网络包中筛选出可解析为视频或音频的第二网络包,将第二网络包对应的第一临时文件确定为第二临时文件;分析所述第二临时文件,根据预设的媒体格式将所述第二临时文件转换成对应的媒体格式的持久化文件。通过提供一种音视频文件转录方法,通过分块化、异步化地处理接收到的视频呼叫中心产生的第一网络包,然后将所述第一网络包写如到第一临时文件中,再对所述第一网络包进行分离筛选,筛选出业务使用过程中产生的音视频网络包,然后将该些音视频网络包转录为持久化文件,每个步骤都可以是基于多任务、多线程并发实现,避免单一步骤处理效率瓶颈而引起整体的音视频转录效率下降,其中解析第一临时文件和转录第二临时文件的功能可以实现分布式、异步处理,不再受接收第一网络包的网络流的时效限制,从而降低服务器负荷,提高转录效率。

本发明实施例提供的服务器可以实现上述提供的语音视频文件转录方法的实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1