处理音视频文件的方法、装置、计算设备及存储介质与流程

文档序号：28810628发布日期：2022-02-09 03:56阅读：59来源：国知局

1.本技术涉及视频处理技术领域，特别是涉及一种处理音视频文件的方法、装置、计算设备及存储介质。

背景技术：

2.在音视频剪辑场景中，可能会对较多数量的音视频素材进行剪辑以及合成处理。比如，在综艺节目录制场景中，通常采用多个机位进行多方位、多角度的拍摄，以避免单镜头时间过长而导致节目内容单调、产生视觉疲劳，从而基于多个机位上的多个拍摄装置可以拍摄得到多个音视频素材；相应的，数字成像技术人员(digital imaging technician，dit)需要将多个音视频素材添加至剪辑软件中，并基于该多个音视频素材剪辑得到一份包括音频的综艺视频。
3.通常情况下，在利用多个拍摄装置拍摄得到多个音视频素材的过程中，通常会在各个音视频素材中的音频数据添加时间码(time code，tc)信息，该时间码信息是指在拍摄得到图像信号的过程中针对每一幅图像记录的时间编码，以使得多个拍摄装置所拍摄得到的音视频素材能够基于统一的时间轴进行同步对齐，从而方便剪辑人员对该多个音视频素材进行剪辑。
4.但是，剪辑人员在对包括tc信息的音视频素材进行剪辑时，音视频素材中的音频可能会播放非预期的声音，如产生刺耳的噪音等，从而对剪辑人员产生干扰。

技术实现要素：

5.本技术实施例提供了一种处理音视频文件的方法、装置、计算设备及存储介质，旨在通过对音视频文件进行处理来降低后期音视频文件中的音频播放非预期的声音，从而尽可能避免对剪辑人员造成干扰。
6.第一方面，本技术实施例提供了一种处理音视频文件的方法，包括：
7.获取待处理的原始音视频文件；
8.校验所述原始音视频文件中的音频数据是否包括时间码信息；
9.当所述音频数据包括时间码信息时，将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件。
10.在一种可能的实施方式中，所述校验所述原始音视频文件中的音频数据是否包括时间码信息，包括：
11.对所述原始音视频文件进行解封装，获得音频数据；
12.对所述音频数据进行解码，得到脉冲编码调制pcm数据；
13.检测所述pcm数据中是否包括时间码信息。
14.在一种可能的实施方式中，所述检测所述pcm数据中是否包括时间码信息，包括：
15.以预设时长为单位，检测所述pcm数据中的目标数据是否包括时间码信息，所述目标数据为所述pcm数据中连续的一段数据，所述目标数据对应的播放时长为所述预设时长。
16.在一种可能的实施方式中，对所述原始音视频文件进行解封装后获得视频数据，所述将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件，包括：
17.将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音频数据；
18.基于所述目标音频数据以及所述视频数据，封装得到所述目标音视频文件。
19.在一种可能的实施方式中，所述预设值为0。
20.第二方面，本技术还提供了一种处理音视频文件的装置，所述装置包括：
21.获取模块，用于获取待处理的原始音视频文件；
22.校验模块，用于校验所述原始音视频文件中的音频数据是否包括时间码信息；
23.设置模块，用于当所述音频数据包括时间码信息时，将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件。
24.在一种可能的实施方式中，所述校验模块，包括：
25.解封装单元，用于对所述原始音视频文件进行解封装，获得音频数据；
26.解码单元，用于对所述音频数据进行解码，得到脉冲编码调制pcm数据；
27.检测单元，用于检测所述pcm数据中是否包括时间码信息。
28.在一种可能的实施方式中，所述检测单元，具体用于：
29.以预设时长为单位，检测所述pcm数据中的目标数据是否包括时间码信息，所述目标数据为所述pcm数据中连续的一段数据，所述目标数据对应的播放时长为所述预设时长。
30.在一种可能的实施方式中，对所述原始音视频文件进行解封装后获得视频数据，所述设置模块，包括：
31.设置单元，用于将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音频数据；
32.封装单元，用于基于所述目标音频数据以及所述视频数据，封装得到所述目标音视频文件。
33.在一种可能的实施方式中，所述预设值为0。
34.第三方面，本技术实施例还提供了一种计算设备，该计算设备可以包括处理器以及存储器：
35.所述存储器用于存储计算机程序；
36.所述处理器用于根据所述计算机程序执行上述第一方面以及第一方面中任一种实施方式所述的方法。
37.第四方面，本技术实施例还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述第一方面以及第一方面中任一种实施方式所述的方法。
38.在本技术实施例的上述实现方式中，计算设备获取待处理的原始音视频文件，并校验该原始音视频文件中的音频数据是否包括时间码信息；当确定该原始音视频文件中的音频数据包括时间码信息时，将该音视数据的值设置为预设值，从而得到目标音视频文件，该目标音视频文件中的音频数据的值即为预设值。这样，后续剪辑人员在对目标音视频文件进行剪辑处理时，由于目标音视频文件中的音频数据的值已经被设置为预设值，因此，该目标音视频文件中音频通常不会播放非预期的声音，而仅会播放该预设值对应的声音或者没有声音(此时预设值为0)，从而可以避免音视频文件中的音频因为时间码信息的存在而
播放非预期的声音，尽可能避免对剪辑人员造成干扰。
附图说明
39.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
40.图1为本技术实施例中一示例性应用场景示意图；
41.图2为本技术实施例中一种处理音视频文件的方法流程示意图；
42.图3为本技术实施例中一种处理音视频文件的装置结构示意图；
43.图4为本技术实施例中一种计算设备的硬件结构示意图。
具体实施方式
44.参见图1，为本技术实施例提供的一种应用场景示意图。在图1所示应用场景中，客户端101可以与计算设备102存在通信连接。并且，客户端101可以接收用户(如音视频的剪辑人员)提供的数据，并将数据发送给计算设备102；计算设备102用于对接收到的数据进行相应的处理，并将处理后的数据通过客户端101呈现给用户。
45.其中，计算设备102，是指具有数据处理能力的设备，例如可以是终端、服务器等。客户端101可以应用于独立于计算设备102的物理设备中。例如当计算设备102通过服务器实现时，客户端101可以运行于用户侧的用户终端等设备。或者，客户端101也可以运行于计算设备101上。
46.在基于客户端101以及计算设备102对多个音视频文件(由拍摄装置拍摄得到的音视频素材)进行剪辑时，如果音视频文件中包括时间码信息(用于多个音视频文件在时间维度上同步对齐)，则该时间码信息的存在会导致音视频文件中的音频产生噪声数据，从而导致音视频文件中的音频可能会播放非预期的声音，如产生刺耳的噪音等，对剪辑人员产生干扰。
47.基于此，本技术提供了一种处理音视频文件的方法，通过对音视频文件进行相应的处理来避免对剪辑人员产生干扰。具体实现时，客户端101可以接收剪辑人员提供的一个或者多个音视频文件，并将该音视频文件发送给计算设备102。针对每个音视频文件，计算设备102可以校验该原始音视频文件中的音频数据是否包括时间码信息，并且，当确定该原始音视频文件中的音频数据包括时间码信息时，将该音视数据的值设置为预设值，从而得到目标音视频文件，该目标音视频文件中的音频数据的值即为预设值。这样，后续剪辑人员在对目标音视频文件进行剪辑处理时，由于目标音视频文件中的音频数据的值已经被设置为预设值，因此，该目标音视频文件中音频通常不会播放非预期的声音，而仅会播放该预设值对应的声音或者没有声音(此时预设值为0)，从而可以避免音视频文件中的音频因为时间码信息的存在而播放非预期的声音，尽可能避免对剪辑人员造成干扰。
48.可以理解的是，图1所示的应用场景的架构仅是本技术实施例提供的一个示例，实际应用时，本技术实施例也可以应用于其它可适用的场景中，如剪辑人员可以直接向计算设备102提供一个或者多个音视频文件，如将存储有音视频文件的存储器插入该计算设备102等，以使得计算设备102可以通过访问存储器获得该音视频文件等。总之，本技术实施例
可以应用于任何可适用的数据备份系统中，而不局限于上述场景示例。
49.为使本技术的上述目的、特征和优点能够更加明显易懂，下面将结合附图对本技术实施例中的各种非限定性实施方式进行示例性说明。显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本技术保护的范围。
50.参阅图2，图2示出了本技术实施例中一种处理音视频文件的方法流程示意图，该方法可以应用于图1所示的应用场景中，或者可以应用于其它可适用的应用场景等。为便于说明与理解，下面应用于图1所示的应用场景为例进行说明。该方法具体可以包括：
51.s201：计算设备102获取待处理的原始音视频文件。
52.其中，原始音视频文件，是指包括音频内容以及视频内容的文件，例如可以通过带有麦克风的拍摄装置进行拍摄得到，其中，拍摄装置在拍摄得到的视频的过程中，可以由麦克风录入声音并得到相应的音频，并对该音频以及视频进行封装，得到音视频文件。为便于区分以及描述，以下称之为原始音视频文件。
53.作为一种实现示例，用户可以在客户端101上导入该原始音视频文件，并由客户端101将该原始音视频文件通过网络传输给计算设备102，以便计算设备102后续对该原始音视频文件进行相应的处理。
54.而在另一种实现示例中，用户可以将承载有原始音视频文件的存储器(如u盘等)插入计算设备102，从而计算设备102可以通过访问该存储器，获得待处理的原始音视频文件。
55.当然，实际应用时，计算设备102也可以是通过其它方式获取该原始音视频文件，本实施例对此并不进行限定。
56.s202：计算设备102校验原始音视频文件中的音频数据是否包括时间码信息。
57.实际应用场景中，可能存在多个拍摄装置针对同一场景进行拍摄，如在综艺录制场景中通常存在多个机位对同一舞台进行拍摄等，因此，各个拍摄装置通常会通过引入时间码信息来实现各个拍摄装置可以在同一时间点进行拍摄，以便于后续对多个音视频文件进行对齐和剪辑。但是与此同时，各个拍摄装置所拍摄得到的音视频文件中会因为存在时间码信息而导致音频中产生噪声数据，对剪辑人员产生干扰。
58.本实施例中，计算设备102针对获取到的原始音视频文件，可以校验该原始音视频文件中是否包括时间码信息，以便后续针对包含时间码信息的原始音视频文件进行相应的处理来降低对于剪辑人员的干扰。
59.在一种可能的实施方式中，计算设备102可以对原始音视频文件进行解封装，从原始音视频文件中分离得到音频数据以及视频数据。其中，若原始音视频文件中包括时间码信息，则该时间码信息集成于解封装所得到的音频数据中。然后，计算设备102可以对解封装所得到的音频数据进行解码，得到相应的脉冲编码调制(pulse code modulation，pcm)数据(包括多个pcm数据帧)，从而计算设备102可以检测该pcm数据中是否包括时间码信息。例如，计算设备102可以将该pcm数据写入时间码处理器中，并由时间码处理器检测出该pcm数据中是否包括时间码信息，并且当确定该pcm数据中包括时间码信息时，时间码处理器还可以给出该具体的时间码的值。
60.作为一种实现示例，计算设备102在检测时间码信息时，具体可以是以预设时长为
单位，检测该pcm数据中的目标数据是否包括时间码信息，其中，该目标数据为pcm数据中的任意连续数据(如连续的多帧数据等)，该目标数据的对应的播放时长为该预设时长。实际应用时，计算设备102可以将该pcm数据持续输入至时间码处理器中，并由时间码处理器进行检测。如果时间码处理器从当前输入的部分pcm数据中检测出时间码信息，则计算设备102可以确定所有的pcm数据均包括时间码信息。而如果时间码处理器从当前输入的部分pcm数据中未检测出时间码信息，则计算设备102可以判断已输入的部分pcm数据对应的播放时长是否达到预设时长，如果达到，则计算设备102可以确定该部分pcm数据并不包括时间码信息，并继续对剩余的pcm数据进行检测。而若播放时长未达到预设时长，则计算设备102对该部分pcm数据的检测准确性可能不够高，从而容易产生误判，因此，计算设备102可以继续将剩余的pcm数据持续输入至时间码处理器中，并由时间码处理器对当前已输入的pcm数据进行检测。当已输入的pcm数据对应的播放时长达到预设时长且时间码处理器仍然未检测到时间码信息时，计算设备102可以确定已输入的pcm数据中并不包括时间码信息。
61.其中，预设时长可以根据计算设备102对视频数据进行解码的速度进行确定。实际应用场景中，计算设备102在对原始音视频文件中的音频以及视频进行解码的同时，可以对已经解码的音频同步进行时间码信息的检测。由于计算设备102解码音频的速度通常比计算设备102解码视频的速度更快，因此，计算设备102可以在对当前所解码出的未处理的音频数据进行时间码信息的检测，以此等待计算设备102对视频进行解码。这样，当完成对于该部分音频数据的检测后，计算设备102针对视频的解码进度与针对音频的解码进度基本一致，从而可以实现针对音频以及视频的同步解码。相应的，可以根据计算设备102对于视频的解码速度来计算出预设时长的值，以实现计算设备102针对音频以及视频的同步解码.
62.s203：当音频数据包括时间码信息时，将原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件。
63.本实施例中，当通过时间码处理器检测出音频数据(也即pcm数据)中包括时间码信息时，计算设备102可以将该原始音视频文件中的音频数据的值设置为预设值，也即将音频数据对应的pcm数据中的值设置为预设值。具体实现时，计算设备102可以将pcm数据输入至相应的过滤器中，以便由该过滤器将pcm数据的值设置为预设值。同时，在确定音频数据中包括时间码信息后，计算设备102还可以控制时间码处理器停止工作。这样，所得到的目标音视频文件中，音频数据的值均为统一的值，从而后续剪辑人员在对目标音视频文件进行剪辑处理时，可以避免该目标音视频文件中的音频会播放非预期的异常声音，以此对剪辑人员产生干扰。
64.示例性地，预设值例如可以是0。或者，预设值也可以是其它可适用的值等，如为1等。这样，在播放目标音视频文件时，该目标音视频文件中的音频可以不播放声音，相当于音频处于静音状态(此时预设值为0)；或者，目标音视频文件中的音频所播放的声音处于剪辑人员的预期之内，如播放声音很小或者为持续稳定的声音等，而不会产生非预期的声音变化。
65.在一种可能的实施方式中，计算设备102在生成目标音视频文件的过程中，可以先将原始音视频文件中的音频数据的值设置为预设值，具体是将音视数据对应的pcm数据的值设置为预设值，并利用指定的编码器对处理后pcm数据进行编码。同时，计算设备102也可以对解码后的视频进行重新编码。然后，计算设备102可以将编码后得到的音频数据以及视
频数据进行打包封装，如基于mov格式对音频数据以及视频数据进行封装等，以此生成目标音视频文件。实际应用时，计算设备102也可以是基于其它格式封装得到目标音视频文件，如基于mp4格式、flv格式、ts格式等，本实施例对此并不进行限定。
66.进一步地，对于生成的目标音视频文件，计算设备102还可以将其写成相应的文件进行保存，以便于后续读取该目标音视频文件并基于用户的操作实现对该目标音视频文件的剪辑。
67.本实施例中，针对每个音视频文件，计算设备102可以校验该原始音视频文件中的音频数据是否包括时间码信息，并且，当确定该原始音视频文件中的音频数据包括时间码信息时，将该音视数据的值设置为预设值，从而得到目标音视频文件，该目标音视频文件中的音频数据的值即为预设值。这样，后续剪辑人员在对目标音视频文件进行剪辑处理时，由于目标音视频文件中的音频数据的值已经被设置为预设值，因此，该目标音视频文件中音频通常不会播放非预期的声音，而仅会播放该预设值对应的声音或者没有声音(此时预设值为0)，从而可以避免音视频文件中的音频因为时间码信息的存在而播放非预期的声音，尽可能避免对剪辑人员造成干扰。
68.此外，本技术实施例还提供了一种数据备份装置。参阅图3，图3示出了本技术实施例中一种数据备份装置的结构示意图，图3所示的数据备份装置300可以应用于计算设备，计算设备与源端存储设备连接，所述计算设备包括多个缓存队列，该数据备份装置300包括：
69.获取模块301，用于获取待处理的原始音视频文件；
70.校验模块302，用于校验所述原始音视频文件中的音频数据是否包括时间码信息；
71.设置模块303，用于当所述音频数据包括时间码信息时，将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件。
72.在一种可能的实施方式中，所述校验模块302，包括：
73.解封装单元，用于对所述原始音视频文件进行解封装，获得音频数据；
74.解码单元，用于对所述音频数据进行解码，得到脉冲编码调制pcm数据；
75.检测单元，用于检测所述pcm数据中是否包括时间码信息。
76.在一种可能的实施方式中，所述检测单元，具体用于：
77.以预设时长为单位，检测所述pcm数据中的目标数据是否包括时间码信息，所述目标数据为所述pcm数据中连续的一段数据，所述目标数据对应的播放时长为所述预设时长。
78.在一种可能的实施方式中，对所述原始音视频文件进行解封装后获得视频数据，所述设置模块303，包括：
79.设置单元，用于将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音频数据；
80.封装单元，用于基于所述目标音频数据以及所述视频数据，封装得到所述目标音视频文件。
81.在一种可能的实施方式中，所述预设值为0。
82.需要说明的是，上述装置各模块、单元之间的信息交互、执行过程等内容，由于与本技术实施例中方法实施例基于同一构思，其带来的技术效果与本技术实施例中方法实施例相同，具体内容可参见本技术实施例前述所示的方法实施例中的叙述，此处不再赘述。
83.此外，本技术实施例还提供了一种计算设备。参阅图4，图4示出了本技术实施例中一种计算设备的硬件结构示意图，该计算设备400可以包括处理器401以及存储器402。
84.其中，所述存储器402，用于存储计算机程序；
85.所述处理器401，用于根据所述计算机程序执行以下步骤：
86.获取待处理的原始音视频文件；
87.校验所述原始音视频文件中的音频数据是否包括时间码信息；
88.当所述音频数据包括时间码信息时，将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音视频文件。
89.在一种可能的实施方式中，所述处理器401，具体用于根据所述计算机程序执行以下步骤：
90.对所述原始音视频文件进行解封装，获得音频数据；
91.对所述音频数据进行解码，得到脉冲编码调制pcm数据；
92.检测所述pcm数据中是否包括时间码信息。
93.在一种可能的实施方式中，所述处理器401，具体用于根据所述计算机程序执行以下步骤：
94.以预设时长为单位，检测所述pcm数据中的目标数据是否包括时间码信息，所述目标数据为所述pcm数据中连续的一段数据，所述目标数据对应的播放时长为所述预设时长。
95.在一种可能的实施方式中，对所述原始音视频文件进行解封装后获得视频数据，所述处理器401，具体用于根据所述计算机程序执行以下步骤：
96.将所述原始音视频文件中的音频数据的值设置为预设值，得到目标音频数据；
97.基于所述目标音频数据以及所述视频数据，封装得到所述目标音视频文件。
98.在一种可能的实施方式中，所述预设值为0。
99.另外，本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述方法实施例中所述的处理音视频文件的方法。
100.通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解，本技术的技术方案可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如只读存储器(英文：read-only memory，rom)/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
101.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
102.以上所述仅是本技术示例性的实施方式，并非用于限定本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：项东涛
技术所有人：上海爱奇艺新媒体科技有限公司
我是此专利的发明人

上一篇：一种基于BIM模型管理的方法、装置及计算机可读存储介质与流程
上一篇：供电装置及气溶胶生成设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。