视频生成方法及装置、电子设备、存储介质与流程

文档序号：21002826发布日期：2020-06-05 22:51阅读：109来源：国知局

本公开涉及终端设备技术领域，具体而言，涉及一种视频生成方法、视频生成装置、电子设备以及计算机可读存储介质。

背景技术：

随着智能手机、平板电脑等移动终端设备的普及，越来越多的用户可以通过拍摄照片或视频来记录生活。并且，还可以对拍摄的视频、照片进行编辑，以生成效果更好的视频来分享给其他用户。然而，用户在生成视频时，需要反复播放预览，并进行一系列编辑操作，过程复杂，生成视频的效率较低。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

本公开的目的在于提供一种视频生成方法、视频生成装置、电子设备以及计算机可读存储介质，进而在一定程度上克服由于相关技术的限制和缺陷而导致的视频生成效率较低的问题。

根据本公开的第一方面，提供一种视频生成方法，包括：

获取多个目标媒体文件，确定所述多个目标媒体文件的媒体类别；

根据所述多个目标媒体文件的媒体类别，从所述多个目标媒体文件中选取多个待编辑媒体文件；

基于所述多个待编辑媒体文件，自动拼接生成视频文件。

根据本公开的第二方面，提供一种视频生成装置，包括：

媒体类别确定模块，用于获取多个目标媒体文件，确定所述多个目标媒体文件的媒体类别；

媒体文件选取模块，用于根据所述多个目标媒体文件的媒体类别，从所述多个目标媒体文件中选取多个待编辑媒体文件；

视频生成模块，用于基于所述多个待编辑媒体文件，自动拼接生成视频文件。

根据本公开的第三方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述视频生成方法。

根据本公开的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述视频生成方法。

本公开示例性实施例可以具有以下部分或全部有益效果：

在本公开的一示例实施方式所提供的视频生成方法中，可以根据目标媒体文件的媒体类型，从目标媒体文件选取多个待编辑媒体文件并自动拼接生成视频文件，用户可以不用编辑处理，因此可以提高视频生成的效率。另外，即使在生成的视频文件达不到用户的需求的情况下，用户也可以基于该视频文件稍做处理即可，从而可以降低处理成本，提高视频生成的效率以及所生成视频的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图；

图2示出了一种用于实现视频生成方法的计算机可读存储介质；

图3示出了本公开实施例中视频生成方法的一种流程图；

图4示出了本公开实施例中确定媒体文件对应的媒体类别的一种方法流程图；

图5示出了本公开实施例中视频生成装置的一种结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。

需要说明的是，图1示出的电子设备的计算机系统100仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图1所示，计算机系统100包括中央处理器101，其可以根据存储在只读存储器102中的程序或者从存储部分108加载到随机访问存储器103中的程序而执行各种适当的动作和处理。在随机访问存储器103中，还存储有系统操作所需的各种程序和数据。中央处理器101、只读存储器102以及随机访问存储器103通过总线104彼此相连。输入/输出接口105也连接至总线104。

以下部件连接至输入/输出接口105：包括键盘、鼠标等的输入部分106；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分107；包括硬盘等的存储部分108；以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分109。通信部分109经由诸如因特网的网络执行通信处理。驱动器110也根据需要连接至输入/输出接口105。可拆卸介质111，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器110上，以便于从其上读出的计算机程序根据需要被安装入存储部分108。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分109从网络上被下载和安装，和/或从可拆卸介质111被安装。在该计算机程序被中央处理器101执行时，执行本申请的方法和装置中限定的各种功能。

需要说明的是，本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器、只读存储器、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质，该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、射频等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。参考图2所示，上述计算机可读存储介质承载有一个或者多个计算机程序200，当上述一个或者多个计算机程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图3、图4所示的各个步骤等。

以下对本公开实施例的技术方案进行详细阐述：

随着互联网的发展，视频编辑在生活中得到越来越广泛的应用。现有的生成视频的方法中，可以是直接选取多个视频文件或者图片，把视频文件、图片按预设顺序或者随机顺序拼接成一个视频文件。这样，拼接出来的视频文件的时长为视频文件的时长和图片的时长的总和，其中，图片的时长可以设置为固定时长，例如，可以是3秒或4秒等。如果选取的图片和视频文件较多，拼接出来的视频时长就会较长，而且效果单一。另外，将不同类型的视频文件拼接在一起效果较差，例如，将包含人物的视频文件和包含动物的视频文件拼接在一起，或者和其他反差较大的视频文件拼接在一起，就比较有违和感。

当然，用户也可以对单个视频文件进行编辑之后，将多个编辑后的视频文件进行拼接。但是，对于每段视频文件，都需要反复播放预览，然后对各段反复进行裁剪、截取、加滤镜、音乐、转场等效果，而且不同类型的视频又要做删减，又要从素材里筛选同类型视频，这样才能拼接出用户认为效果较好的视频。可见，上述过程要做大量的手动编辑操作，增加编辑成本，效率较低，而且对于不专业的用户，拼接出来的效果也较差。

为了解决上述问题，本公开提供了一种视频生成方法、视频生成装置、电子设备以及计算机可读存储介质，可以提高视频生成的效率以及生成视频的效果。

参见图3，图3示出了本公开实施例中视频生成方法的一种流程图，可以包括以下步骤：

步骤s310，获取多个目标媒体文件，确定多个目标媒体文件的媒体类别。

步骤s320，根据多个目标媒体文件的媒体类别，从多个目标媒体文件中选取多个待编辑媒体文件。

步骤s330，基于多个待编辑媒体文件，自动拼接生成视频文件。

本公开实施例的视频生成方法，可以根据目标媒体文件的媒体类型，从目标媒体文件选取多个待编辑媒体文件并自动拼接生成视频文件，用户可以不用编辑处理，因此可以提高视频生成的效率。另外，即使在生成的视频文件达不到用户的需求的情况下，用户也可以基于该视频文件稍做处理即可，从而可以降低处理成本，提高视频生成的效率以及所生成视频的效果。

下面对本公开实施例的视频生成方法进行更加详细的介绍。

在步骤s310中，获取多个目标媒体文件，确定多个目标媒体文件的媒体类别。

本公开实施例中，媒体文件包括：视频文件和图片文件，目标媒体文件指的是从终端设备存储的媒体文件中选取的媒体文件，例如，可以是最近一天、两天、一周等存储至终端设备中的媒体文件。本公开可以对多个视频文件进行编辑生成新的视频文件，也可以对视频文件和图片进行编辑生成新的视频文件，还可以对多个图片进行编辑，生成视频文件。

其中，目标媒体文件的媒体类别指的是目标媒体文件所属的类别，例如类别可以包括：不同的人物、食物、花、运动、旅游等。同一人物的视频文件、图片文件可以归为一个类别，包含食物的视频文件、图片文件可以归为一个类别等。

对于终端设备中存储的媒体文件(可以是全部媒体文件，也可以是指定路径下的媒体文件)，可以预先建立媒体文件和媒体类别的映射关系。具体的，可以对终端设备中存储的各媒体文件进行扫描，确定单个媒体文件或单个媒体文件中的媒体片段的媒体类别，并建立媒体文件或媒体文件中的媒体片段和媒体类别的映射关系。这样，用户在搜索媒体文件时，也可以按媒体类别进行搜索。

在单个媒体文件为图像时，可以直接将该图像的图像类别作为该媒体文件的媒体类别。而视频是由视频帧序列组成，因此，视频对应的媒体类别可以通过视频帧序列对应的图像类别确定。在本公开的一种实现方式中，在单个媒体文件为视频时，对应的媒体类别的确定方法可参见图4，可以包括以下步骤：

步骤s410，提取视频中的多个关键帧，确定每个关键帧的图像类别。

本公开实施例中，可以基于深度学习的算法对每个关键帧进行处理，识别其中的人物、物体、场景、行为等信息，从而确定每个关键帧的图像类别。例如，图像类别可以是人物、动物、食物、风景等等。

步骤s420，基于多个关键帧的图像类别，确定该媒体文件的媒体类别；或者，确定该媒体文件中的媒体片段的媒体类别。

需要说明的是，对于某些视频文件，多个关键帧的图像类别为同一类别，那么，可以确定整个视频文件的视频类别为该类别。而对于另一些视频文件，视频文件中的某一片段是一个类别，而其他片段为其他类别，此时，可以将视频文件中不同的视频片段，分别标记为不同的视频类别，当然，还可以记录各个视频类别的视频片段在视频文件中对应的开始时刻和结束时刻。

值得一提的是，在用户拍摄视频或照片时，由于相机可以实时识别人脸，因此拍摄时可以记录相关人脸信息，保存视频或照片时也可以记录相关人脸信息。那么扫描时，可以直接根据人脸信息进行分类，从而可以提高分类的效率。

本公开实施例中，在对媒体文件进行分类之后，如果用户对分类结果不满意，或者，用户想对某个媒体文件进行特殊处理。例如，将媒体类别为人物的某一视频文件归为风景类别，用户也可以对视频文件的媒体类别进行调整。响应于针对任一媒体文件的媒体类别调整操作，可以将该媒体文件对应的媒体类别由第一媒体类别调整为第二媒体类别。可选的，媒体类别调整操作可以是：将该媒体文件从第一媒体类别中移除，并将该媒体文件重新分类到第二媒体类别等。这样，经过调整之后的分类结果可以更符合用户的需求。

需要说明的是，由于终端设备中的媒体文件可以是不断更新的，本公开实施例的视频生成过程也可以是周期性的，例如，可以每天或每两天根据终端设备中更新的媒体文件生成新的视频文件。因此，本步骤中所获取的多个目标媒体文件可以是当前时刻前一天的媒体文件，或者前两天的媒体文件等，具体可以根据视频生成的周期进行设置。这样，之前处理过的媒体文件，在下一次处理时，可以不再重复处理，以避免浪费资源。

在步骤s320中，根据多个目标媒体文件的媒体类别，从多个目标媒体文件中选取多个待编辑媒体文件。

本公开实施例中，在确定了多个目标媒体文件的媒体类别之后，可以按媒体类别进行拼接，即，可以将媒体类别相同的媒体文件进行拼接，因此，可以从多个目标媒体文件中选取媒体类别相同的目标媒体文件，作为多个待编辑媒体文件。例如，在多个目标媒体文件包含相同的人物时，可以从多个目标媒体文件中选取同一人物的目标媒体文件，作为待编辑视频文件。

在步骤s330中，基于多个待编辑媒体文件，自动拼接生成视频文件。

本公开实施例中，对于所选取的多个待编辑媒体文件，每个待编辑媒体文件可能是整个媒体文件对应某一媒体类别，也可能是媒体文件中的一个或多个媒体片段对应某一媒体类别。因此，在进行视频拼接时，针对单个待编辑媒体文件，可以先从该待编辑媒体文件中提取媒体片段，其中，从多个待编辑媒体文件中提取的媒体片段的媒体类别相同。之后，再对从多个待编辑媒体文件中提取的多个媒体片段进行自动拼接，生成视频文件。当然，也可以将单个待编辑媒体文件和从其他待编辑媒体文件中提取的媒体片段进行自动拼接，生成视频文件。这样，通过将媒体文件中的媒体片段作为拼接素材，而不是直接将整个媒体文件作为拼接素材，可以避免生成视频时间较长、包含用户不需要的内容的视频文件，提高视频文件的拼接效果。

由于上述视频拼接的过程是自动完成的，不需要用户手动操作，那么，在生成视频文件之后，可以将该视频文件展示给用户。用户在对视频文件满意的情况下，可以保存该视频文件。用户在对该视频文件不满意的情况下，也可以对该视频文件进行修改。具体的，响应于针对视频文件的编辑操作，对视频文件进行处理，得到处理后的视频文件。通常情况下，用户在视频文件的基础上进行修改时，可以做简单的编辑操作，即可得到用户满意的视频文件，因此也可以提高视频生成的效率。

在本公开的又一种实现方式中，对于已选取的多个待编辑媒体文件，在自动拼接生成视频文件之前，用户也可以对多个待编辑媒体文件进行编辑，以生成更符合用户需求的目标视频文件。具体的，响应于针对多个待编辑媒体文件的编辑操作，对多个待编辑媒体文件进行编辑，得到编辑后的媒体文件；响应于对编辑后的媒体文件的拼接操作，生成目标视频文件。虽然，与自动生成视频文件的方法相比，增加了用户操作，但是用户在多个待编辑媒体文件的基础上进行简单的编辑操作，即可生成更符合用户需求的目标视频文件，因此也提高了视频生成的效率，以及生成目标视频文件的效果。

在另一种场景下，本公开也可以支持用户手动选取媒体文件以生成视频文件。具体的，响应于媒体文件选取操作，获取用户选取的待处理媒体文件，将媒体类别与待处理媒体文件的媒体类别相同的其他媒体文件显示给用户，以使用户根据其他媒体文件进行编辑。也就是说，可以根据用户选取的媒体文件，为用户推荐媒体类别相同的其他媒体文件。用户可以根据自己的需求，从其他媒体文件中选取更多的媒体文件进行编辑，从而可以使用户更快的选取想要的媒体文件，进一步的，可以提高视频生成的效率以及生成视频文件的效果。

本公开实施例的视频生成方法中，通过自动扫描或用户设置将媒体文件或媒体文件中的媒体片段分类到预定的媒体类别(例如，同一人物可以分到同一媒体类别，不同的人物可以分到不同的媒体类别等)，作为后续生成视频文件的素材。在进行编辑时，可以根据这些媒体文件、媒体段自动拼接生成效果较好的视频文件，用户完全不用编辑处理，从而可以提高视频生成的效率和效果。用户还可以对生成的视频文件进行编辑，以生成效果更好的视频文件。

应当注意，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

进一步的，本示例实施方式中，还提供了一种视频生成装置500，如图5所示，包括：

媒体类别确定模块510，用于获取多个目标媒体文件，确定多个目标媒体文件的媒体类别；

媒体文件选取模块520，用于根据多个目标媒体文件的媒体类别，从多个目标媒体文件中选取多个待编辑媒体文件；

视频生成模块530，用于基于多个待编辑媒体文件，自动拼接生成视频文件。

可选的，本公开实施例的视频生成装置，还包括：

媒体类别预确定模块，用于对终端设备中存储的各媒体文件进行扫描，确定单个媒体文件或单个媒体文件中的媒体片段的媒体类别；

映射关系建立模块，用于建立媒体文件或媒体文件中的媒体片段和媒体类别的映射关系；

媒体文件选取模块，具体用于从多个目标媒体文件中选取媒体类别相同的目标媒体文件，作为多个待编辑媒体文件。

可选的，视频生成模块，具体用于针对单个待编辑媒体文件，从该待编辑媒体文件中提取媒体片段，其中，从多个待编辑媒体文件中提取的媒体片段的媒体类别相同；对从多个待编辑媒体文件中提取的多个媒体片段进行自动拼接，生成视频文件。

可选的，本公开实施例的视频生成装置，还包括：

视频文件处理模块，用于响应于针对视频文件的编辑操作，对视频文件进行处理，得到处理后的视频文件。

可选的，本公开实施例的视频生成装置，还包括：

文件编辑模块，用于响应于针对多个待编辑媒体文件的编辑操作，对多个待编辑媒体文件进行编辑，得到编辑后的媒体文件；

目标视频生成模块，用于响应于对编辑后的媒体文件的拼接操作，生成目标视频文件。

可选的，本公开实施例的视频生成装置，还包括：

媒体类别调整模块，用于响应于针对任一媒体文件的媒体类别调整操作，将该媒体文件对应的媒体类别由第一媒体类别调整为第二媒体类别。

可选的，媒体类别预确定模块包括：

视频类别确定单元，用于在单个媒体文件为视频时，提取视频中的多个关键帧，确定每个关键帧的图像类别；基于多个关键帧的图像类别，确定该媒体文件的媒体类别；或者，确定该媒体文件中媒体片段的媒体类别；

图像类别确定单元，用于在单个媒体文件为图像时，将该图像的图像类别作为该媒体文件的媒体类别。

上述装置中各模块或单元的具体细节已经在对应的方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈标
技术所有人：OPPO广东移动通信有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。