一种视频字幕贴图生成方法及装置与流程

文档序号：14326913阅读：218来源：国知局

本发明涉及图像处理技术领域，尤其涉及一种视频字幕贴图生成方法及装置。

背景技术：

短频即短视频，一种互联网内容传播方式，是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，时长为几秒到几分钟不等。短频的内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于短频的内容较短，可以单独成片，也可以成为系列栏目。

在短视频的制作时，有时候需要在视频上贴图，而在视频上的贴图可以是静态的贴图，也可以是动态的贴图，有时候还需要是字幕图片，由于视频文件的分辨率是多样的，有高有低，而目前的字幕贴图都是基于提前预置的文字图片素材贴合在视频图像上。

而提前预置的文字图片素材由于尺寸固定、单一，在应用到低分辨率的视频图像上时能够正常显示，但是在应用到高分辨率的视频图像上时，文字图片会被拉伸，导致文字失真、虚化。因此，在视频上的字幕贴图效果不稳定。

技术实现要素：

本发明实施例通过提供一种视频字幕贴图生成方法及装置，解决了现有技术中在视频上的字幕贴图效果不稳定的技术问题。

第一方面，本发明实施例提供的一种视频字幕贴图生成方法，应用于终端设备，所述方法包括：

获取当前视频帧的分辨率信息；

根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件；

将目标文字内容写入所述离屏视图控件；

对写入所述目标文字内容后的离屏视图控件进行截屏，生成字幕截屏图片；

将所述字幕截屏图片贴合至所述当前视频帧中的目标位置区域。

结合第一方面，在第一方面的第一种可能的实现方式中，所述根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件，包括：

如果检测到针对所述当前视频帧的文字输入操作，则根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件，其中，所述文字输入操作用于用户输入所述目标文字内容。

结合第一方面，在第一方面的第二种可能的实现方式中，所述根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件，包括：

根据所述当前视频帧的分辨率信息，确定所述当前视频帧所需的字幕贴图尺寸；

调用所述终端设备中的视图控件框架，创建原始视图控件；

调整所述原始视图控件的控件尺寸与所述字幕贴图尺寸对应，生成所述离屏视图控件。

结合第一方面至第一方面的第二种可能的实现方式中任一种可能的实现方式，在第一方面的第三种可能的实现方式中，所述将目标文字内容写入所述离屏视图控件，包括：

根据所述离屏视图控件的控件尺寸和所述目标文字内容，确定字体信息；

根据所述字体信息，将所述目标文字内容写入所述离屏视图控件中。

结合第一方面至第一方面的第二种可能的实现方式中任一种可能的实现方式，在第一方面的第四种可能的实现方式中，在所述对写入所述目标文字内容后的离屏视图控件进行截屏之后，所述方法还包括：

调用所述终端设备中的视图控件框架，移除所述离屏视图控件。

结合第一方面至第一方面的第二种可能的实现方式中任一种可能的实现方式，在第一方面的第五种可能的实现方式中，所述将所述字幕截屏图片贴合至所述当前视频帧中的目标位置区域，包括：

获得用户的位置指定操作；

将所述位置指定操作在所述当前视频帧上所指定的位置区域，确定为所述目标位置区域；

将所述字幕截屏图片贴合在所述目标位置区域。

结合第一方面的第五种可能的实现方式，在第一方面的第六种可能的实现方式中，所述将所述字幕截屏图片贴合在所述目标位置区域，包括：

将所述字幕截屏图片转化为截屏图像纹理；

将所述当前视频帧转化为视频帧图像纹理；

通过调用目标渲染程序，将所述截屏图像纹理与所述视频帧图像纹理进行融合，使得所述字幕截屏图片融合在所述当前视频帧中的目标位置区域，形成针对所述当前视频帧的字幕渲染视频帧。

第二方面，本发明实施例提供一种视频字幕贴图生成装置，应用于终端设备，所述装置包括：

信息获取单元，用于获取当前视频帧的分辨率信息；

控件创建单元，用于根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件；

文字写入单元，用于将目标文字内容写入所述离屏视图控件；

图片生成单元，用于对写入所述目标文字内容后的离屏视图控件进行截屏，生成字幕截屏图片；

贴合单元，用于将所述字幕截屏图片贴合至所述当前视频帧中的目标位置区域。

结合第二方面，在第二方面的第一种可能的实现方式中，所述控件创建单元，包括：

检测子单元，用于检测针对所述当前视频帧的文字输入操作；

控件创建子单元，用于响应所述文字输入操作，根据所述当前视频帧的分辨率信息，创建针对所述当前视频帧的离屏视图控件，其中，所述文字输入操作用于用户输入所述目标文字内容。

结合第二方面，在第二方面的第二种可能的实现方式中，所述控件创建单元，包括：

尺寸确定子单元，用于根据所述当前视频帧的分辨率信息，确定所述当前视频帧所需的字幕贴图尺寸；

原始创建子单元，用于调用所述终端设备中的视图控件框架，创建原始视图控件；

控件生成子单元，用于调整所述原始视图控件的控件尺寸与所述字幕贴图尺寸对应，生成所述离屏视图控件。

结合第二方面至第二方面的第二种可能的实现方式中任一种可能的实现方式，在第二方面的第三种可能的实现方式中，所述文字写入单元，包括：

字体确定子单元，用于根据所述离屏视图控件的控件尺寸和所述目标文字内容，确定字体信息；

写入子单元，用于根据所述字体信息，将所述目标文字内容写入所述离屏视图控件中。

结合第二方面至第二方面的第二种可能的实现方式中任一种可能的实现方式，在第二方面的第四种可能的实现方式中，所述装置还包括：

移除单元，用于在所述对写入所述目标文字内容后的离屏视图控件进行截屏之后调用所述终端设备中的视图控件框架，移除所述离屏视图控件。

结合第二方面至第二方面的第二种可能的实现方式中任一种可能的实现方式，在第二方面的第五种可能的实现方式中，所述贴合单元，包括：

操作获得子单元，用于获得用户的位置指定操作；

位置确定子单元，用于将所述位置指定操作在所述当前视频帧上所指定的位置区域，确定为所述目标位置区域；

贴合子单元，用于将所述字幕截屏图片贴合在所述目标位置区域。

结合第二方面的第五种可能的实现方式，在第二方面的第六种可能的实现方式中，所述贴合子单元，具体用于：

将所述字幕截屏图片转化为截屏图像纹理；

将所述当前视频帧转化为视频帧图像纹理；

第三方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面至第一方面的第六种可能的实现方式中任一种可能的实现方式中所述的步骤。

第四方面，本发明实施例提供了一种终端设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面至第一方面的第六种可能的实现方式中任一种可能的实现方式中所述的步骤。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

由于根据当前视频帧的分辨率信息创建离屏视图控件，再将目标文字内容写入该离屏视图控件，对写入该目标文字内容后的离屏视图控件进行截屏，生成字幕截屏图片，将字幕截屏图片贴合至当前视频帧中的目标位置区域。从而，字幕截屏图片是根据当前视频帧的分辨率信息动态生成的，而不是预置的固定尺寸的文字图片素材，故而，字幕截屏图片的尺寸能够始终与所贴合在的视频帧的分辨率相匹配，使得每个视频帧上的字幕贴图的尺寸都是与所在视频帧的分辨率相适配的，避免了字幕贴图贴合在大分辨率的视频帧上时被拉伸而失真，进而使得在视频上的字幕贴图效果稳定。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的视频字幕贴图生成方法的流程图；

图2为本发明实施例提供的视频字幕贴图生成装置的程序模块图；

图3为本发明实施例提供的终端设备的结构示意图；

图4为本发明实施例提供的计算机可读存储介质的结构示意图。

具体实施方式

鉴于现有技术存在视频上的字幕贴图效果不稳定的技术问题，本发明实施例提供了一种视频字幕贴图生成方法及装置，总体思路如下：

根据当前视频帧的分辨率信息创建离屏视图控件，将文字内容写入到创建的离屏视图控件中后进行截屏，生成字幕截屏图片，生成的字幕截屏图片贴合到当前视频帧，由于离屏视图控件是根据当前视频帧的分辨率信息创建的，因此离屏视图控件的尺寸不是固定的，进而使得字幕截屏图片不是固定尺寸，而是与当前视频帧的分辨率匹配的，因此，字幕截屏图片可以直接贴合在当前视频帧上，而不需要通过拉伸图片来增大尺寸至与当前视频帧的分辨率匹配，从而避免字幕图片被拉伸而失真，始终保持字幕贴图上文字的清晰度，进而使得无论是大、小分辨率的视频帧，在视频帧上的字幕贴图都效果稳定。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的视频字幕贴图生成方法，应用于终端设备中，在终端设备的操作系统中自带视图控件框架(view控件框架)，通过调用终端设备的操作系统所自带的视图控件框架，创建视图控件(view控件)。

本发明实施例提供的视频字幕贴图生成方法可以应用于基于终端设备的目标应用制作短视频的场景。具体的，可以应用于对相机应用录制的原始短视频的进行后期处理的过程中，也可以应用于社交应用对从其他设备接收到的原始短视频、或者对本地存储的原始短视频进行后期处理的过程中。

对短视频的后期处理包括在短视频的当前视频帧上贴图，在当前视频帧上的图片可以是动态的，也可以是静态的，可以是纯图像图片，也可以说字幕图片。而本发明实施例提供视频字幕贴图生成方法应用于在终端设备所安装的目标应用中，比如应用于相机应用、或者视频社交应用，在短视频上呈现字幕贴图效果。

参考图1所示，本发明实施例提供的视频字幕贴图生成方法的流程图，本发明实施例提供的视频字幕贴图生成方法包括如下步骤：

s101：获取当前视频帧的分辨率信息。

具体的，从当前正在制作的短视频中获取当前视频帧，当前视频帧为当前所显示的需要制作字幕贴图的视频帧。

具体的，从当前正在制作的短视频的文件信息或者视频属性信息中提取当前视频帧的分辨率信息。当前视频帧的分辨率信息，也可以叫做当前视频帧的帧大小、帧尺寸、记录分辨率，当前视频帧的分辨率信息是指图像中存储的信息量，是当前视频帧的每英寸图像内有多少个像素点，当前视频帧的分辨率信息的表达方式可以为：水平像素数×垂直像素数，也可以用规格代号来表示，规格代号通常表示成ppi(每英寸像素，pixelperinch)，含义是每英寸图像区域内的像素点个数。

举例来讲，获取的当前视频帧的分辨率信息可以为field(704x288像素)，cif(352x288像素)，qcif(176x144像素)，sqcif(128x96像素)、160×120像素、320×240像素、640×480像素、320×450中的一种，但是也不限于上述举例的分辨率。

s102：根据当前视频帧的分辨率信息，创建针对当前视频帧的离屏视图控件。

为了满足字幕贴图的文字内容多样性，在执行步骤s101之前，检测针对当前视频帧的文字输入操作；如果检测到针对当前视频帧的文字输入操作，则执行步骤s101～s102。

为了满足字幕贴图的文字内容多样性，也可以在执行步骤s101之后，且步骤s102之前，检测针对当前视频帧的文字输入操作，如果检测到针对当前视频帧的文字输入操作，则执行步骤s102：根据当前视频帧的分辨率信息，创建针对当前视频帧的离屏视图控件。

具体的，文字输入操作用于用户输入目标文字内容。文字输入操作可以为在终端设备上的手写输入操作、拼音输入操作，笔画输入操作、字符输入操作、语音输入操作中的一种或者多种结合使用。

具体来讲，如果检测到针对当前视频帧的文字输入操作，则调用终端设备所安装的操作系统中自带的视图控件框架，根据当前视频帧的分辨率信息创建针对当前视频帧的离屏视图控件。具体的，通过api(applicationprogramminginterface，应用程序编程接口)调用终端设备所安装的操作系统中自带的视图控件框架。

需要说明的是，本实施例中所指的离屏视图控件具体为：不在终端设备的ui(userinterface，用户界面)界面上显示出视图控件。

为了实现view控件的离屏，形成针对当前视频帧的离屏视图控件，具体为：通过调用终端设备所安装的操作系统中自带的视图控件框架，创建针对当前视频帧的view控件后，所创建的view控件不添加到ui界面的控件容器中。因此不会在ui界面上显示出视图控件，从而形成针对当前视频帧的离屏视图控件。

在具体实施过程中，创建针对当前视频帧的离屏视图控件，具体为：创建的离屏视图控件的控件尺寸与当前视频帧的分辨率对应。

具体的，离屏视图控件的控件尺寸可以为离屏视图控件的宽*高。下面，给出一创建控件尺寸与当前视频帧的分辨率对应的离屏视图控件的具体实施方式，具体包括如下步骤：

执行步骤s1021：根据当前视频帧的分辨率信息，确定当前视频帧所需的字幕贴图尺寸。

在一实施例中，需要获取用户的尺寸指定操作，根据当前视频帧的分辨率信息和用户的尺寸指定操作，确定当前视频帧所需的字幕贴图尺寸。需要说明的是，在本实施例中，字幕贴图尺寸是“水平像素数×垂直像素数”的表达方式，而不是指字幕贴图的边长或面积的大小。

具体的，用户的尺寸指定操作用于指定所要贴合在当前视频帧的字幕贴图在当前视频帧上的占比参数，该占比参数可以为面积占比，也可以为长度占比х宽度占比。将当前分辨率信息中的水平像素数除以长度方向对应的占比参数，并且将垂直像素数除以垂直方向对应的占比参数，得到当前视频帧所需的字幕贴图尺寸。比如，该占比参数为长度占比х宽度占比，则将当前分辨率信息中的水平像素数除以长度占比，并且将垂直像素数除以宽度占比，得到当前视频帧所需的字幕贴图尺寸。

以步骤s101中获取的当前视频帧的分辨率信息为2000*2000像素，进行举例来讲，如果根据尺寸指定操作指定字幕贴图占当前视频帧的1/4面积，确定出当前视频帧所需的字幕贴图尺寸为1000*1000像素。如果根据尺寸指定操作指定字幕贴图占当前视频帧的1/2长度*1/4宽度，则确定出当前视频帧所需的字幕贴图尺寸为1000*500像素。

在具体实施过程中，尺寸指定操作的实现形式可以有多种，下面进行举例说明：

第一种实施方式，尺寸指定操作具体为：从预先设置的多种可供选择的占比值中选择目标占比值的选中操作。预先设置的多种可供选择的占比值可以为面积占比、长度占比х宽度占比中的一种形式。

在具体实施过程中，可以在设置选项中预先设置有多种可供选择的预设占比值，基于尺寸指定操作从多种可供选择的预设占比值中选中一个，确定为目标占比值。比如，预先设置的预设占比值包括如下多种：面积占比1/4、面积占比1/3、面积占比1/2、面积占比1/6，接受尺寸指定操作，从面积占比1/4、面积占比1/3、面积占比1/2、面积占比1/6中选中一个，比如，选中面积占比1/4，则表征指定字幕贴图占当前视频帧的1/4面积。

第二种实施方式，尺寸指定操作具体为：目标占比值的实际数值输入操作。接受实际数值输入操作所输入的数值，确定为目标占比值。

针对终端设备为触摸显示屏的终端设备，尺寸指定操作也可以是第三种实施方式：在触摸显示屏上的移动轨迹，根据移动轨迹所覆盖的屏幕区域，确定字幕贴图占当前视频帧的目标占比值。

执行步骤s1022、调用终端设备中的视图控件框架，创建原始视图控件。

具体来讲，调用终端设备的操作系统自带的视图控件框架，创建原始视图控件。比如，无论是安卓系统(android)还是ios操作系统，均自带有视图控件框架，所创建的原始视图控件的尺寸为默认尺寸。

需要说明的是，步骤s1011与步骤s1012为独立执行的步骤，在具体实施过程中，可以同时执行，也可以分先后顺序执行。

接着，在步骤s1011与步骤s1012之后，执行步骤s1023：调整原始视图控件的控件尺寸与字幕贴图尺寸对应，生成离屏视图控件。

具体来讲，将字幕贴图尺寸配置给原始视图控件，比如，所需字幕贴图尺寸为1000*1000像素，则调整原始视图控件的控件尺寸为1000*1000像素，生成控件尺寸为1000*1000像素的离屏视图控件。

通过上述步骤s101～s102，能够生成控件尺寸与当前视频帧的分辨率信息匹配的离屏视图控件。

接着，执行步骤s103：将目标文字内容写入离屏视图控件。

具体来讲，获取目标文字内容，并将获取的目标文字内容写入离屏视图控件中。

获取目标文字内容的一种实施方式为：获取基于步骤s101中文字输入操作所输入的文字内容，确定为目标文字内容。

需要说明的是，目标文字内容为需要在当前视频帧上生成字幕贴图的文字内容。比如，需要在当前视频帧上生成“风和日丽”的字幕贴图，则文字输入操作所输入的目标文字内容为“风、和、日、丽”四个文字。比如，需要在当前视频帧上生成“thankyou”的字幕贴图，则文字输入操作所输入的目标文字内容则为依次的英文字符“t-h-a-n-k-y-o-u”。

通过这种实施方式实现了字幕贴图中文字内容的多样性，从而，可以根据以字幕贴图的形式显示用户所需显示在视频上的文字内容，使得字幕贴图的文字内容更加丰富、字幕灵活性更高。

获取目标文字内容的另一种实施方式为：提前从其他设备接收多种文字内容并预置于终端设备中，从预置于终端设备中的多种内容文字中确定出目标文字内容。比如，从服务平台下载多种文字内容并预置于终端设备中，在执行步骤s103时，从终端设备中预置的多种文字内容中选择其中一种或多种文件内容，确定为目标文字内容，写入离屏视频控件中。

通过这种实施方式可以减少用户的文字输入操作，从而降低了生成字幕贴图的操作复杂度，提高了时效性。

当然在具体实施过程中，也可以将上述获取目标文字内容的两种实施方式结合应用，如果预置于终端设备中的多种文字内容中存在目标文字内容，则直接写入离屏视频控件中，如果预置于目标应用的文字内容中不存在目标文字内容，则接收来自用户的文字输入操作所输入的文字内容，确定为目标文字内容。

为了满足字幕贴图的字体多样性，以及保证字幕贴图的字体大小与离屏视图控件的尺寸相适应，下面，给出针对步骤s103的具体实施方式，包括如下步骤：

步骤s1031、根据离屏视图控件的控件尺寸和目标文字内容，确定字体信息。

在步骤s1031中，根据离屏视图控件的控件尺寸和目标文字内容，确定目标文字内容写入离屏视图控件所用的字号、字形和字体。具体来讲，字号为文字的大小，比如可以为一号、二号、三号、四号、小四号这种形式，也可以为磅值表示的文字的大小。字形可以为常规、加粗、斜体、加粗+斜体中的一种。字体具体为楷体、宋体、黑体、隶书、timenewroman等等，本文不进行穷举。

其中，确定所用字号的过程具体为：确定目标文字内容的文字个数，将离屏视图控件的控件尺寸除以目标文字内容的文字个数，得到写入离屏视图控件时所用的字号，保证目标文字内容均能够在离屏视图控件中容纳。

其中，确定所用字体的过程具体为：检测用户的字体选择操作和字形选择操作，获取用户的字体选择操作所选择的字体和字形选择操作所选择的字形，确定为目标文字内容写入离屏视图控件所用的字号和字形。

具体来讲，如果目标文字内容为用户在触摸显示屏上的手写输入操作，则根据手写输入操作输入目标文字内容时的移动轨迹，确定将目标文字内容写入离屏视图控件所用的字号和字形所用的字体和字形。

为了进一步提高在字幕贴图的效果，还包括：确定的字体信息中还包括将目标文字内容写入离屏视图控件的换行信息。具体的，换行信息可以根据目标文字内容的文字个数进行自动配置。也可以根据用户在输入目标文字内容时的换行操作指令进行配置。

步骤s1032、根据字体信息，将目标文字内容写入离屏视图控件中。

具体的，将步骤s1031确定的字体、字形和字号分享至离屏视图控件，以得到的字体、字形和字号在离屏视图控件中依次绘制目标文字内容的每一个字符。

通过步骤s1031～s1032，能够确保离屏视图控件中写入的文字内容的字号、是与离屏视图控件的尺寸匹配的，不会超出离屏视图控件的范围，字形、字体是用户所需的。

在步骤s103之后，接着执行步骤s104：对写入目标文字内容后的离屏视图控件进行截屏，生成字幕截屏图片。

需要说明的是，由于离屏视图控件并未显示在终端设备的ui界面上，因此，步骤s104中对写入目标文字内容后的离屏视图控件进行截屏，是在后台对写入目标文字内容后的离屏视图控件进行截屏的动作，而不会对显示着当前视频帧的屏幕进行截屏，避免了对短视频制作过程的干扰。

在步骤s104之后，接着执行步骤s105：将字幕截屏图片贴合至当前视频帧中的目标位置区域。

具体的，目标位置信息为根据用户的位置指定操作所指定的位置区域。具体来讲，获得用户的位置指定操作，将位置指定操作在当前视频帧上所指定的位置区域确定为目标位置区域；将字幕截屏图片贴合在目标位置区域。

需要说明的是，如果在步骤s102中的尺寸指定操作为在触摸显示屏上的移动轨迹的实施方式，则目标位置区域可以为将尺寸指定操作在触摸显示屏上的移动轨迹所指定的位置区域确定为目标位置区域，从而避免了用户的重复操作，简化了字幕贴图的生成过程，减少了操作复杂度。

具体的，为了将字幕截屏图片贴合在当前视频帧上的目标位置区域，可以调用目标渲染程序，将字幕截屏图片贴合在当前视频帧上的目标位置区域，具体包括如下步骤：

s1051：将字幕截屏图片转化为截屏图像纹理；

s1052：将当前视频帧转化为视频帧图像纹理；

s1053：通过调用目标渲染程序，将截屏图像纹理与视频帧图像纹理进行融合，使得字幕截屏图片融合在当前视频帧中的目标位置区域，形成针对当前视频帧的字幕渲染视频帧。

截屏图像纹理、当前视频帧的视频帧图像纹理为目标渲染程序能够识别的格式。在具体实施过程中，目标渲染程序可以为opengl(opengraphicslibrary，开放图形库)渲染程序，由于opengl渲染程序不能直接进行文字的渲染，也不能直接进行图片的渲染，因此生成字幕截屏图片后，需要将字幕截屏图片转化为截屏图像纹理，以及将将当前视频帧转化为视频帧图像纹理，将截屏图像纹理与视频帧图像纹理进行融合，完成渲染，才能将字幕截屏图片贴合在当前视频帧上的目标位置区域，从而形成针对当前视频帧的字幕渲染视频帧。

结合前述实施例，在对写入目标文字内容后的离屏视图控件进行截屏之后，调用终端设备中的视图控件框架，移除离屏视图控件。具体的，调用终端设备所安装的操作系统中自带的视图控件框架，移除离屏视图控件。从而避免离屏视图控件占用内存资源。

基于同一发明构思，本发明实施例提供了一种视频字幕贴图生成装置，应用于终端设备，参考图2所示，该视频字幕贴图生成装置包括：

信息获取单元201，用于获取当前视频帧的分辨率信息；

控件创建单元202，用于根据当前视频帧的分辨率信息，创建针对当前视频帧的离屏视图控件；

文字写入单元203，用于将目标文字内容写入离屏视图控件；

图片生成单元204，用于对写入目标文字内容后的离屏视图控件进行截屏，生成字幕截屏图片；

贴合单元205，用于将字幕截屏图片贴合至当前视频帧中的目标位置区域。

在一优选的技术方案中，控件创建单元202，包括：

检测子单元，用于检测针对当前视频帧的文字输入操作；

控件创建子单元，用于响应文字输入操作，根据当前视频帧的分辨率信息，创建针对当前视频帧的离屏视图控件，其中，文字输入操作用于用户输入目标文字内容。

在一优选的技术方案中，控件创建单元，包括：

尺寸确定子单元，用于根据当前视频帧的分辨率信息，确定当前视频帧所需的字幕贴图尺寸；

原始创建子单元，用于调用终端设备中的视图控件框架，创建原始视图控件；

控件生成子单元，用于调整原始视图控件的控件尺寸与字幕贴图尺寸对应，生成离屏视图控件。

在一优选的技术方案中，文字写入单元，包括：

字体确定子单元，用于根据离屏视图控件的控件尺寸和目标文字内容，确定字体信息；

写入子单元，用于根据字体信息，将目标文字内容写入离屏视图控件中。

在一优选的技术方案中，该视频字幕贴图生成装置还包括：

移除单元，用于在对写入目标文字内容后的离屏视图控件进行截屏之后调用终端设备中的视图控件框架，移除离屏视图控件。

在一优选的技术方案中，贴合单元205包括：

操作获得子单元，用于获得用户的位置指定操作；

位置确定子单元，用于将位置指定操作在当前视频帧上所指定的位置区域，确定为目标位置区域；

贴合子单元，用于将字幕截屏图片贴合在目标位置区域。

在一优选的技术方案中，贴合子单元，具体用于：

将字幕截屏图片转化为截屏图像纹理；

将当前视频帧转化为视频帧图像纹理；

通过调用目标渲染程序，将截屏图像纹理与视频帧图像纹理进行融合，使得字幕截屏图片融合在当前视频帧中的目标位置区域，形成针对当前视频帧的字幕渲染视频帧。

由于本实施例所介绍的装置为实施本发明实施例中视频字幕贴图生成方法所采用的装置，故而基于本发明实施例中所介绍的信息处理的方法，本领域所属技术人员能够了解本实施例的装置的具体实施方式以及其各种变化形式，所以在此对于该装置如何实现本发明实施例中的方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中信息处理的方法所采用的装置，都属于本发明所欲保护的范围。

基于同一发明构思，本发明实施例还提供一种终端设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行所述程序时实现前述视频字幕贴图生成方法实施例所述的步骤。参考图3所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、pda(personaldigitalassistant，个人数字助理)、pos(pointofsales，销售终端)、车载电脑等任意终端设备，以终端设备为移动手机为例：

图3示出的是与本发明实施例提供的移动通信终端相关的手机的部分结构的框图。参考图3，手机包括：射频(radiofrequency，rf)电路310、存储器320、输入单元330、显示单元340、传感器350、音频电路360、无线保真(wireless-fidelity，wi-fi)模块360、处理器380、以及电源390等部件。本领域技术人员可以理解，图3中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图3对手机的各个构成部件进行具体的介绍：

rf电路310可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器380处理；另外，将设计上行的数据发送给基站。通常，rf电路310包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(lownoiseamplifier，lna)、双工器等。此外，rf电路310还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(globalsystemofmobilecommunication，gsm)、通用分组无线服务(generalpacketradioservice，gprs)、码分多址(codedivisionmultipleaccess，cdma)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、长期演进(longtermevolution，lte)、电子邮件、短消息服务(shortmessagingservice，sms)等。

存储器320可用于存储软件程序以及模块，处理器380通过运行存储在存储器320的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元330可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元330可包括触控面板331以及其他输入设备332。触控面板331，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板331上或在触控面板331附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板331可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器380，并能接收处理器380发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板331。除了触控面板331，输入单元330还可以包括其他输入设备332。具体地，其他输入设备332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元340可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元340可包括显示面板341，可选的，可以采用液晶显示器(liquidcrystaldisplay，lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板341。进一步的，触控面板331可覆盖显示面板341，当触控面板331检测到在其上或附近的触摸操作后，传送给处理器380以确定触摸事件的类型，随后处理器380根据触摸事件的类型在显示面板341上提供相应的视觉输出。虽然在图3中，触控面板331与显示面板341是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板331与显示面板341集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器350，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板341的亮度，接近传感器可在手机移动到耳边时，关闭显示面板341和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路360、扬声器361，传声器362可提供用户与手机之间的音频接口。音频电路360可将接收到的音频数据转换后的电信号，传输到扬声器361，由扬声器361转换为声音信号输出；另一方面，传声器362将收集的声音信号转换为电信号，由音频电路360接收后转换为音频数据，再将音频数据输出处理器380处理后，经rf电路310以发送给比如另一手机，或者将音频数据输出至存储器320以便进一步处理。

wifi属于短距离无线传输技术，手机通过wifi模块360可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图3示出了wifi模块360，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器380是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器320内的软件程序和/或模块，以及调用存储在存储器320内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器380可包括一个或多个处理单元；优选的，处理器380可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器380中。

手机还包括给各个部件供电的电源390(比如电池)，优选的，电源可以通过电源管理系统与处理器380逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，该移动终端还蓝牙模块等，在此不再赘述。

手机的输入单元还包括摄像头333，移动终端上安装有相机应用程序，摄像头333用于在相机应用程序处于启动时采集视频帧，处理器380用于控制摄像头333，在本发明实施例中，该移动通信终端所包括的处理器380还执行程序时实现前述视频特效处理方法实施例的相应功能。

基于同一发明构思，本发明实施例提供了一种计算机可读存储介质401，参考图4，其上存储有计算机程序402，该程序402被处理器执行时实现前述视频字幕贴图生成方法实施例中的任一实施方式的步骤。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的实现扩展应用程序的推送通知的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙金波
技术所有人：北京奇虎科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。