8K录播回放视频的生成方法、装置、存储介质及设备与流程

文档序号：26903696发布日期：2021-10-09 13:38阅读：174来源：国知局

8k录播回放视频的生成方法、装置、存储介质及设备
技术领域
1.本发明涉及教育行业教学音视频生成技术领域，尤其涉及一种8k录播回放视频的生成方法、装置、存储介质及设备。

背景技术：

2.音视频检索为从录像音视频资料中搜索有用或者需要的资料，传统音视频播放的拖动条，就是一种录像音视频检索的方式。
3.在录播行业应用领域，对于8k超高分辨率的音视频编码的新应用需求，然而目前8k音视频编码的数据码率较大，播放8k录像音视频时，按照传统音视频检索模式，采用时间进度条的方式进行检索费时费力，且当8k录像文件太大时，在检索音视频资料时非常耗费系统资源，因此如何能在8k录播音视频录像文件中，快速检索定位找到8k录像中需要的音视频资料，这是需要解决的技术问题。

技术实现要素：

4.本发明的主要目的在于提供一种8k录播回放视频的生成方法、装置、计算机设备及存储介质，可以解决现有技术中的缺少对8k录像中需要的音视频资料进行快速检索定位的问题。
5.为实现上述目的，本发明第一方面提供一种8k录播回放视频的生成方法，所述方法包括：
6.获取实时拍摄的原始视频流；
7.按照预设8k码率对所述原始视频流进行编码，得到目标8k码率视频流；
8.根据所述目标8k码率视频流及预设景别标记类型，确定所述目标8k码率视频流对应的第一索引数据，所述第一索引数据包括所述景别标记类型及与所述景别标记类型对应的第一时间戳，以及根据所述目标8k码率视频流及预设音频标记类型，确定所述目标8k码率视频流对应的第二索引数据，第二索引数据包括所述音频标记类型及与所述音频标记类型对应的第二时间戳；
9.当所述录播结束，则利用所述第一索引数据及所述第二索引数据生成8k录播回放视频。
10.在一种可行实现方式中，根据所述目标8k码率视频流及预设景别标记类型，确定所述目标8k码率视频流对应的第一索引数据，包括：
11.从所述目标8k码率视频流中提取视频帧，得到视频帧集合；
12.利用所述视频帧集合及预设帧差法，确定所述视频帧集合中各个视频帧对应的景别标记类型，所述景别标记类型用于指示景别转换方式；
13.基于所述视频帧集合中各个视频帧对应的景别标记类型，提取符合预设景别标记类型的第一视频帧；
14.将所述第一视频帧对应的景别标记类型关联所述第一视频帧的第一时间戳，得到
所述目标8k码率视频流对应的第一索引数据。
15.在一种可行实现方式中，所述利用所述视频帧集合及预设帧差法，确定所述视频帧集合中各个视频帧对应的景别标记类型，包括：
16.获取第二视频帧、及所述第二视频帧对应的前一视频帧及后一视频帧；
17.将所述第二视频帧、前一视频帧及后一视频帧输入所述预设帧差法，确定所述第二视频帧对应的第一运动对象、前一视频帧对应的第二运动对象及后一视频帧中对应的第三运动对象；
18.利用所述第一运动对象、第二运动对象及第三运动对象的各个画面占比及预设占比阈值，以及将所述第二视频帧、前一视频帧及后一视频帧叠加生成运动轨迹，确定所述第二视频帧对应的景别标记类型，所述运动轨迹由所述第一运动对象、第二运动对象及第三运动对象构成。
19.在一种可行实现方式中，所述根据所述目标8k码率视频流及预设音频标记类型，确定所述目标8k码率视频流对应的第二索引数据，包括：
20.从所述目标8k码率视频流中提取音频帧，得到音频帧集合；
21.利用所述音频帧集合中音频帧的声音状态参数及预设参数阈值，从所述音频帧集合中提取符合预设音频标记类型的目标音频帧，及所述目标音频帧的音频标记类型，所述声音状态参数包括音量幅值、声音变化趋势、音色、音轨及频段；
22.将所述目标音频帧对应的音频标记类型关联所述目标音频帧对应的第二时间戳，得到所述目标8k码率视频流对应的第二索引数据。
23.在一种可行实现方式中，所述预设景别标记类型包括场景切换镜头、水平移动镜头、垂直移动镜头、人脸特写镜头、场景鼓掌镜头及人物起立镜头。
24.在一种可行实现方式中，所述预设音频标记类型包括音乐开启、鼓掌欢呼声、人物发言开始、人物发言结束。
25.在一种可行实现方式中，所述利用所述第一索引数据及所述第二索引数据生成8k录播回放视频，包括：
26.获取所述第一索引数据中的第一时间戳，及获取所述第二索引数据中的第二时间戳；
27.将所述第一索引数据中的景别标记类型与所述第一时间戳对应的视频帧进行关联，以及将所述第二索引数据中的音频标记类型与所述第二时间戳对应的音频帧进行关联，得到已关联的目标8k码率视频流；
28.利用所述已关联的目标8k码率视频流生成8k录播回放视频。
29.为实现上述目的，本发明第二方面提供一种8k录播回放视频的生成装置，所述装置包括：
30.数据获取模块：用于获取实时拍摄的原始视频流；
31.数据编码模块：用于按照预设8k码率对所述原始视频流进行编码，得到目标8k码率视频流；
32.数据分析模块：用于根据所述目标8k码率视频流及预设景别标记类型，确定所述目标8k码率视频流对应的第一索引数据，所述第一索引数据包括所述景别标记类型及与所述景别标记类型对应的第一时间戳，以及根据所述目标8k码率视频流及预设音频标记类
型，确定所述目标8k码率视频流对应的第二索引数据，第二索引数据包括所述音频标记类型及与所述音频标记类型对应的第二时间戳；
33.视频生成模块：用于当所述录播结束，则利用所述第一索引数据及所述第二索引数据生成8k录播回放视频。
34.为实现上述目的，本发明第三方面提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如第一方面及任一可选实现方式中所示步骤。
35.为实现上述目的，本发明第四方面提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如第一方面及任一可选实现方式中所示步骤。
36.采用本发明实施例，具有如下有益效果：
37.本发明提供一种8k录播回放视频的生成方法，该方法包括：获取实时拍摄的原始视频流；按照预设8k码率对原始视频流进行编码，得到目标8k码率视频流；根据目标8k码率视频流及预设景别标记类型，确定目标8k码率视频流对应的第一索引数据，第一索引数据包括景别标记类型及与景别标记类型对应的第一时间戳，以及根据目标8k码率视频流及预设音频标记类型，确定目标8k码率视频流对应的第二索引数据，第二索引数据包括音频标记类型及与音频标记类型对应的第二时间戳；当录播结束，则利用第一索引数据及第二索引数据生成8k录播回放视频。通过对录播时的目标8k码率视频流实时进行分析，使得在录播结束时生成的8k录播回放视频包括与视频相关的第一索引数据及与音频相关的第二索引数据，使得用户在播放8k录播回放视频或编辑8k录播回放视频时，可根据检索数据实现快捷操作。
附图说明
38.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
39.其中：
40.图1为本发明实施例中一种8k录播回放视频的生成方法的流程示意图；
41.图2为本发明实施例中一种8k录播回放视频的生成方法的另一流程示意图；
42.图3为本发明实施例中一种8k录播回放视频的生成装置的结构框图；
43.图4为本发明实施例中一种计算机设备的结构框图。
具体实施方式
44.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
45.请参阅图1，图1为本发明实施例中一种8k录播回放视频的生成方法的流程示意
图，如图1所示方法包括如下步骤：
46.101、获取实时拍摄的原始视频流；
47.需要说明的是，原始视频流是指录播主机拍摄的原始视频格式的文件，也可以叫做标准视频格式的文件。示例性的，录播主机可以是具有拍摄功能的台式终端或移动终端，例如：个人电脑(personl compurter，pc)、智能手机、平板及笔记本电脑等等终端设备。其中，录播主机可以为具有录制8k分辨率视频的终端设备。
48.进一步的，录播主机可对拍摄的原始视频流进行实时编码、传输以及保存。
49.102、按照预设8k码率对所述原始视频流进行编码，得到目标8k码率视频流；
50.其中，编码是指通过压缩技术，将标准视频格式的文件转换成另一种视频格式文件的技术，以便进行网络传输，常见的编解码标准有国际电联的h.261、h.263、h.264、h.265，运动静止图像专家组的m
‑
jpeg和国际标准化组织运动图像专家组的mpeg系列标准。因此，在本发明实施例中的编码方式包括但不限于采用上述编解码标准进行预设码率的编码或解码，因此上述仅做举例不做具体限定，可根据实际情况选择上述一种或多种进行原始视频流的预设码率编码。
51.进一步的，码率是指在数据传输时，单位时间传送的数据位数，因而码率也叫做比特率。码率可以表示为经过压缩编码后的音视频编码数据每秒需要用多少个比特来表示，即把每秒显示的图像或声音进行压缩后的数据量，一般采用的单位是kbps即千位每秒。也可叫做取样率，单位时间内取样率越大，精度就越高，处理出来的文件就越接近原始文件，画面的细节就越丰富，越接近肉眼观看的真实画面。常见的码率有720p、1080p、4k、8k等，其取样率依次递增，在本发明实施例中，优选以预设8k码率对原始视频流进行编码，以得到细节丰富的目标8k码率视频流，使得预设观看终端可以得到细节丰富的目标8k码率视频流进行录播的同步观看，提升用户观感，当然也可以使得录播结束时，生成细节丰富的录播回放视频。
52.103、根据所述目标8k码率视频流及预设景别标记类型，确定所述目标8k码率视频流对应的第一索引数据，所述第一索引数据包括所述景别标记类型及与所述景别标记类型对应的第一时间戳，以及根据所述目标8k码率视频流及预设音频标记类型，确定所述目标8k码率视频流对应的第二索引数据，第二索引数据包括所述音频标记类型及与所述音频标记类型对应的第二时间戳；
53.需要说明的是，景别标记类型用于指示景别转换方式。景别是指由于录播主机在焦距一定对画面进行采集时，录播主机与被摄体的距离不同，而造成被摄体在录播主机的录像器中所呈现出的范围大小(也即画面占比)的区别，其中，画面可以分为前景与背景，其中前景一般指被摄体所在画面区域，其中被摄体可以为人、物体、人体部位等等。
54.其中，景别的划分，一般可分为五大类型，特写是指前景远超出背景在画面的占比，也就是说被摄体被完全放大在画面中，使得背景画面非常小；近景是指前景画面的占比略小于特写时前景的占比，但是从前景和背景的画面占比来看，前景仍占据主体地位，也就是说被摄体仍可能呈现微放大状态，但是此时背景的画面区域呈现更多内容使得背景画面占比增加；中景是指前景与背景在画面的占比近乎平衡；全景：前景在画面占比较小，背景较多，可以理解为，此时背景呈现出更多的背景元素；远景：则是指前景和背景融为一体，使得前景在画面中占比几乎为0。进一步的，以同一被拍摄主体的画面占比进行说明，可表示
为：远景<全景<中景<近景<特写。
55.景别的转换方式可以通过被摄体的画面占比确定各帧的景别类型，进而通过相邻帧的景别类型来确定景别转换方式(也可称为景别切换的运镜方式)，例如、当前帧为全景，相邻下一帧为近景，则说明镜头拉近，因此，当前帧的景别标记类型对应的景别转换方式为场景切换镜头；当前帧为全景，相邻下一帧为全景，则说明景别类型未变化，但是此时人物在两帧的画面的位置有所变化，比如从做变为右，从上变为下，因此，当前帧的景别标记类型对应的景别转换方式为垂直移动镜头或水平移动镜头。上述景别标记类型与景别转换方式之间的关系只做举例，不做具体限定。
56.其中，预设景别标记类型包括但不限于场景切换镜头、水平移动镜头、垂直移动镜头、人脸特写镜头、场景鼓掌镜头及人物起立镜头等景别或者景别切换方式(也即运镜方式)；预设音频标记类型包括音乐开启、鼓掌欢呼声、人物发言开始、人物发言结束等等声音改变而导致的音频突变。
57.需要说明的是，视频既包括画面又包括声音，因此，可通过目标8k码率视频流实现对画面以及音频对应的索引数据的确定。
58.104、当所述录播结束，则利用所述第一索引数据及所述第二索引数据生成8k录播回放视频。
59.可以理解的是，录播结束可以生成录播回放视频进行回顾观看，并且经过步骤102及103的处理，不仅可以生成细节丰富的录播回放视频，还可以得到具有索引数据的录播回放视频，使得用户可以快速索引至感兴趣的位置，减少等待时间。
60.本发明提供一种8k录播回放视频的生成方法，该方法包括：获取实时拍摄的原始视频流；按照预设8k码率对原始视频流进行编码，得到目标8k码率视频流；根据目标8k码率视频流及预设景别标记类型，确定目标8k码率视频流对应的第一索引数据，第一索引数据包括景别标记类型及与景别标记类型对应的第一时间戳，以及根据目标8k码率视频流及预设音频标记类型，确定目标8k码率视频流对应的第二索引数据，第二索引数据包括音频标记类型及与音频标记类型对应的第二时间戳；当录播结束，则利用第一索引数据及第二索引数据生成8k录播回放视频。通过对录播时的目标8k码率视频流实时进行分析，使得在录播结束时生成的8k录播回放视频包括与视频相关的第一索引数据及与音频相关的第二索引数据，使得用户在播放8k录播回放视频或编辑8k录播回放视频时，可根据索引数据实现快捷操作。
61.请继续参阅图2，图2为本发明实施例中一种8k录播回放视频的生成方法的另一流程示意图，如图2所示方法包括如下步骤：
62.201、获取实时拍摄的原始视频流；
63.202、按照预设8k码率对所述原始视频流进行编码，得到目标8k码率视频流；
64.需要说明的是，图2所示步骤201及202与图1中步骤101及102所示内容相似，为避免重复，在此不做赘述，具体可参考图1中步骤101及102所示内容。
65.203、从所述目标8k码率视频流中提取视频帧，得到视频帧集合；
66.在一种可行实现方式中，通过实时对目标8k码率视频流的视频帧进行分析，视频帧集合即目标8k码率视频流中所有视频帧，每个视频帧对应一个画面，并且随着对原始视频流的编码，目标8k码率视频流对应的视频帧也逐步增加，视频帧集合成员也不断增加，通
过对不断增加的视频帧进行实时的分析进而得到目标8k码率视频流的各个视频帧的景别标记类型。
67.204、利用所述视频帧集合及预设帧差法，确定所述视频帧集合中各个视频帧对应的景别标记类型，所述景别标记类型用于指示景别转换方式；
68.其中，预设帧差法可以为两帧差法或三帧差法等可以确定帧间像素差别的算法，通过视频帧集合以及预设帧差法得到相邻帧之间的像素差异，通过像素差异去确定景别标记类型，进而通过各个视频帧对应的相邻帧的景别标记类型指示各个视频帧景别转换方式(也即运镜方式)。这样不仅可以得到景别类型还可以通过景别类型得到景别转换方式。
69.示例性的，预设帧差法可以为三帧差法，进而步骤204具体可以包括如下步骤：
70.i、获取第二视频帧、及所述第二视频帧对应的前一视频帧及后一视频帧；
71.其中，第二视频帧是指视频帧的集合中的任一当前判断的视频帧，进一步的，视频也可以称为动态图像，其形成原因就是因为相邻帧之间差异，进而在快速播放状态下形成了连续的动态画面。因此，可以通过各个视频帧的相邻帧来推测个视频帧的景别类型以及景别转换方式。
72.ii、将所述第二视频帧、前一视频帧及后一视频帧输入所述预设帧差法，确定所述第二视频帧对应的第一运动对象、前一视频帧对应的第二运动对象及后一视频帧中对应的第三运动对象；
73.示例性的，预设帧差法为三帧差法，基本原理就是利用第二视频帧与前一视频帧对应的像素值，以及第二视频帧与后一视频帧对应的像素值进行基于像素的时间差分，通过闭值化来提取第二视频帧与两个视频帧之间的像素差异，进而确定第二视频帧以及前一视频帧及后一视频帧中的运动对象(也即运动区域)。
74.需要说明的是，在一定的环境光度的情况下，将相邻帧图像对应像素值相减得到差分图像，然后对差分图像二值化，如果对应像素值变化小于事先确定的阂值时，可以认为此处变化为背景像素引起；如果图像区域的像素值变化很大，可以认为这是由于图像中前景像素引起也即运动对象引起的，并将这些图像区域标记为前景像素，利用标记的像素区域可以确定运动目标在图像中的位置进而得到各帧的运动对象。
75.iii、利用所述第一运动对象、第二运动对象及第三运动对象的各个画面占比及预设占比阈值，以及将所述第二视频帧、前一视频帧及后一视频帧叠加生成运动轨迹，确定所述第二视频帧对应的景别标记类型，所述运动轨迹由所述第一运动对象、第二运动对象及第三运动对象构成。
76.进一步的，通过各个视频帧中各个运动对象的画面占比确定各帧的景别类型，并将各帧画面叠加使得各个运动对象在各帧所处的画面位置的不同可以确定运动对象的运动轨迹(也即根据各帧对应的运动对象所处的不同画面位置得到的位置变化)进而确定景别标记类型。
77.示例性的，预设占比阈值根据不同的景别类型其取值不同，比如，特写可以为：9/10；近景为：7/10；中景为6/10；全景：3/10；远景：趋近于0。
78.当运动对象画面占比>＝9/10，则此时运动对象对应的视频帧的景别类型为特写；当7/10<＝运动对象画面占比<9/10，则此时运动对象对应的视频帧的景别类型为近景；当6/10<＝运动对象画面占比<7/10，则此时运动对象对应的视频帧的景别类型为中景；当3/
10<＝运动对象画面占比<6/10，则此时运动对象对应的视频帧的景别类型为全景；当趋近于0<＝运动对象画面占比<3/10，则此时运动对象对应的视频帧的景别类型为远景。
79.进一步的，若前一视频帧的画面占比小于第二视频帧的画面占比并且后一视频帧的画面占比与第二视频帧的画面占比在误差允许范围内相同，则说明镜头此时被拉近，因此，此时，第二视频帧的景别切换类型为场景切换镜头。
80.若前一视频帧的画面占比在误差允许范围内与第二视频帧的画面占比相同，并且后一视频帧的画面占比大于第二视频帧的画面占比，则说明镜头此时被拉进，因此，此时，第二视频帧的景别切换类型为场景切换镜头。
81.若前一视频帧的画面占比在误差允许范围内与第二视频帧的画面占比相同，并且前一视频帧的画面占比在误差允许范围内与第二视频帧的画面占比相同，则说明景别为变化，因此若运动轨迹为由左到右或由右到左，则第二视频帧的景别切换类型为水平移动镜头；若运动轨迹为由上到下或由下到上，则第二视频帧的景别切换类型为垂直移动镜头。
82.需要说明的是，当景别类型为特写时，此时第二视频帧的景别切换类型则为特写镜头，并且根据识别的运动对象的不同进而区分不同的特写镜头，进而区分出鼓掌、人物起立、人物进场、物体展示、动作讲解等等特写镜头。示例性的，可通过各帧的像素差异去确定运动对象边界形状，通过预设深度学习模型识别出各个运动对象的类型，示例性的，运动对象可以为人、手、粉笔、耳朵、眼镜、眼睛等等被摄体。
83.205、基于所述视频帧集合中各个视频帧对应的景别标记类型，提取符合预设景别标记类型的第一视频帧；
84.206、将所述第一视频帧对应的景别标记类型关联所述第一视频帧的第一时间戳，得到所述目标8k码率视频流对应的第一索引数据；
85.其中，若第一视频帧的景别标记类型符合多种预设景别标记类型，则可以将多种景别标记类型与第一时间戳进行关联以的到第一索引数据；可选的，预设景别标记条件还可以包括标记优先级等级，若第一视频帧的景别标记类型符合多种预设景别标记类型，则可根据标记优先级等级将优先级等级最高的景别标记类型作为最终的第一视频帧的景别标记类型以得到第一索引数据。示例性的，标记优先级等级由高到低可以为：人脸特写镜头、人物起立镜头、场景鼓掌镜头、场景切换镜头、水平移动镜头、垂直移动镜头。
86.示例性的，步骤205及206中统计满足预设景别标记类型的景别标记类型，具体可由如下公式表示：
[0087][0088]
其中，f
视频索引
(t)为第一索引数据，其中t为第一时间戳，v(t)
切换
为景别标记类型为场景切换镜头，v(t)
水平
为水平移动镜头，v(t)
垂直
为垂直移动镜头，v(t)
人脸
为人脸特写镜头，v(t)
鼓掌
为场景鼓掌镜头，v(t)
起立
为人物起立镜头。
[0089]
进一步的，采用开源项目opencv作为通用的底层视频处理层进行目标8k码率视频流的第一索引数据的分析。
[0090]
207、从所述目标8k码率视频流中提取音频帧，得到音频帧集合；
[0091]
其中，音频帧集合由目标8k码率视频流中音频数据对应的各个音频帧构成的集合。
[0092]
208、利用所述音频帧集合中音频帧的声音状态参数及预设参数阈值，从所述所述音频帧集合中提取符合预设音频标记类型的目标音频帧，及所述目标音频帧的音频标记类型，所述声音状态参数包括音量幅值、声音变化趋势、音色、音轨及频段；
[0093]
在一种可行实现方式中，声音状态参数为当前录播场景对应的环境声音的声音特征构成，包括但不限于音量幅值、声音变化趋势、音色、音轨及频段。
[0094]
其中，预设参数阈值包括但不限于用于划分环境声音中的音色、音轨、频段、音量幅值以及声音变化趋势的声音特征参考阈值。
[0095]
示例性的，若当前音频帧的音量幅值大于等于预设无声幅值，则当前场景存在声音，进一步的若音色中包括乐器或旋律的音色且其频段富有节奏，则说明存在的声音包括场景音乐，进一步的若前一音频帧为无声或者音色不包括场景音乐的音色，说明当前视频帧对应的音频标记类型为场景音乐开始。
[0096]
继续以上述为例，若当前视频帧对应的下一视频帧为无声或者音量幅值减低，则说明此时声音变化趋势为减小趋势，因此当首个出现音色不存在场景音乐的音频帧，则确定对应的音频标记类型为场景音乐结束。
[0097]
则开始至结束期间各音频帧的音频标记类型均为场景音乐播放。
[0098]
进一步的，在场景音乐播放期间若任一音频帧的音色增加了人声音色且其频段处于人声频段，此时音量幅值突然增加，则该音频帧的对应的音频标记类型为个人发言开始。其中，还可以通过频段区分不同人对应的个人发言。
[0099]
需要说明的是，上述仅作举例并不做具体限定，可以理解的是，在进行各个音频标记类型的判断时，可以综合考量各个帧对应的声音特征，以及其相邻帧对应的声音特征，进而准确得出音频标记类型，其声音特征包括但不限于上述所举音量幅值、声音变化趋势、音色、音轨及频段。
[0100]
进一步的，预设音频标记类型是指音频帧集合中各声音变化节点，例如，音乐开启、鼓掌欢呼声、人物发言开始、人物发言结束等等声音变化点。
[0101]
209、将所述目标音频帧对应的音频标记类型关联所述目标音频帧对应的第二时间戳，得到所述目标8k码率视频流对应的第二索引数据；
[0102]
其中，若目标音频帧的音频标记类型符合多种预设音频标记类型，则可以将多种音频标记类型与第二时间戳进行关联以的到第二索引数据；可选的，预设音频标记类型还可以包括标记优先级等级，若目标音频帧的音频标记类型符合多种预设音频标记类型，则可根据标记优先级等级将优先级等级最高的音频标记类型作为最终的目标音频帧的音频标记类型以得到第二索引数据。示例性的，标记优先级等级由高到低可以为：鼓掌欢呼声、人物发言开始、音乐开启、人物发言结束。
[0103]
示例性的，步骤208及209中统计满足预设音频标记类型的音频标记类型，具体可由如下公式表示：
[0104][0105]
其中，f
音频索引
(t)为第二索引数据，其中t为第一时间戳，a(t)
场景音乐
为音乐开启，a(t)
鼓掌欢呼
为鼓掌欢呼声，a(t)
发言开始
为人物发言开始，a(t)
发言结束
为人物发言结束。
[0106]
进一步的，采用开源项目kaldi作为通用的底层音频处理层进行目标8k码率视频流的第一索引数据的分析。
[0107]
2010、当所述录播结束，则利用所述第一索引数据及所述第二索引数据生成8k录播回放视频。
[0108]
需要说明的是，图2中步骤2010与图1中步骤204所示内容相似，为避免重复，在此不做赘述，具体可参考图1中步骤204所示内容。
[0109]
示例性的，步骤2010具体可以包括如下步骤：
[0110]
a、获取所述第一索引数据中的第一时间戳，及获取所述第二索引数据中的第二时间戳；
[0111]
b、将所述第一索引数据中的景别标记类型与所述第一时间戳对应的视频帧进行关联，以及将所述第二索引数据中的音频标记类型与所述第二时间戳对应的音频帧进行关联，得到已关联的目标8k码率视频流；
[0112]
c、利用所述已关联的目标8k码率视频流生成8k录播回放视频。
[0113]
需要说明的是，通过在实时编码过程中时间戳将景别标记类型和视频帧关联以及将音频标记类型和音频帧关联，从而利用已关联目标8k码率视频流生成8k录播回放视频，使得录播回放视频中的各个视频帧具有索引数据，以使得用户可以根据索引数据快捷操作。并且，若已关联的视频帧和音频帧对应同一时间戳，则在播放回放视频时，则将关联音频标记类型以及景别标记类型合并，以得到合并的索引数据，进一步方便用户索引的便捷性。
[0114]
本发明提供一种8k录播回放视频的生成方法，其特征在于，该方法包括：获取实时拍摄的原始视频流；按照预设8k码率对原始视频流进行编码，得到目标8k码率视频流；根据目标8k码率视频流及预设景别标记类型，确定目标8k码率视频流对应的第一索引数据，第一索引数据包括景别标记类型及与景别标记类型对应的第一时间戳，以及根据目标8k码率视频流及预设音频标记类型，确定目标8k码率视频流对应的第二索引数据，第二索引数据包括音频标记类型及与音频标记类型对应的第二时间戳；当录播结束，则利用第一索引数据及第二索引数据生成8k录播回放视频。通过对录播时的目标8k码率视频流实时进行分析，使得在录播结束时生成的8k录播回放视频包括与视频相关的第一索引数据及与音频相关的第二索引数据，使得用户在播放8k录播回放视频或编辑8k录播回放视频时，可根据检索数据实现快捷操作，快速检索到需要的录像内容进行回看或者编辑。
[0115]
请继续参阅图3，图3为本发明实施例中一种8k录播回放视频的生成装置的结构框图，如图3所示装置包括：
[0116]
数据获取模块301：用于获取实时拍摄的原始视频流；
[0117]
数据编码模块302：用于按照预设8k码率对所述原始视频流进行编码，得到目标8k码率视频流；
[0118]
数据分析模块303：用于根据所述目标8k码率视频流及预设景别标记类型，确定所述目标8k码率视频流对应的第一索引数据，所述第一索引数据包括所述景别标记类型及与所述景别标记类型对应的第一时间戳，以及根据所述目标8k码率视频流及预设音频标记类型，确定所述目标8k码率视频流对应的第二索引数据，第二索引数据包括所述音频标记类型及与所述音频标记类型对应的第二时间戳；
[0119]
视频生成模块304：用于当所述录播结束，则利用所述第一索引数据及所述第二索引数据生成8k录播回放视频。
[0120]
需要说明的是，图3所示各模块作用与图1中各步骤所示内容相似，为避免重复，在此不做赘述，具体可参考图1中各步骤所示内容。
[0121]
本发明提供一种8k录播回放视频的生成装置，其特征在于，该装置包括：数据获取模块：用于获取实时拍摄的原始视频流；数据编码模块：用于按照预设8k码率对原始视频流进行编码，得到目标8k码率视频流；数据分析模块：用于根据目标8k码率视频流及预设景别标记类型，确定目标8k码率视频流对应的第一索引数据，第一索引数据包括景别标记类型及与景别标记类型对应的第一时间戳，以及根据目标8k码率视频流及预设音频标记类型，确定目标8k码率视频流对应的第二索引数据，第二索引数据包括音频标记类型及与音频标记类型对应的第二时间戳；视频生成模块：用于当录播结束，则利用第一索引数据及第二索引数据生成8k录播回放视频。通过对录播时的目标8k码率视频流实时进行分析，使得在录播结束时生成的8k录播回放视频包括与视频相关的第一索引数据及与音频相关的第二索引数据，使得用户在播放8k录播回放视频或编辑8k录播回放视频时，可根据检索数据实现快捷操作。
[0122]
图4示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图4所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现年龄识别方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行年龄识别方法。本领域技术人员可以理解，图4中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0123]
在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如图1或图2中任一项所示步骤。
[0124]
在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如图1或图2中任一项所示步骤。
[0125]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供
的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0126]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0127]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本技术专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘纹高;谢金元;廖海;晏瑞龙;张秋
技术所有人：深圳锐取信息技术股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。