视频偏移分析方法、装置和电子设备与流程

文档序号:21184052发布日期:2020-06-20 17:59阅读:159来源:国知局
视频偏移分析方法、装置和电子设备与流程

本发明涉及计算机视觉技术领域,特别是涉及一种视频偏移分析方法、装置和电子设备。



背景技术:

视频分析过程中,可能需要将多个视频对比分析,例如,对于舞蹈学习打分过程中,首先由老师演示一段舞蹈,然后由学员模仿,然后根据两者的相似度对学员进行打分。为了提高对于视频的分析效果,需要将两个视频对齐。然而两个视频的节奏可能不一样,相关技术中主要由工作人员手动对其视频,然而这种方式效率较低,且对其精度难以保证。



技术实现要素:

本发明实施例的目的在于提供一种视频偏移分析方法、装置和电子设备,以提高视频对齐分析的效率和精度。具体技术方案如下:

在本发明实施的第一方面,首先提供了一种视频偏移分析方法,包括以下步骤:

提取第一视频对应的第一特征序列,所述第一特征序列包括所述第一视频中的特征在第一时间序列中不同时间点对应的特征值;

提取第二视频中对应的第二特征序列,所述第二特征序列包括所述第二视频中的特征在第二时间序列中不同时间点对应的特征值;

分别计算所述第一特征序列中的每一特征与所述第二特征序列中每一特征的相似度;

分别计算每一所述相似度对应的置信度;

根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量。

可选地,所述根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量,包括:

计算不同偏移量对应的相似度权值,其中,目标偏移量对应的相似度权值为偏移量的取值为所述目标偏移量的情况下,所述第一特征序列中各特征与所述第二特征序列中相对应的特征的相似度和置信度的乘积之和;

将相似度权值对应的权重最大的偏移量作为所述第一视频和所述第二视频的相对偏移量。

可选地,所述根据所述相似度和所述相似度的置信度确定所述第一视频和所述第二视频的相对偏移量之后,还包括:

根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐。

可选地,所述根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐之后,还包括:

在对齐之后的时间序列下,计算所述第一视频和第二视频中相对应的特征在不同时间点的相似度;

根据所述第一视频和第二视频中相对应的特征在不同时间点的相似度的加权值确定所述第一视频和第二视频的相似程度。

可选地,所述第一时间序列中相邻两个时间点之间的时长等于所述第二时间序列中相邻两个时间点之间的时长。

在本发明实施的第二方面,提供了一种视频偏移分析装置,包括:

提取模块,用于提取第一视频对应的第一特征序列,所述第一特征序列包括所述第一视频中的特征在第一时间序列中不同时间点对应的特征值;

所述提取模块,还用于提取第二视频中对应的第二特征序列,所述第二特征序列包括所述第二视频中的特征在第二时间序列中不同时间点对应的特征值;

计算模块,用于分别计算所述第一特征序列中的每一特征与所述第二特征序列中每一特征的相似度;

所述计算模块,还用于分别计算每一所述相似度对应的置信度;

偏移量确定模块,用于根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量。

可选地,所述偏移量确定模块,包括:

相似度计算子模块,用于计算不同偏移量对应的相似度权值,其中,目标偏移量对应的相似度权值为偏移量的取值为所述目标偏移量的情况下,所述第一特征序列中各特征与所述第二特征序列中相对应的特征的相似度和置信度的乘积之和;

相对偏移量确定子模块,用于将相似度权值对应的权重最大的偏移量作为所述第一视频和所述第二视频的相对偏移量。

可选地,还包括对齐模块,用于根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐。

在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现以上任一所述的步骤。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如以上任一所述的视频偏移分析方法。

本发明实施例提供的视频偏移分析方法,通过计算不同特征序列中的特征在每个时间点的之间的相似度,完成总体的偏移量的概率计算,通过概率确定时间偏移量,完成两个序列的对齐,有助于简化操作,减少人工的浪费,同时,也提高了对齐结果的可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中视频偏移分析方法的流程图;

图2为本发明实施例视频偏移分析过程的示意图;

图3为本发明实施例中视频偏移分析装置的结构示意图;

图4为本发明实施例中电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

本发明提供了一种视频偏移分析方法。

在一个实施例中,如图1所示,该视频偏移分析方法包括以下步骤:

步骤101:提取第一视频对应的第一特征序列,所述第一特征序列包括所述第一视频中的特征在第一时间序列中不同时间点对应的特征值。

步骤102:提取第二视频中对应的第二特征序列,所述第二特征序列包括所述第二视频中的特征在第二时间序列中不同时间点对应的特征值。

本实施例中首先提取第一视频的第一特征序列和第二视频的第二特征序列,具体的,可以通过识别各视频中的特定对象,然后提取其中包括的特征,例如,特征点或特征线段,然后以特征向量或特征向量集合的形式记录下来。

在一个具体实施方式中,第一特征序列包括l1个时刻对应的l1个特征,记为:

第二特征序列记包括l2个时刻对应的l2个特征,记为:

其中l1和l2可以相等,也可以不相等。为了便于比较,第一时间序列中相邻两个时间点之间的时长等于第二时间序列中相邻两个时间点之间的时长。例如,相邻两个时间点之间的时长可以均设定为0.1秒、0.05秒等各种数值,显然,该数值设置的越小,越有助于提高对于第一视频和第二视频的对齐精度。

步骤103:分别计算所述第一特征序列中的每一特征与所述第二特征序列中每一特征的相似度。

本实施例中,依次计算与xb中每一个向量的相似度,然后计算与xb中每一个向量的相似度……以此类推,直至计算出第一特征序列中的每一特征与第二特征序列中每一特征的相似度。

定义计算a和b的相似度的函数为f(a,b),则其中,为t时刻的a特征与t+o时刻的b特征之间的相似度,其取值范围为(0,1],即两者完全相同时,其取值为1,两者的差别越大,其值也就越小。

步骤104:分别计算每一所述相似度对应的置信度。

定义计算a和b的相似度的函数为f′(a,b),则这里,为t时刻的a特征与t+o时刻的b特征之间的相似度的置信度,该函数的定义与f(a,b)有关,f′(a,b)的取值范围为[0,1],即置信度越高,则取值越大。

步骤105:根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量。

在获得了各特征的相似度和相似度的置信度之后,根据这两个量确定第一视频和所述第二视频的相对偏移量。

具体的,两个特征的相似度越高,且相似度的置信度越高,那么,这两个特征为相对应的特征的可能性也就越大,实施时,可以以相似度和置信度较高的特征为基准,确定两个视频的相对偏移量。

本发明实施例提供的视频偏移分析方法,通过计算不同特征序列中的特征在每个时间点的之间的相似度,完成总体的偏移量的概率计算,通过概率确定时间偏移量,完成两个序列的对齐,有助于简化操作,减少人工的浪费,同时,也提高了对齐结果的可靠性。

可选地,在一个具体实施方式中,上述步骤105包括:

计算不同偏移量对应的相似度权值,其中,目标偏移量对应的相似度权值为偏移量的取值为所述目标偏移量的情况下,所述第一特征序列中各特征与所述第二特征序列中相对应的特征的相似度和置信度的乘积之和;

将相似度权值对应的权重最大的偏移量作为所述第一视频和所述第二视频的相对偏移量。

可以理解为,其中,co代表相似度权值,其下标o即为所计算的偏移量。b序列加上偏移量,即实现了与a序列对齐。

本实施例中以xa={0,1,2,3,4}、xb={1,2,3,4,5}为例说明。本实施例中以为例说明。

显然,实际使用的相似度计算函数和置信度计算函数并不局限于此,所使用的函数本身可参考相关技术,此处不做进一步限定和描述。

设定o的取值范围为[-2,2],经过计算,能够获得:

带入上述数据能够计算得到,c1的值最大,所以计算得到的相对偏移量为1。

可选地,所述根据所述相似度和所述相似度的置信度确定所述第一视频和所述第二视频的相对偏移量之后,还包括:

根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐。

在确定了第一视频和第二视频之间的相对偏移量之后,根据该相对偏移量对第一视频和第二视频做出调整,即可实现使第一视频和第二视频对齐。

例如,上述计算过程中,两者的相对偏移量为1,那将第二视频的序列整体右移一个单位时长,即可实现两者的对齐。

可选地,所述根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐之后,还包括:

在对齐之后的时间序列下,计算所述第一视频和第二视频中相对应的特征在不同时间点的相似度;

根据所述第一视频和第二视频中相对应的特征在不同时间点的相似度的加权值确定所述第一视频和第二视频的相似程度。

在两个视频对其之后,可以认为,在每一帧视频图像中,其特征均是相对应的,这样,通过在对齐之后的时间序列下,计算相对应的特征在不同时间点的相似度,并赋予其不同的权值,即可实现确定第一视频和第二视频的相似度。

以第一视频为老师的舞蹈,第二视频为学员的模仿为例说明。

如图2所示,由左到右的五张图片中,第一张为学员的模仿舞蹈,第二张为老师的舞蹈,第三张为学员模仿舞蹈所提取的特征图,第四张为老师的舞蹈所提取的特征图,第五张为学员模仿舞蹈所提取的特征图和老师的舞蹈所提取的特征图的对比图。其中,第一张图片和第二张图片为对齐后的视频对应的同一时间点的一帧图像。

在将第一视频和第二视频对齐之后,可以认为,第二视频中的学员的每一动作都在模仿老师的动作,这样,可以通过捕捉相应的特征,例如头、手臂、关节等来评估老师和学员的动作的相似程度。显然,相似程度越高,则证明学员模仿的越好。

也就是说,在提取了学员的特征和老师的特征后,通过对两组特征进行对比,并计算相似度,从而确定学员对于老师的舞蹈的模仿效果,对学员的模仿结果进行打分。

进一步的,对于准备阶段来说,赋予其较低的权值,例如0,对于舞蹈进行阶段,赋予其较高的权值,这样,能够区分视频不同部分的重要程度,提高对于视频的分析效果和分析结果,同时,基于关键点作为特征进行对齐,还能够避免使用图像信息进行大量计算完成对齐。

本发明还提供了一种视频偏移分析装置300,如图3所示,包括:

提取模块301,用于提取第一视频对应的第一特征序列,所述第一特征序列包括所述第一视频中的特征在第一时间序列中不同时间点对应的特征值;

所述提取模块301,还用于提取第二视频中对应的第二特征序列,所述第二特征序列包括所述第二视频中的特征在第二时间序列中不同时间点对应的特征值;

计算模块302,用于分别计算所述第一特征序列中的每一特征与所述第二特征序列中每一特征的相似度;

所述计算模块302,还用于分别计算每一所述相似度对应的置信度;

偏移量确定模块303,用于根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量。

可选地,所述偏移量确定模块303,包括:

相似度计算子模块,用于计算不同偏移量对应的相似度权值,其中,目标偏移量对应的相似度权值为偏移量的取值为所述目标偏移量的情况下,所述第一特征序列中各特征与所述第二特征序列中相对应的特征的相似度和置信度的乘积之和;

相对偏移量确定子模块,用于将相似度权值对应的权重最大的偏移量作为所述第一视频和所述第二视频的相对偏移量。

可选地,还包括对齐模块,用于根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐。

可选地,还包括:

相似度计算模块,用于在对齐之后的时间序列下,计算所述第一视频和第二视频中相对应的特征在不同时间点的相似度;

相似度确定模块,用于根据所述第一视频和第二视频中相对应的特征在不同时间点的相似度的加权值确定所述第一视频和第二视频的相似程度。

可选地,所述第一时间序列中相邻两个时间点之间的时长等于所述第二时间序列中相邻两个时间点之间的时长。

本实施例的视频偏移分析装置300能够实现上述建模方法实施例的各个步骤,并能实现基本相同的技术效果,此处不再赘述。

本发明实施例还提供了一种电子设备,如图4所示,包括处理器41、通信接口42、存储器43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信,

存储器43,用于存放计算机程序;

处理器41,用于执行存储器43上所存放的程序时,实现如下步骤:

提取第一视频对应的第一特征序列,所述第一特征序列包括所述第一视频中的特征在第一时间序列中不同时间点对应的特征值;

提取第二视频中对应的第二特征序列,所述第二特征序列包括所述第二视频中的特征在第二时间序列中不同时间点对应的特征值;

分别计算所述第一特征序列中的每一特征与所述第二特征序列中每一特征的相似度;

分别计算每一所述相似度对应的置信度;

根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量。

可选地,所述根据所述相似度和所述相似度对应的置信度确定所述第一视频和所述第二视频的相对偏移量,包括:

计算不同偏移量对应的相似度权值,其中,目标偏移量对应的相似度权值为偏移量的取值为所述目标偏移量的情况下,所述第一特征序列中各特征与所述第二特征序列中相对应的特征的相似度和置信度的乘积之和;

将相似度权值对应的权重最大的偏移量作为所述第一视频和所述第二视频的相对偏移量。

可选地,所述根据所述相似度和所述相似度的置信度确定所述第一视频和所述第二视频的相对偏移量之后,还包括:

根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐。

可选地,所述根据所计算的所述相对偏移量将所述第一视频和所述第二视频对齐之后,还包括:

在对齐之后的时间序列下,计算所述第一视频和第二视频中相对应的特征在不同时间点的相似度;

根据所述第一视频和第二视频中相对应的特征在不同时间点的相似度的加权值确定所述第一视频和第二视频的相似程度。

可选地,所述第一时间序列中相邻两个时间点之间的时长等于所述第二时间序列中相邻两个时间点之间的时长。

上述终端提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的建模方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的建模方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1