本申请涉及计算机视觉,尤其涉及一种摘要视频生成方法、装置、设备及介质。
背景技术:
1、由于数字多媒体信息传输中图像、视频等数据的大规模增加,可能出现信息过载的现象,导致用户或电子设备无法在大量数据中查询到所需要的信息。而视频摘要技术能够从原始的长视频中提取关键部分作为摘要视频,使得视频总时长缩短的同时包含有意义的视频片段。
2、现有技术中大多基于客观通用式的视频摘要设计思路,即针对一个原始的长视频,生成一个摘要视频,且该摘要视频具有唯一性。
3、但是在不同场景下针对同一原始视频可能存在不同需求,唯一的摘要视频无法满足不同且多样的查看需求,并且在唯一的摘要视频中,某一用户的隐私信息可能被其他用户查看到,还可能导致用户的隐私信息被泄露。
技术实现思路
1、本申请提供了一种摘要视频生成方法、装置、设备及介质,用以解决现有技术无法满足查询需求以及用户的隐私信息被泄露的问题。
2、第一方面,本申请提供了一种摘要视频生成方法,所述方法包括:
3、获取待生成摘要视频的第一视频和摘要视频的查询条件;
4、通过摘要视频生成模型,生成所述第一视频的第一摘要视频。
5、第二方面,本申请提供了一种摘要视频生成装置,所述装置包括:
6、获取单元,用于获取待生成摘要视频的第一视频和摘要视频的查询条件;
7、生成单元,用于通过摘要视频生成模型,生成所述第一视频的第一摘要视频。
8、第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于执行存储器中存储的计算机程序时实现上述摘要视频生成方法的步骤。
9、第四方面,本申请提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述摘要视频生成方法的步骤。
10、由于在本申请中,电子设备可以获取到待生成摘要视频的第一视频和摘要视频的查询条件,这样通过摘要视频生成模型,可以生成该第一视频的第一摘要视频。可见,通过从原始视频中提取摘要视频,可以缩短原始视频的时长,并且通过查询条件进行筛选,可以保留原始视频中对用户来说有意义的内容,从而适应不同场景下不同用户的查询需求,满足用户多样的个性化需求以及避免用户的隐私信息被泄露。
1.一种摘要视频生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述通过摘要视频生成模型,生成所述第一视频的第一摘要视频,包括:
3.如权利要求1或2所述的方法,其特征在于,所述摘要视频的查询条件根据用户输入的语义信息确定。
4.如权利要求2所述的方法,其特征在于,所述获取待生成摘要视频的第一视频和摘要视频的查询条件,包括:
5.如权利要求4所述的方法,其特征在于,所述确定所述第一视频中与所述查询条件匹配的至少一个第一视频片段,包括:
6.如权利要求5所述的方法,其特征在于,所述确定每个第二视频片段的特征向量,包括:
7.如权利要求1所述的方法,其特征在于,所述查询条件包括以下一种或多种信息:摘要视频与所述第一视频的时长比例、地点、物体类别、人体动作。
8.一种摘要视频生成装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7任一所述摘要视频生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-7中任一所述摘要视频生成方法的步骤。