本申请涉及数据处理,特别是涉及一种视频台词生成方法、装置、电子设备及存储介质。
背景技术:
1、在视频平台中,可以通过截取长视频中的部分内容生成短视频的方式,对长视频进行推广传播。在生成短视频的过程中,需要依赖已存储的长视频台词指导短视频的台词生产,从而对短视频的台词内容进行记录,便于后续的查询及使用。
2、具体来说,首先可以统计长视频中台词所在的画面区域,即长视频台词区域,然后,根据短视频与长视频的时间点位对应关系,以长视频台词区域为参考,确定短视频中台词所在的画面区域,作为短视频台词区域,进而,通过对短视频台词区域进行文本检测、追踪与过滤,得到短视频台词。
3、但是,一些情况下,长视频会被重转,如图1所示,重转后,其时长和尺寸可能会发生一定的变化,导致重转后的长视频与已存储的长视频台词存在时间或位置偏移,如果此时基于重转后的长视频截取短视频,则短视频中台词同样与已存储的长视频台词存在偏移,那么,基于已存储的长视频台词指导短视频的台词生产,将导致短视频的台词识别准确率较低。
技术实现思路
1、为解决上述技术问题,本申请示出了一种视频台词生成方法、装置、电子设备及存储介质,以至少解决相关技术中基于重转后的长视频截取的短视频与已存储的长视频台词存在时间偏移,使得基于已存储的长视频台词指导短视频的台词生产,将导致短视频的台词识别准确率较低的问题。本公开的技术方案如下:
2、第一方面,本申请示出了一种视频台词生成方法,所述方法包括:
3、获取原始视频的第一台词、第二视频相比于所述原始视频的偏移类型及所述第二视频的第二台词;第一视频在对所述原始视频进行重转后得到,所述第二视频基于所述第一视频对应于目标时间点位的视频片段生成;
4、基于所述目标时间点位及所述偏移类型,从所述第一台词中截取参考台词;
5、根据所述参考台词及所述偏移类型,对所述第二台词进行过滤,得到所述第二视频的目标台词。
6、第二方面,本发明实施例提供了一种视频台词生成装置,包括:
7、获取模块,用于获取原始视频的第一台词、第二视频相比于所述原始视频的偏移类型及所述第二视频的第二台词;第一视频在对所述原始视频进行重转后得到,所述第二视频基于所述第一视频对应于目标时间点位的视频片段生成;
8、截取模块,用于基于所述目标时间点位及所述偏移类型,从所述第一台词中截取参考台词;
9、过滤模块,用于根据所述参考台词及所述偏移类型,对所述第二台词进行过滤,得到所述第二视频的目标台词。
10、第三方面,本发明实施例提供了一种电子设备,包括:
11、处理器;
12、用于存储所述处理器可执行指令的存储器;
13、其中,所述处理器被配置为执行所述指令,以实现上述任一项所述的视频台词生成方法。
14、第四方面,本发明实施例提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由视频台词生成电子设备的处理器执行时,使得视频台词生成电子设备能够执行上述任一项所述的视频台词生成方法。
15、第五方面,本发明实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的视频台词生成方法。
16、与现有技术相比,本申请包括以下优点:
17、获取第一视频的原始台词、第二视频相比于原始视频的偏移类型及第二视频的第二台词;第一视频在对原始视频进行重转后得到,第二视频基于第一视频对应于目标时间点位的视频片段生成;基于目标时间点位及偏移类型,从第一台词中截取参考台词;根据参考台词及偏移类型,对第二台词进行过滤,得到第二视频的目标台词。
18、这样,在原始视频重转后的第一视频相比于原始视频发生变化,导致基于第一视频生成的第二视频相对于原始视频发生偏移的情况下,在生产第二视频的目标台词时,先根据第二视频对应的目标时间点位及第二视频相比于原始视频的偏移类型,从基于原始视频生产的第一台词中截取参考台词,然后,基于参考台词和偏移类型对第二台词进行修正,通过原始视频的参考台词指导第二视频进行目标台词的生产,从而消除第二视频与原始视频之间的偏移,最终得到与第二视频相匹配的较为准确的目标台词,提高目标台词的识别准确率,便于后续的查询和使用。
1.一种视频台词生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取第二视频相比于所述原始视频的偏移类型,包括:
3.根据权利要求2所述的方法,其特征在于,所述检测所述候选文本框与所述第一台词在所述原始视频中的位置信息是否匹配,并将与所述位置信息相匹配的所述候选文本框作为候选台词框,包括:
4.根据权利要求2所述的方法,其特征在于,所述获取所述第二视频的第二台词,包括:
5.根据权利要求2所述的方法,其特征在于,所述获取所述第二视频的第二台词,包括:
6.根据权利要求5所述的方法,其特征在于,所述生成所述待处理文本框的热度图,包括:
7.根据权利要求5所述的方法,其特征在于,所述基于所述热度图对所述位置信息进行更新,包括:
8.根据权利要求1所述的方法,其特征在于,所述基于所述目标时间点位及所述偏移类型,从所述第一台词中截取参考台词,包括:
9.根据权利要求1所述的方法,其特征在于,所述根据所述参考台词及所述偏移类型,对所述第二台词进行过滤,得到所述第二视频的目标台词,包括:
10.根据权利要求1所述的方法,其特征在于,所述基于所述目标时间点位及所述偏移类型,从所述第一台词中截取参考台词,包括:
11.根据权利要求1所述的方法,其特征在于,所述根据所述参考台词及所述偏移类型,对所述第二台词进行过滤,得到所述第二视频的目标台词,包括:
12.根据权利要求11所述的方法,其特征在于,所述根据所述偏移时间及所述第一台词,对所述第二台词进行过滤,得到所述第二视频的目标台词,包括:
13.一种视频台词生成装置,其特征在于,包括:
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至12中任一项所述的视频台词生成方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的视频台词生成方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12任一项所述的视频台词生成方法。