专利名称:提供影像播放时的字幕翻译系统及其方法
技术领域:
本发明涉及一种字幕翻译系统及其方法,尤其涉及一种提供影像播放时的字幕翻译系统及其方法。
背景技术:
近年来,现代人越来越重视知识交流与休闲活动,观看影像成为许多人休闲活动的选择之一,并且随着国际化的发展趋势,信息的传播比以往更广阔,常会在播放的影像上出现许多不同语言的字幕,由此,使用者除了可以通过观看影像来进行休闲活动之外,还可以通过观看影像来进行语言学习。对于使用外语字幕的影像来说,早期使用者则需要通过额外的翻译功能,来进行外语字幕的字词翻译,才能了解外语字幕所要表达的意思,但是使用额外的翻译功能则会让使用者反复的切换影像播放窗口以及翻译功能窗口,对此,则会造成使用者操作的困扰。然而,随着科技的发展,提出了一种光学字符识别(Optical CharacterRecognition, OCR)技术,这种技术可以将图像中的文字进行识别,可以让图像中的文字转换成文字,由此,在影像播放中,可以通过撷取包含有外语字幕的影像,并通过光学字符识别对影像中的外语字幕进行识别,即可以识别出外语字幕,即可以直接地对外语字幕进行翻译,可以大幅度地简化使用者的反复操作。不过,光学字符识别还是存在缺点,即仍然具有文字识别错误的问题,因此,使用者还是要进一步地进行文字识别结果的校正,才能确保所识别出的外语字幕是正确的,而对于外语字幕的翻译结果也才会是正确的。综上所述,可知现有技术中长期以来一直存在对于影像采用光学字符识别技术识别字幕需要进一步校正识别字幕结果,再进行字幕翻译的问题,因此有必要提出改进的技术手段,来解决此问题。
发明内容
有鉴于现有技术存在对于影像采用光学字符识别技术识别字幕需要进一步校正识别字幕结果,再进行字幕翻译的问题,本发明提供了一种提供影像播放时的字幕翻译系统及其方法,其中:本发明所提供的提供影像播放时的字幕翻译系统,在第一实施例中包含:接收模块、影像播放模块、搜寻模块、控制模块、时间撷取模块、查询模块、翻译模块以及储存模块。其中,接收模块用以接收字词;影像播放模块用以播放影像,以及依据回放信号从暂停时间重新播放影像,其中,影像由影像档案与字幕档案组合而成,影像档案包含时间轴,字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容;在影像播放时,搜寻模块搜寻影像的时间轴对应的字幕资料的字幕内容是否具有字词;控制模块当搜寻模块搜寻到字幕内容具有字词时,暂停影像的播放;时间撷取模块用以撷取影像暂停播放时时间轴的时间为暂停时间;查询模块从字幕档案中查询出具有暂停时间的时间信息,并查询出与时间信息对应的字幕内容;翻译模块将字词翻译为翻译字词;储存模块在字幕内容的字词之后新增翻译字词并重新储存字幕档案,并触发回放信号。本发明所提供的提供影像播放时的字幕翻译方法,在第一实施例中包含下列步骤:首先,接收字词;接着,播放影像,其中,影像由影像档案与字幕档案组合而成,影像档案包含时间轴,字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容;接着,在影像播放时,搜寻影像的时间轴对应的字幕资料的字幕内容是否具有字词;接着,当搜寻到字幕内容具有字词时,暂停影像的播放;接着,撷取影像暂停播放时时间轴的时间为暂停时间;接着,从字幕档案中查询出具有暂停时间的时间信息,并查询出与时间信息对应的字幕内容;接着,将字词翻译为翻译字词;接着,在字幕内容的字词之后新增翻译字词并重新储存字幕档案,并触发回放信号;最后,依据回放信号从暂停时间重新播放影像。本发明所提供的提供影像播放时的字幕翻译系统,在第二实施例中包含:影像播放模块、字词选取模块、接收模块、翻译模块以及显示模块。其中,影像播放模块用以播放影像,其中,影像由影像档案与字幕档案组合而成,影像档案包含时间轴,字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容;字词选取模块在影像播放时,根据使用者的指令定位当前播放的影像档案的时间轴位置,并以供使用者选取的方式提供时间轴位置对应的字幕资料中的字幕内容;接收模块用以接收使用者从时间轴位置对应的字幕资料中的字幕内容中选定的字词;翻译模块从翻译词库或网络词库中查询被选定的字词对应的翻译字词;显示模块用于显示翻译字词。本发明所提供的提供影像播放时的字幕翻译方法,在第二实施例中包含下列步骤:首先,播放影像,其中,影像由影像档案与字幕档案组合而成,影像档案包含时间轴,字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容;接着,在影像播放时,根据使用者的指令定位当前播放的影像档案的时间轴位置,并以供使用者选取的方式提供时间轴位置对应的字幕资料中的字幕内容;接着,接收使用者从时间轴位置对应的子.资料中的子.内各中选定的子词;接着,从翻译词库或网络词库中查询被选定的子词对应的翻译字词;最后,显示翻译字词。本发明所提供的系统与方法如上,与现有技术之间的差异在于本发明是在影像播放时,搜寻影像的时间轴对应的字幕资料的字幕内容是否具有使用者所输入的字词,当搜寻到字幕内容具有字词时,暂停影像的播放,并依据影像暂停时的暂停时间从字幕档案中查询出具有暂停时间的时间信息以及字幕内容,并将字词翻译为翻译字词,即可在字幕内容的字词之后新增翻译字词并重新储存字幕档案,最后依据回放信号从暂停时间重新播放影像。通过上述的技术手段,本发明可以达到在影像播放时对影像字幕可直接进行翻译的技术效果。
图1为本发明第一实施例提供影像播放时的字幕翻译系统方框图。
图2为本发明第一实施例提供影像播放时的字幕翻译方法流程图。图3为本发明第一实施例提供影像播放时的字幕翻译的使用者界面示意图。图4A为本发明第一实施例提供影像播放时的字幕翻译的影像档案与字幕档案示意图。图4B为本发明第一实施例提供影像播放时的字幕翻译的字幕档案内容示意图。图5为本发明第一实施例提供影像播放时的字幕翻译的重新储存字幕档案内容示意图。图6为本发明第一实施例提供影像播放时的字幕翻译的影像重新播放示意图。图7为本发明第一实施例提供影像播放时的字幕翻译的字幕记录档案内容示意图。图8A为本发明第一实施例提供影像播放时的字幕翻译的字幕档案全文翻译内容示意图。图SB为本发明第一实施例提供影像播放时的字幕翻译的影像播放结果示意图。图9为本发明第二实施例提供影像播放时的字幕翻译系统方框图。
图10为本发明第二实施例提供影像播放时的字幕翻译方法流程图。图11为本发明第二实施例提供影像播放时的字幕翻译的使用者界面示意图。图12A为本发明第二实施例提供影像播放时的字幕翻译的翻译解释第一呈现方式显示示意图。图12B为本发明第二实施例提供影像播放时的字幕翻译的翻译解释第二呈现方式显示示意图。主要部件附图标记说明11接收模块12影像播放模块13搜寻模块14控制模块15时间撷取模块16查询模块17翻译模块18储存模块19预处理模块20使用者界面21输入区域22影像播放区域23选取区域31影像档案32字幕档案321第一字幕资料322第二字幕资料323第三字幕资料
33字幕记录档案41影像播放模块42字词选取模块43接收模块44翻译模块45显示模块步骤110接收字词步骤120播放影像步骤130在影像播放时,搜寻影像的时间轴对应的字幕资料的字幕内容是否具有字词步骤140当搜寻到字幕内容具有字词时,暂停影像的播放步骤150撷取影像暂停播放时时间轴的时间为暂停时间步骤160从字幕档案中查询出具有暂停时间的时间信息,并查询出与时间信息对应的字幕内容步骤170将字词翻译为翻译字词步骤180在字幕内容的字词之后新增翻译字词并重新储存字幕档案,并触发回放信号步骤190依据回放信号从暂停时间重新播放影像步骤210将与时间信息对应的字幕内容另存为字幕记录档案步骤220在影像播放前,预先将字幕档案的每一个字幕资料的字幕内容进行全文翻译步骤230重新储存字幕档案步骤310播放影像步骤320在影像播放时,根据使用者的指令定位当前播放的影像档案的时间轴位置,并以供使用者选取的方式提供时间轴位置对应的字幕资料中的字幕内容步骤330接收使用者从时间轴位置对应的字幕资料中的字幕内容中选定的字词步骤340从翻译词库或网络词库中查询被选定的字词对应的翻译字词步骤350显示翻译字词
具体实施例方式以下将结合附图及实施例来详细说明本发明的实施方式,由此对本发明如何应用技术手段来解决技术问题并达到技术效果的实现过程能充分理解并据以实施。以下首先要说明本发明所提供的提供影像播放时的字幕翻译系统的第一实施例,并请参照图1所示,图1所示为本发明第一实施例提供影像播放时的字幕翻译系统方框图。本发明所提供的第一实施例提供影像播放时的字幕翻译系统,其包含:接收模块
11、影像播放模块12、搜寻模块13、控制模块14、时间撷取模块15、查询模块16、翻译模块17以及储存模块18。在通过影像播放模块12播放影像之前,使用者可以在本发明提供影像播放时的字幕翻译系统所提供的使用者界面中输入要查询的字词,而接收模块11即会接收到使用者在使用者界面中所输入的字词,接着,即可以由影像播放模块12播放影像。值得注意的是,由影像播放模块12所播放的影像由影像档案31与字幕档案32组合而成,影像档案31即可包含有影像内容、音源内容(包含有:音乐、音效、声音等)以及时间轴,即在影像播放时,会依据时间轴的时间播放影像内容与音源内容,而字幕档案32包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容,时间信息包含有起始时间以及终止时间,亦即表示依据时间轴的时间播放影像时,在时间轴的时间为起始时间以及终止时间之间会显示字幕内容。具体而言,假设字幕档案32包含有第一字幕资料、第二字幕资料以及第三字幕资料,而第一字幕资料的第一时间信息为“00:01:32,800 (起始时间)-> 00:01:36, 500 (终止时间)”以及第一字幕资料的第一字幕内容为“This is acomputer.”;第二字幕资料的第二时间信息为“00:01:37,580(起始时间)-> 00:01:40, 170(终止时间),,以及第二字幕资料的第二字幕内容为“This is arouter.”;以及第三字幕资料的第三时间信息为“00:01:48,200 (起始时间)-> 00:01:51,690 (终止时间)”以及第三字幕资料的第三字幕内容为“This is anotebook.”,上述仅为举例说明,并不以此局限本发明的应用范畴。 接着,搜寻模块13会在影像播放模块12播放影像的同时,对影像的时间轴对应的字幕资料的字幕内容进行搜寻的动作,即搜寻模块13会搜寻影像的时间轴对应的字幕资料的字幕内容是否具有接收模块11所接收的字词。根据上述举例,假设使用者在使用者界面所输入的字词为“router”,搜寻模块13即会在影像的时间轴的时间为“00:01:32”至“00:01:36”之间搜寻对应的第一字幕资料的第一字幕内容为“This is a computer.”是否具有字词“router” ;接着,会在影像的时间轴的时间为“00:01:37”至“00:01:40”之间搜寻对应的第二字幕资料的第二字幕内容为“This is a router.”是否具有字词“router” ;以及会在影像的时间轴的时间为“00:01:48”至“00:01:51”之间搜寻对应的第三字幕资料的第三字幕内容为“This is anotebook.” 是否具有字词 “router”。接着,当搜寻模块13搜寻到影像的时间轴对应的字幕资料的字幕内容具有接收模块11所接收的字词时,会再通过控制模块14暂停影像的播放,与此同时,时间撷取模块15即会撷取影像暂停播放时时间轴的时间为暂停时间。根据上述举例,搜寻模块13在影像的时间轴的时间为“ 00:01:37 ”至“ 00:01:40 ”之间搜寻对应的第二字幕资料的第二字幕内容为“This is arouter.”,搜寻模块13即会搜寻出第二字幕内容为“This is a router.”具有字词“router”,再通过控制模块14暂停影像的播放,与此同时,时间撷取模块15即会撷取影像暂停播放时时间轴的时间假设为“00:01:38”为暂停时间,即暂停时间为“00:01:38”。接着,查询模块16即会从字幕档案32中查询出具有暂停时间的时间信息,并查询出与时间信息对应的字幕内容,接着,翻译模块17将字词翻译为翻译字词,翻译模块17可以直接对字词翻译为翻译字词,或是翻译模块17可以通过网络对字词翻译为翻译字词,并且将字词翻译为翻译字词请参照现有技术,在此不再进行赘述,现有的字词翻译方式应包含于本发明之内。根据上述举例,查询模块16即会从字幕档案32中查询第一字幕资料的第一时间信息为“00:01:32,800- > 00:01:36, 500”不具有暂停时间“00:01:38” ;接着,查询模块16即会自字幕档案32中查询第二字幕资料的第二时间信息为“00:01:37,580- >00:01:40, 170”具有暂停时间“00:01:38”;以及查询模块16即会自字幕档案32中查询第三字幕资料的第三时间信息为“00:01:48,200- > 00:01:51,690"不具有暂停时间“00:01:38”。并且查询模块16会查询出与第二时间信息为“00:01:37,580- >00:01:40, 170”对应的第二字幕内容为“This isa router.”,并且翻译模块17即会将字词“router”翻译为翻译字词“路由器”。当翻译模块17将字词翻译为翻译字词之后,即可通过储存模块18在查询模块16所查询出的字幕内容的字词之后新增翻译字词并重新储存字幕档案32,并同时触发回放信号,而影像播放模块12即会依据回放信号从暂停时间重新播放该影像,而使用者即可以在影像中看到字词的翻译结果。根据上述举例,翻译模块17在将字词“router”翻译为翻译字词“路由器”之后,储存模块18即会将翻译字词“路由器”新增于第二字幕内容为“This is arouter.”的“router”之后,并重新储存字幕档案32,由此,第二字幕内容即会被修改为“This is arouter路由器.”,并且储存模块18会触发回放信号,而影像播放模块12即会依据回放信号从暂停时间为“00:01:38”重新播放影像,而使用者即可以在影像时间轴“00:01:37”至“00:01:40”看到字幕为“This isa router路由器.”。除此之外,储存模块18还可以将查询模块16所查询出与时间信息对应的字幕内容另存为字幕记录档案,由此提供使用者不用再通过影像的播放来进行字幕内容的阅读,提供使用者进一步的学习效果,并且字幕记录档案可以为可扩展标记语言(extensibleMarkup Language, XML)档案格式、超文件标记语言(hypertext Markup Language, HTML)档案格式、纯文本文件格式以及一般常用文书处理档案格式其中之一。本发明的提供影像播放时的字幕翻译系统还可以包含预处理模块19,预处理模块19在影像播放前,预先将字幕档案3`2的每一个字幕资料的字幕内容进行全文翻译,并由储存模块18重新储存字幕档案32,此时,重新储存的字幕档案32即会包含多个字幕资料,每一个字幕资料包含时间信息、字幕内容与翻译字幕内容,由此在通过影像播放模块12播放影像时,提供双语字幕的显示。接着,将以一个实施例来解释本发明第一实施例的运作方式及流程,以下实施例将结合图1以及图2所示进行说明,图2所示为本发明第一实施例提供影像播放时的字幕翻译方法流程图。请参照图3所示,图3所示为本发明第一实施例提供影像播放时的字幕翻译的使用者界面示意图。在通过影像播放模块12播放影像之前,使用者可以在本发明所提供的使用者界面20中的输入区域21输入要查询的字词为“router”,而接收模块11即会接收到使用者在输入区域21中所输入的字词为“router”(步骤110),接着,即可以由影像播放模块12将影像播放于使用者界面20的影像播放区域22中(步骤120),使用者界面20中的输入区域21在此仅为示意说明,并不以此局限本发明的应用范畴,输入区域21也可以以浮动窗口加以呈现,而影像播放的示意请参照图3所示。接着,请参照图4A以及图4B所示,图4A所示为本发明第一实施例提供影像播放时的字幕翻译的影像档案与字幕档案示意图;图4B所示为本发明第一实施例提供影像播放时的字幕翻译的字幕档案内容示意图。影像播放模块12所播放的影像是由影像档案31与字幕档案32组合而成的,在实施例中,字幕档案32包含有第一字幕数据321、第二字幕资料322以及第三字幕资料323,而第一字幕数据321的第一时间信息为“00:01:32,800 (起始时间)-> 00:01:36, 500 (终止时间)”以及第一字幕数据321的第一字幕内容为“This is a computer.”;第二字幕资料322的第二时间信息为“00:01:37, 580 (起始时间)-> 00:01:40, 170 (终止时间)”以及第二字幕资料322的第二字幕内容为“This is a router.” ;以及第三字幕资料323的第三时间信息为“00:01:48, 200 (起始时间)-> 00:01:51,690 (终止时间)”以及第三字幕资料323的第三字幕内容为“This is a notebook.”。接着,由于接收模块11所接收到的字词为“router”,搜寻模块13即会在影像的时间轴的时间为“ 00:01:32 ”至“ 00:01:36 ”之间搜寻对应的第一字幕资料321的第一字幕内容为“This is a computer.”是否具有字词“router”(步骤130);接着,会在影像的时间轴的时间为“00:01:37”至“00:01:40”之间搜寻对应的第二字幕资料322的第二字幕内容为“This is a router.”是否具有字词“router”(步骤130);以及会在影像的时间轴的时间为“00:01:48”至“00:01:51”之间搜寻对应的第三字幕资料323的第三字幕内容为“This is a notebook.” 是否具有字词 “router”(步骤 130)。在实施例中,搜寻模块13即会搜寻出第二字幕资料322的第二字幕内容为“Thisis a router.”具有字词“router”,再通过控制模块14暂停影像的播放(步骤140),与此同时,时间撷取模块15即会撷取影像暂停播放时时间轴的时间“00:01:38”为暂停时间(步骤150,并请参照图3所示),即暂停时间为“00:01:38”。接着,查询模块16即会从字幕档案32中查询出第二字幕资料322的第二时间信息为“ 00:01:37,580- > 00:01:40,170 ”具有暂停时间“ 00:01:38 ”,并且查询模块16会查询出与第二时间信息为“00:01:37,580- > 00:01:40, 170”对应的第二字幕内容为“Thisis a router.” (步骤160),并且翻译模块17即会将字词“router”翻译为翻译字词“路由器”(步骤170)。 接着,请参照图5所示,图5所示为本发明第一实施例提供影像播放时的字幕翻译的重新储存字幕档案内容示意图。在翻译模块17将字词“router”翻译为翻译字词“路由器”之后,储存模块18即会将翻译字词为“路由器”新增于第二字幕内容为“This is a router.”的“router”之后,并重新储存字幕档案32 (步骤180),由此,第二字幕内容即会被修改为“This is a router路由器I ”,并且储存模块18会触发回放信号(步骤180),而影像播放模块12即会依据回放信号从暂停时间为“00:01:38”重新播放影像(步骤190),重新播放影像的示意请参照图6所示,图6所示为本发明第一实施例提供影像播放时的字幕翻译的影像重新播放示意图,而使用者即可以在影像时间轴“00:01:37”至“00:01:40”看到字幕为“This is arouter路由器.”。接着,请参照图7所示,图7所示为本发明第一实施例提供影像播放时的字幕翻译的字幕记录档案内容示意图。储存模块18还可以将查询模块16所查询出与第二时间信息“00:01:37,580- >00:01:40,170”对应的第二字幕内容“This is a router.”另存为字幕记录档案33 (步骤210),由此提供使用者不用再通过影像的播放来进行字幕内容的阅读,提供使用者进一步的学习效果。接着,请参照图8A以及图SB所示,图8A所示为本发明第一实施例提供影像播放时的字幕翻译的字幕档案全文翻译内容示意图;图8B所示为本发明第一实施例提供影像播放时的字幕翻译的影像播放结果示意图。本发明还可以包含预处理模块19,预处理模块19在影像播放模块12播放影像前,预先将字幕档案32的每一个字幕资料的字幕内容进行全文翻译(步骤220),字幕档案32的全文翻译结果请参照图8A所示,并由储存模块18重新储存字幕档案32 (步骤230),此时,重新储存的字幕档案32即会包含多个字幕资料,每一个字幕资料包含时间信息、字幕内容与翻译字幕内容,由此在通过影像播放模块12播放影像时,提供双语字幕的显示,其影像播放结果示意请参照图8B所示。接着,要说明本发明所提供的提供影像播放时的字幕翻译系统的第二实施例,并请参照图9所示,图9所示为本发明第二实施例提供影像播放时的字幕翻译系统方框图。本发明所提供的第二实施例提供影像播放时的字幕翻译系统,其包含:影像播放模块41、字词选取模块42、接收模块43、翻译模块44以及显示模块45。影像播放模块41会直接播放影像,由影像播放模块41所播放的影像是由影像档案31与字幕档案32组合而成,影像档案31即可包含有影像内容、音源内容(包含有:音乐、音效、声音等)以及时间轴,即在影像播放时,会依据时间轴的时间播放影像内容与音源内容,而字幕档案32包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容,时间信息包含有起始时间以及终止时间,亦即表示依据时间轴的时间播放影像时,会在时间轴的时间为起始时间以及终止时间之间显示字幕内容。接着,即可通过字词选取模块42在影像播放模块41对影像进行播放时,根据使用者的指令定位当前播放的影像档案的时间轴位置,并以供使用者选取的方式提供时间轴位置对应的字幕资料中的字幕内容。接着,当使用者在被提供时间轴位置对应的字幕资料中的字幕内容中选取字词之后,即可由接收模块43接收使用者从时间轴位置对应的字幕资料中的字幕内容中选定的字词。接着,会再通过翻译模块44从翻译词库或网络词库中查询被选定的字词对应的翻译字词,并且在翻译模块44查询出被选定的字词对应的翻译字词之后,即可由显示模块45进行翻译字词的显示,由此提供使用者了解被选定字词的翻译解释。接着,将以一个实施例来解释本发明第二实施例的运作方式及流程,以下实施例将结合图9以及图10所示进行说明,图10所示为本发明第二实施例提供影像播放时的字幕翻译方法流程图。请参照图11所示,图11所示为本发明第二实施例提供影像播放时的字幕翻译的使用者界面示意图。由影像播放模块41将影像播放于使用者界面20的影像播放区域22中(步骤310),影像播放的示意请参照图11所示。接着,当使用者暂停影像播放(即为使用者指令)时,此时字词选取模块42则会根据使用者的指令定位当前播放的影像档案的时间轴位置为“00:01:38”,并将时间轴位置“00:01:38”对应的字幕资料中的字幕内容为“This is a router.”(请参照图4B所示)显示于选取区域23中,以供使用者选取的方式提供时间轴位置“00:01:38”对应的字幕资料中的字幕内容为“This is arouter.”(步骤320),并且使用者在字幕内容为“This is arouter.”中选取字词为“router” (图11中是以底线方式作为被选取字词的呈现方式,在此仅为举例说明,本发明并不以此为限制,被选取字词的呈现方式也可以为背景变化、字型变化等方式)。接着,当使用者在被提供时间轴位置为“ 00:01:38 ”对应的字幕资料中的字幕内容为“This is a router.”中选取字词为“ixniter”之后,即可由接收模块43接收使用者从时间轴位置为“00:01:38”对应的字幕资料中的字幕内容为“Thisis a router.”中选定的字词为“router” (步骤33O)。接着,会再通过翻译模块44从翻译词库(在本实施例中仅以翻译词库作为举例说明,但本发明并不以此为限制)中查询被选定的字词为“router”对应的翻译字词为“路由器”(步骤340),并且在翻译模块44查询出被选定的字词“router”对应的翻译字词为“路由器”之后,即可由显示模块45进行翻译解释为“路由器”的显示(步骤350),对于翻译解释为“路由器”的显示请参照图12A以及图12B所示,图12A所示为本发明第二实施例提供影像播放时的字幕翻译的翻译解释第一呈现方式显示示意图;图12B所示为本发明第二实施例提供影像播放时的字幕翻译的翻译解释第二呈现方式显示示意图,而图12A以及图12B中对于翻译解释为“路由器”的呈现方式仅为举例说明,本发明并不以此为限制,由此提供使用者了解被选定字词为“router”的翻译解释为“路由器”。综上所述,可知本发明与现有技术之间的差异在于本发明是在影像播放时,搜寻影像的时间轴对应的字幕资料的字幕内容是否具有使用者所输入的字词,当搜寻到字幕内容具有字词时,暂停影像的播放,并依据影像暂停时的暂停时间从字幕档案中查询出具有暂停时间的时间信息以及字幕内容,并将字词翻译为翻译字词,即可在字幕内容的字词之后新增翻译字词并重新储存字幕档案,最后依据回放信号从暂停时间重新播放影像。通过此技术手段可以解决现有技术所存在的对于影像采用光学字符识别技术识别字幕需要进一步校正识别字幕结果,再进行字幕翻译的问题,进而达到在影像播放时对影像字幕可直接进行翻译的技术效果。虽然本发明所提供的实施方式如上,但所述的内容并非用以直接限定本发明的专利保护范围。任何本领域技术人员在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作些许的变动。本发明的专利保护范围,仍须以所附的权利要求书所界定者为准。
权利要求
1.一种提供影像播放时的字幕翻译系统,其特征在于,包含: 接收模块,用以接收字词; 影像播放模块,用以播放影像,以及依据回放信号从暂停时间重新播放该影像,其中,该影像由影像档案与字幕档案组合而成,该影像档案包含时间轴,该字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容; 搜寻模块,在该影像播放时,该搜寻模块搜寻该影像的该时间轴对应的字幕资料的该字幕内容是否具有该字词; 控制模块,当该搜寻模块搜寻到该字幕内容具有该字词时,暂停该影像的播放; 时间撷取模块,用以撷取该影像暂停播放时该时间轴的时间为暂停时间; 查询模块,从该字幕档案中查询出具有该暂停时间的该时间信息,并查询出与该时间信息对应的该字幕内容; 翻译模块,将该字词翻译为翻译字词;及 储存模块,在该字幕内容的该字词之后新增该翻译字词并重新储存该字幕档案,并触发该回放信号。
2.如权利要求1所述的提供影像播放时的字幕翻译系统,其特征在于,该提供影像播放时的字幕翻译系统还包含预处理模块,在该影像播放前,预先将该字幕档案的每一个字幕资料的该字幕内容进行全文翻译,并由该储存模块重新储存该字幕档案,其中,重新储存的该字幕档案包含多个字幕资料,每一个字幕资料包含该时间信息、该字幕内容与翻译字.内容。
3.如权利要求2所述的提供影像播放时的字幕翻译系统,其特征在于,该预处理模块与该翻译模块通过网络将该字幕档案的每一个字幕资料的该字幕内容进行全文翻译,以及通过网络将该字词翻译为该翻 译字词。
4.如权利要求1所述的提供影像播放时的字幕翻译系统,其特征在于,该储存模块还用以将与该时间信息对应的该字幕内容另存为字幕记录档案。
5.一种提供影像播放时的字幕翻译方法,其特征在于,包含下列步骤: 接收字词; 播放影像,其中,该影像由影像档案与字幕档案组合而成,该影像档案包含时间轴,该字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容; 在该影像播放时,搜寻该影像的该时间轴对应的字幕资料的该字幕内容是否具有该字词; 当搜寻到该字幕内容具有该字词时,暂停该影像的播放; 撷取该影像暂停播放时该时间轴的时间为暂停时间; 从该字幕档案中查询出具有该暂停时间的该时间信息,并查询出与该时间信息对应的该字.内容; 将该字词翻译为翻译字词; 在该字幕内容的该字词之后新增该翻译字词并重新储存该字幕档案,并触发该回放信号;及 依据该回放信号从该暂停时间重新播放该影像。
6.如权利要求5所述的提供影像播放时的字幕翻译方法,其特征在于,该提供影像播放时的字幕翻译方法还包含下列步骤: 在该影像播放前,预先将该字幕档案的每一个字幕资料的该字幕内容进行全文翻译;及 重新储存该字幕档案,其中,重新储存的该字幕档案包含多个字幕资料,每一个字幕资料包含该时间信息、该字幕内容与翻译字幕内容。
7.如权利要求5所述的提供影像播放时的字幕翻译方法,其特征在于,在该影像播放前,预先将该字幕档案的每一个字幕资料的该字幕内容进行全文翻译的步骤是通过网络将该字幕档案的每一个字幕资料的该字幕内容进行全文翻译;将该字词翻译为该翻译字词的步骤是通过网络将该字词翻译为该翻译字词。
8.如权利要求5所述的提供影像播放时的字幕翻译方法,其特征在于,该提供影像播放时的字幕翻译方法还包含将与该时间信息对应的该字幕内容另存为字幕记录档案的步骤。
9.一种提供影像播放时的字幕翻译系统,其特征在于,包含: 影像播放模块,用以播放影像,其中,该影像由影像档案与字幕档案组合而成,该影像档案包含时间轴,该字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容; 字词选取模块,在该影像播放时,根据使用者的指令定位当前播放的该影像档案的时间轴位置,并以供使用者选取的方式提供该时间轴位置对应的字幕资料中的字幕内容; 接收模块,用以接收使用者从该时间轴位置对应的字幕资料中的字幕内容中选定的字 词; 翻译模块,从翻译词库或网络词库中查询被选定的该字词对应的翻译字词;及 显示模块,用于显示该翻译字词。
10.一种提供影像播放时的字幕翻译方法,其特征在于,包含下列步骤: 播放影像,其中,该影像由影像档案与字幕档案组合而成,该影像档案包含时间轴,该字幕档案包含多个字幕资料,每一个字幕资料包含时间信息与字幕内容; 在该影像播放时,根据使用者的指令定位当前播放的该影像档案的时间轴位置,并以供使用者选取的方式提供该时间轴位置对应的字幕资料中的字幕内容; 接收使用者从该时间轴位置对应的字幕资料中的字幕内容中选定的字词; 从翻译词库或网络词库中查询被选定的该字词对应的翻译字词;及 显示该翻译字词。
全文摘要
本发明公开了一种提供影像播放时的字幕翻译系统及其方法,在影像播放时,搜寻影像的字幕内容是否具有使用者所输入的字词,当字幕内容具有该字词时暂停影像的播放,并依据暂停时间从字幕档案中查询出字幕内容,再于字幕内容的该字词之后新增该字词的翻译字词后,重新储存字幕档案并从暂停时间重新播放影像,由此可以达到在影像播放时对影像字幕可直接进行翻译的技术效果。
文档编号G06F17/28GK103139635SQ201110398360
公开日2013年6月5日 申请日期2011年12月5日 优先权日2011年12月5日
发明者邱全成, 徐胡晨 申请人:英顺源(上海)科技有限公司, 英业达股份有限公司