一种语言翻译方法及系统的制作方法

文档序号：6397550阅读：176来源：国知局

专利名称：一种语言翻译方法及系统的制作方法
技术领域：
本发明属于语音识别技术领域，尤其涉及一种语言翻译方法及系统。
背景技术：
随着经济的发展、人们收入水平的提高，各国之间的文化经济往来越来越频繁，各语种之间的交流也越来越多。而传统的、通过专业翻译人员实现沟通的方式由于成本高等原因，并不适用于广大民众。为此，现有技术提出了一种语言翻译系统，其可以将一个语种的语言文字直接翻译成其它语种的语言文字。相对于传统方式而言，该系统成本低，便于携带，使用方便。但由于该系统是一次性的将一个语种的语言文字翻译成其它语种的语言文字后输出，而语言识别、语言翻译或语音合成过程中难免存在一定的误差，从而使得翻译结果准确度较差，甚至在某些场合引起不必要的误会。

发明内容
本发明实施例的目的在于提供一种语言翻译方法，旨在解决现有语言翻译系统是将一个语种的语言文字一次性翻译成其它语种的语言文字后输出，翻译结果准确度较差的问题。本发明实施例是这样实现的，一种语言翻译方法，所述方法包括语音接收单元监听并接收待翻译语言；对接收到的所述待翻译语言进行预处理及语音识别，并控制显示器显示至少两个最接近的识别结果文字；接收用户选择的一识别结果文字，并将所述识别结果文字翻译成目标语种的语言后输出。本发明实施例的另一目的在于提供一种语言翻译系统，所述系统包括显示器；语音接收单元，用于监听并接收待翻译语言；语音识别单元，用于对所述语音接收单元接收到的所述待翻译语言进行预处理及语音识别，并控制所述显示器显示至少两个最接近的识别结果文字；信号接收单元，用于接收用户选择的一识别结果文字；翻译单元，用于将所述信号接收单元接收到的所述识别结果文字翻译成目标语种的语言后输出。本发明提供的语言翻译方法及系统在语音识别后，显示至少两个最接近的识别结果文字，用户从中选取一个，并将用户选取的识别结果文字翻译成目标语种的语言后播放，从而实现了语音识别结果的矫正。相对于现有的语言翻译方式，翻译结果的准确度更高，有利于不同语种之间更好的沟通。该方法及系统可应用在外语学习领域，有利于外语学习者高效的学习多种语言的文字和发音。

图1是本发明第一实施例提供的语言翻译方法的流程图；图2是本发明第一实施例中，语音识别及识别结果显示的详细流程图；图3是本发明第二实施例提供的语言翻译方法的流程图；图4是本发明第三实施例提供的语言翻译系统的结构图；图5是图4中，语音识别单元的结构图；图6是本发明第四实施例提供的语言翻译系统的结构图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。针对现有技术存在的问题，本发明提供的语言翻译方法及系统是在语音识别后，显示至少两个最接近的识别结果文字，用户从中选取一个，并将用户选取的识别结果文字翻译成目标语种的语言后播放。图1示出了本发明第一实施例提供的语言翻译方法的流程。包括步骤S1:语音接收单元监听并接收待翻译语言。其中的语音接收单元可以是一麦克风。步骤S2 :对接收到的待翻译语言进行预处理及语音识别，并控制显示器显示至少两个最接近的识别结果文字。本发明第一实施例中，可以基于现有的任一种语音识别技术实现对待翻译语言的语音识别，例如，可以采用动态时间规整技术、隐马尔科夫模型、人工神经网络等。优选地，基于隐马尔科夫模型实现对待翻译语言的语音识别，则如图2所示，步骤S2包括步骤S21 :对接收到的待翻译语言进行模/数转换处理、降噪处理等预处理。步骤S22 :识别待翻译语言的起始位置和终止位置，并提取起始位置和终止位置之间的语音特征。本发明第一实施例中，可以通过计算待翻译语言的信号能量和进行过零检测，来实现对起始位置和终止位置的识别。步骤S23 :利用语音特征，基于隐马尔科夫模型识别出至少两个最接近的识别结果文字，优选地，识别出五个最接近的识别结果文字。步骤S24 :控制显示器显示至少两个最接近的识别结果文字。步骤S3 :接收用户选择的一识别结果文字，并将该识别结果文字翻译成目标语种的语言后输出。之后，通过显示器显示目标语种的语言文字，和/或将目标语种的语言文字合成语音信号后、通过语音播放单元(如扬声器等)播放该语音信号。本发明第一实施例提供的语言翻译方法在语音识别后，显示至少两个最接近的识别结果文字，用户从中选取一个，并将用户选取的识别结果文字翻译成目标语种的语言后播放，从而实现了语音识别结果的矫正。相对于现有的语言翻译方式，翻译结果的准确度更高，有利于不同语种之间更好的沟通；该方法可应用在外语学习领域，有利于外语学习者高效的学习多种语言的文字和发音。图3示出了本发明第二实施例提供的语言翻译方法的流程。与图1所示不同，本发明第二实施例中，在步骤SI之前，还包括步骤S4 :接收用户输入的翻译方式选择信号，其中的翻译方式包括语音方式和文字输入方式。步骤S5 :若翻译方式为语音方式，则开启语音接收单元。则在步骤S4之后，还可包括步骤S6 :若翻译方式为文字输入方式，则文字输入设备接收待翻译语言文字。其中，文字输入设备是指物理键盘、触摸屏等。步骤S7 :将待翻译语言文字翻译成目标语种的语言后输出。之后，通过显示器播放目标语种的语言文字，和/或将目标语种的语言文字合成语音信号后、通过扬声器播放该语音信号。进一步地，还可预设多个语种，在进行语言翻译前，由用户指定待翻译语种和目标语种，则在步骤S4之前，还可包括步骤S8 :接收用户的操作信息，根据操作信息设置待翻译语言的语种、以及目标语种。步骤S9 :控制显示器显示操作步骤及注意事项。本发明第二实施例提供的语言翻译方法在本发明第一实施例基础上，还提供了对语音方式和文字输入方式的选择，为语言翻译提供了至少两种可行方案，进一步方便了用户的使用。下面举例说明本发明第二实施例提供的语言翻译方法假设待翻译语言的语种为汉语，目标语种为英语。首先，用户根据显示器的显示内容，设置待翻译语言的语种为汉语，目标语种为英语；之后，显示器提示用户翻译过程的操作步骤及注意事项，并提示用户选择语音模式或文字输入模式。若用户选择语音模式，则开启麦克风，采集用户的发音“我要去火车站”作为待翻译语言，之后对待翻译语言进行模/数转换，之后，通过计算待翻译语言的信号能量和过零率，识别出待翻译语言的起始位置和终止位置，并提取起始位置和终止位置之间的语音特征；之后，采用某一语音识别技术，利用语音特征对待翻译语言进行识别，并将五个最接近的识别结果显示在显示器上，以供用户选择，该五个最接近的识别结果例如可以是“我要去火车站”、“我要去货车站”、“我要去卖鸡蛋”、“你要去火车站”、“我不去火车站”;之后，用户从该五个识别结果中选择“我要去火车站”并确认；之后，通过现有的语言翻译技术，将“我要去火车站”翻译成“I will go tothe train station”;最后，将翻译得到的“I will go to the train station”直接显不在显示器上，或者合成语音后，通过扬声器播放。图4示出了本发明第三实施例提供的语言翻译系统的结构，为了便于说明，仅示出了与本发明第三实施例相关的部分。详细而言，本发明第三实施例提供的语音翻译系统包括显示器11 ;语音接收单元12，用于监听并接收待翻译语言；语音识别单元13，用于对语音接收单元12接收到的待翻译语言进行预处理及语音识别，并控制显示器11显示至少两个最接近的识别结果文字；信号接收单元14，用于接收用户选择的一识别结果文字；翻译单元15，用于将信号接收单元14接收到的识别结果文字翻译成目标语种的语言后输出。本发明第三实施例中，翻译单元15输出的目标语种的语言可以通过显示器11进行播放，也可以通过语音方式播放。当采用语音方式播放时，本发明第三实施例提供的语音翻译系统还可以包括合成单元16，用于将目标语种的语言合成语音信号；语音播放单元17,用于播放合成单兀16合成后的语音信号。本发明第三实施例中，可以基于现有的任一种语音识别技术实现对待翻译语言的语音识别，例如，可以采用动态时间规整技术、隐马尔科夫模型、人工神经网络等。优选地，基于隐马尔科夫模型实现对待翻译语言的语音识别，则如图5所示，语音识别单元13可进一步包括预处理模块131，用于对接收到的待翻译语言进行模/数转换处理、降噪处理等预处理；特征提取模块132，用于识别预处理后的待翻译语言的起始位置和终止位置，并提取起始位置和终止位置之间的语音特征；识别模块133，用于利用语音特征，基于隐马尔科夫模型识别出至少两个最接近的识别结果文字，优选地，识别出五个最接近的识别结果文字；显示控制模块134，用于控制显示器11显示至少两个最接近的识别结果文字。其中，特征提取模块132可通过计算待翻译语言的信号能量和进行过零检测，来实现对起始位置和终止位置的识别。图6示出了本发明第四实施例提供的语言翻译系统的结构，为了便于说明，仅示出了与本发明第四实施例相关的部分。与图4所示不同，本发明第四实施例中，信号接收单元14还用于接收用户输入的翻译方式选择信号，该翻译方式包括语音方式和文字输入方式；系统还包括启动控制单元18，用于根据翻译方式选择信号，若翻译方式为语音方式，则开启语音接收单元12。此时，进一步地，系统还可以包括文字输入设备19，用于根据翻译方式选择信号，若翻译方式为文字输入方式，则文字输入设备接收待翻译语言文字；翻译单元15还用于将待翻译语言文字翻译成目标语种的语言后输出。同样地，输出的目标语种的语言可通过显示器11显示播放和/或通过语音播放单元17以语音的方式播放。另外，信号接收单元14还可用于接收用户的操作信息；系统还可包括设置模块20，用于根据操作信息设置待翻译语言的语种、以及目标语种，之后控制显示器11显示操作步骤及注意事项。本发明提供的语言翻译方法及系统在语音识别后，显示至少两个最接近的识别结果文字，用户从中选取一个，并将用户选取的识别结果文字翻译成目标语种的语言后播放，从而实现了语音识别结果的矫正。相对于现有的语言翻译方式，翻译结果的准确度更高，有利于不同语种之间更好的沟通；该方法可应用在外语学习领域，有利于外语学习者高效的学习多种语言的文字和发音。另外，还提供了对语音方式和文字输入方式的选择，为语言翻译提供了至少两种可行方案，进一步方便了用户的使用。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来控制相关的硬件完成，所述的程序可以在存储于一计算机可读取存储介质中，所述的存储介质，如R0M/RAM、磁盘、光盘等。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种语言翻译方法，其特征在于，所述方法包括语音接收单元监听并接收待翻译语言；对接收到的所述待翻译语言进行预处理及语音识别，并控制显示器显示至少两个最接近的识别结果文字；接收用户选择的一识别结果文字，并将所述识别结果文字翻译成目标语种的语言后输出。
2.如权利要求1所述的语言翻译方法，其特征在于，所述对接收到的所述待翻译语言进行预处理及语音识别，并控制显示器显示至少两个最接近的识别结果文字的步骤进一步包括对接收到的所述待翻译语言进行预处理；识别所述待翻译语言的起始位置和终止位置，并提取所述起始位置和所述终止位置之间的语音特征；利用所述语音特征，基于隐马尔科夫模型识别出至少两个最接近的识别结果文字；控制所述显示器显示所述至少两个最接近的识别结果文字。
3.如权利要求1所述的语言翻译方法，其特征在于，在所述语音接收单元监听并接收待翻译语言的步骤之前，所述方法还包括接收用户输入的翻译方式的选择信号；若所述翻译方式为语音方式，则开启语音接收单元。
4.如权利要求3所述的语言翻译方法，其特征在于，所述接收用户输入的翻译方式的选择信号的步骤之后，所述方法还包括若所述翻译方式为文字输入方式，则文字输入设备接收待翻译语言文字；将所述文字输入设备接收到的所述待翻译语言文字翻译成目标语种的语言后输出。
5.如权利要求3所述的语言翻译方法，其特征在于，所述接收用户输入的翻译方式的选择信号的步骤之前，所述方法还包括接收用户的操作信息，根据所述操作信息设置所述待翻译语言的语种、以及目标语种；控制所述显示器显示操作步骤及注意事项。
6.如权利要求1至5任一项所述的语言翻译方法，其特征在于，所述将所述识别结果文字翻译成目标语种的语言后输出的步骤之后，所述方法还包括通过所述显示器显示所述目标语种的语言文字，和/或将所述目标语种的语言文字合成语音信号后、通过语音播放单元播放所述语音信号。
7.一种语言翻译系统，其特征在于，所述系统包括显示器；语音接收单元，用于监听并接收待翻译语言；语音识别单元，用于对所述语音接收单元接收到的所述待翻译语言进行预处理及语音识别，并控制所述显示器显示至少两个最接近的识别结果文字；信号接收单元，用于接收用户选择的一识别结果文字；翻译单元，用于将所述信号接收单元接收到的所述识别结果文字翻译成目标语种的语言后输出。
8.如权利要求7所述的语言翻译系统，其特征在于，语音识别单元13可进一步包括预处理模块，用于对接收到的所述待翻译语言进行预处理；特征提取模块，用于识别所述预处理模块预处理后的所述待翻译语言的起始位置和终止位置，并提取所述起始位置和所述终止位置之间的语音特征；识别模块，用于利用所述语音特征，基于隐马尔科夫模型识别出至少两个最接近的识别结果文字；显示控制模块，用于控制所述显示器显示所述至少两个最接近的识别结果文字。
9.如权利要求7所述的语言翻译系统，其特征在于，所述信号接收单元还用于接收用户输入的翻译方式选择信号；所述系统还包括启动控制单元，用于当所述翻译方式为语音方式时，开启所述语音接收单元。
10.如权利要求9所述的语言翻译系统，其特征在于，所述系统还包括文字输入设备，用于当所述翻译方式为文字输入方式时，接收待翻译语言文字；所述翻译单元还用于将所述文字输入设备接收到的所述待翻译语言文字翻译成目标语种的语言后输出。
全文摘要
本发明于语音识别技术领域，提供了一种语言翻译方法及系统。该方法及系统在语音识别后，显示至少两个最接近的识别结果文字，用户从中选取一个，并将用户选取的识别结果文字翻译成目标语种的语言后播放，从而实现了语音识别结果的矫正。相对于现有的语言翻译方式，翻译结果的准确度更高，有利于不同语种之间更好的沟通。该方法及系统可应用在外语学习领域，有利于外语学习者高效的学习多种语言的文字和发音。
文档编号G06F17/28GK103020048SQ201310005650
公开日2013年4月3日申请日期2013年1月8日优先权日2013年1月8日
发明者黄中伟, 刘明辉申请人:深圳大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄中伟;刘明辉
技术所有人：深圳大学
我是此专利的发明人

上一篇：一种基于sift量化的近似拷贝图像检测方法
上一篇：一种基于脚本实现电力监控系统功能扩展和定制的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。