一种用于电脑的语音转化文字的输入系统及方法与流程

文档序号:16308925发布日期:2018-12-19 05:11阅读:316来源:国知局
一种用于电脑的语音转化文字的输入系统及方法与流程

本发明涉及支付安全领域,具体涉及一种用于电脑的语音转化文字的输入系统及方法。

背景技术

目前手机的输入法里有语音转化为文字的功能,但是电脑只能键盘输入,对于打字慢的人来说,电脑语音输入会更快更方便。随着社会的发展,人们对电脑的输入法的要求越来越高,比如现在的一些会议报告或者会议总结,均是通过人为听后进行人为的转化为文字,然后在进行排版,但是由于人为的记录语音转化文字时常常会漏点一些内容或者转换错一些内容,从而在后期的文档中比较难找到错误的点,同时常常出稿会比较慢等。而特别是对于一些重要会议需要文字的直播时,人为的转化速度较慢,同时需要花费较多的人力物力等,因此,需要设计出一种能够适合电脑语音输入的系统和方法,能够及时把会议或者总结的语音转化成为文字。



技术实现要素:

本发明旨在公开一种用于电脑的语音转化文字的输入系统及方法,解决现有电脑没有语音输入,打字慢的用户使用键盘非常不方便,并且会议或者报告总结中的语音文字人为转化处理非常慢的问题,本发明是将电脑的输入法加入语音转化为文字的功能,使输入更方便,尤其在写报告和做会议总结时,非常实用。

本发明采取的技术方案为:

一种用于电脑的语音转化文字的输入系统,所述系统包括:

语音输入处理单元,用于触发录入语音数据,并对语音数据进行滤波;

多个文字转换单元,用于把语音数据转化为文字;

结果对比找错单元,用于把每个文字转换单元转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字;

及文字输出单元,用于接收结果对比找错单元输出入的转化文字,把转化文字输入外部电脑系统。

进一步地,所述系统还包括:

人工错误纠正单元,用于把结果对比找错单元进行二次转化对比后匹配度仍低于百分之五十的文字进行人工听取相应的语音,人工根据语音输入文字,把输入文字传给文字输出单元。

进一步地,所述语音输入处理单元包括:

语音检测触发模块,用于检测是否有语音数据,当有语音数据时,触发系统开启工作模式;

语音录入模块,用于录入语音数据;

及语音模型滤波模块,用于根究语音模型进行对语音录入模块传入的语音数据进行滤波处理。

进一步地,所述语音检测触发模块的具体工作过程为:

通过声音感应器感应是否有声音,当有声音时,通过人声特征识别模型识别声音是否为人类语音,当识别位人类语音时,启动系统开关,语音录入模块开始录入语音数据。

进一步地,所述多个文字转换单元中,每个文字转换单元均包括:

语音特征向量提取模块,用于对语音数据进行声音特征量提取;

声音库模块,用于存储进行模型化的声音数据;

声学相似度计算模块,用于把语音特征向量提取模块提取的声音特征量与声音库模块内的模型化的声音数据对比,匹配相似度的声音数据;

文字语音库模块,用于存储文字、文字对应的语音和文字扩展词句的语音数据;

文字识别模块,把声学相似度计算模块传入的声音数据与文字语音库模块内的语音数据进行对比匹配,得出语音转化的文字。

进一步地,所述文字识别模块进行对比匹配的过程为:

把一个语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后再对语音特征量前后的语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后把语音数据对应的文字匹配,得到转化的文字。

进一步地,所述结果对比找错单元包括:

文字比对模块,用于接收多个文字转换单元输出的转化文字,把每个文字转换单元输出的文字相互之间对比,查找每个文字转换单元输出的转化文字与其它的文字转换单元输出的转化文字不同区域;

区别文字对比模块,用于把文字比对模块输出的不同区域的转化文字进行相同站队求占比;

错误文字选定模块,用于根据区别文字对比模块输出的占比数据,确定转化错误部分文字,并确定错误文字语音位置,

错误文字语音截取模块,用于根据错误文字选定模块输出的错误文字语音位置对语音数据进行截取,并把截取的语音数据传回给多个文字转换单元二次转化;

及错误纠正模块,用于选定二次转化后均未能转化正确的文字,并对没能转化正确的文字根据语音量标注拼音,同时截取相应文字位置的语音数据。

进一步地,所述二次转化的具体过程与初始转化的过程相同。

一种用于电脑的语音转化文字的输入方法,所述方法包括如下步骤:

检测是否有语音输入,当有语音输入时,启动系统录入语音数据,并对语音数据进行语音模型滤波,得到滤波语音数据;

把滤波语音数据进行转化成为文字;

把转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字;

对转化文字进行人工质检纠正,人工输入正确文字,把转化的文字和人工纠正的文字输入电脑系统。

进一步地,所述把滤波语音数据进行转化成为文字的具体过程为:

对语音数据进行声音特征量提取,把提取的声音特征量与模型化的声音库数据对比,匹配相似度的声音数据,把相似度的声音数据与文字语音库数据对比匹配出文字。

进一步地,所述把相似度的声音数据与文字语音库数据对比匹配出文字的过程为:

把一个语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后再对语音特征量前后的语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后把语音数据对应的文字匹配,得到转化的文字。

进一步地,所述把转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字的具体过程为:

接收多个文字转换单元输出的转化文字,把每个文字转换单元输出的文字相互之间对比,查找每个文字转换单元输出的转化文字与其它的文字转换单元输出的转化文字不同区域;

通过区别文字对比模块把文字比对模块输出的不同区域的转化文字进行相同站队求占比;

通过错误文字选定模块根据区别文字对比模块输出的占比数据,确定转化错误部分文字,并确定错误文字语音位置,

通过错误文字语音截取模块根据错误文字选定模块输出的错误文字语音位置对语音数据进行截取,并把截取的语音数据传回给多个文字转换单元二次转化;

使用错误纠正模块选定二次转化后均未能转化正确的文字,并对没能转化正确的文字根据语音量标注拼音,同时截取相应文字位置的语音数据。

采用本发明技术方案具有以下优势:

本发明通过预先对语音数据进行使用声音库模型进行滤波处理,减少杂刺音的影响,同时由多个文字转换单元同时对语音进行转化,把转换的结果数据由结果对比找错单元进行对比查找区别,然后根据区别的占比,确定为错位转化后截取相应的语音数据进行二次文字转化,从而使得转化的文字准确率更高,减少文字转化错误率,同时设置了人工错误纠正单元,用户可以人工对系统个别转化不成功或者错误的数据进行人工的输入,同时错误的文字相对应的语音数据已经截取留存,方便用户听取键盘输入正确的数据。

附图说明

图1是本发明一种用于电脑的语音转化文字的输入系统框图。

图2是本发明一种用于电脑的语音转化文字的输入系统的语音输入处理单元模块框图。

图3是本发明一种用于电脑的语音转化文字的输入系统的文字转换单元模块框图。

图4是本发明一种用于电脑的语音转化文字的输入系统的结果对比找错单元模块框图。

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

需要说明的是,下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。

请参阅图1,是本发明实施例提供的一种用于电脑的语音转化文字的输入系统框图,如图1所示,所述系统包括:

语音输入处理单元1,用于触发录入语音数据,并对语音数据进行滤波;

多个文字转换单元2,用于把语音数据转化为文字;

结果对比找错单元3,用于把每个文字转换单元转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字;

及文字输出单元4,用于接收结果对比找错单元输出入的转化文字,把转化文字输入外部电脑系统。

通过语音输入处理单元1对语音感知,触发系统启动,同时把语音数据录入,然后进行滤波处理,从而使得语音数据更加的准确,减少其它杂质的影响后面的文字转化。文字转换单元2的个数一般是10-12个,根据用户需要的准确率,可以再进行增多,同时也可以减少,每个文字转换单元2的结构均是相同的,但是由于转化的库匹配存在随机性,因此每个文字转换单元2转化的文字并不一定均是相同的。结果对比找错单元3对多个文字转换单元2输出的转化文字进行纠错处理,纠错处理后可以提高文字转化率。文字输出单元4把转化的文字输入到电脑系统,供用户直接打印或者存档。

本发明实施例中,如图1所示,所述系统还包括:

人工错误纠正单元,用于把结果对比找错单元进行二次转化对比后匹配度仍低于百分之五十的文字进行人工听取相应的语音,人工根据语音输入文字,把输入文字传给文字输出单元。通过人工的对系统自动转化的数据进行检查核对,并把错误部分数据进行纠正,从而使得转化的数据更加准确,转化的文字数据可以直接打印或者存档。同时与现有的一些为人的转化文字更加节省人力和时间,符合现有文字直播的需求。

本发明实施例中,如图2所示,所述语音输入处理单元1包括:

语音检测触发模块11,用于检测是否有语音数据,当有语音数据时,触发系统开启工作模式;

语音录入模块12,用于录入语音数据;

及语音模型滤波模块13,用于根究语音模型进行对语音录入模块12传入的语音数据进行滤波处理。

所述语音检测触发模块12的具体工作过程为:

通过声音感应器感应是否有声音,当有声音时,通过人声特征识别模型识别声音是否为人类语音,当识别位人类语音时,启动系统开关,语音录入模块开始录入语音数据。

通过使用触发式启动系统录入,可以家烧系统能耗,减少系统一些不必要的信号转化,减少气他杂信号给系统带来的损伤等。同时在录入的语音数据中进行滤波处理,通过滤波处理后可以减少语音数据中掺杂的一些杂质语音数据,通过滤波后,可以增加文字转化的准确率。

本发明实施例中,如图3所示,所述多个文字转换单元中,每个文字转换单元2均包括:

语音特征向量提取模块21,用于对语音数据进行声音特征量提取;

声音库模块23,用于存储进行模型化的声音数据;

声学相似度计算模块22,用于把语音特征向量提取模块提取的声音特征量与声音库模块内的模型化的声音数据对比,匹配相似度的声音数据;

文字语音库模块25,用于存储文字、文字对应的语音和文字扩展词句的语音数据;

文字识别模块24,把声学相似度计算模块传入的声音数据与文字语音库模块25内的语音数据进行对比匹配,得出语音转化的文字。

所述文字识别模块24进行对比匹配的过程为:

把一个语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后再对语音特征量前后的语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后把语音数据对应的文字匹配,得到转化的文字。

多个文字转换单元2可以很好的提高文字的转化准确率,经过多个转化的结果数据进行对比,然后通过二次的转化,更好的提高转化的效率。具有转化准确率高,转化速度快的优点。比如语音是“大家好”语音识别时,先对“大”进行语音特征量匹配,可能会匹配到“大、打、达”,然后对“家”进行语音特征量匹配,得到“家、加、+”,然后对“好”进行语音特征量匹配,得到“好、浩、豪”,然后通过文字扩展词句的语音数据匹配,得到文字“大家好”。

本发明实施例中,如图4所示,所述结果对比找错单元3包括:

文字比对模块31,用于接收多个文字转换单元输出的转化文字,把每个文字转换单元输出的文字相互之间对比,查找每个文字转换单元输出的转化文字与其它的文字转换单元输出的转化文字不同区域;

区别文字对比模块32,用于把文字比对模块输出的不同区域的转化文字进行相同站队求占比;

错误文字选定模块33,用于根据区别文字对比模块输出的占比数据,确定转化错误部分文字,并确定错误文字语音位置,

错误文字语音截取模块34,用于根据错误文字选定模块输出的错误文字语音位置对语音数据进行截取,并把截取的语音数据传回给多个文字转换单元2二次转化;

及错误纠正模块35,用于选定二次转化后均未能转化正确的文字,并对没能转化正确的文字根据语音量标注拼音,同时截取相应文字位置的语音数据。

所述二次转化的具体过程与初始转化的过程相同。

通过对比查找的方式进行比对,找出区别的文字,找出相同的文字,相同的文字进行统一处理,区别文字进行标记处理,对区别的文字二次转化后再标记,达到提高转化率,同时提高准确率,二次转化只是对上一次转化出现错误,即为占文字转换单元个数为低于50%时,视为错位转化。当是十个文字转换单元是,一个语音转化的文字有多种,相同的文字个数占比总数低于50%,即为错误转化,也就是少于5个相同的文字。

一种用于电脑的语音转化文字的输入方法,所述方法包括如下步骤:

检测是否有语音输入,当有语音输入时,启动系统录入语音数据,并对语音数据进行语音模型滤波,得到滤波语音数据;

把滤波语音数据进行转化成为文字;

把转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字;

对转化文字进行人工质检纠正,人工输入正确文字,把转化的文字和人工纠正的文字输入电脑系统。

所述把滤波语音数据进行转化成为文字的具体过程为:

对语音数据进行声音特征量提取,把提取的声音特征量与模型化的声音库数据对比,匹配相似度的声音数据,把相似度的声音数据与文字语音库数据对比匹配出文字。

所述把相似度的声音数据与文字语音库数据对比匹配出文字的过程为:

把一个语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后再对语音特征量前后的语音特征量与文字语音库模块中的语音进行匹配,得到匹配相似度排前的三个语音数据,然后把语音数据对应的文字匹配,得到转化的文字。

所述把转化的文字进行对比,找出区别部分文字,根据区别部分文字,截取相应的语音返回多个文字转换单元中二次转化,把二次转化文字与原转化文字匹配得到转化文字的具体过程为:

接收多个文字转换单元输出的转化文字,把每个文字转换单元输出的文字相互之间对比,查找每个文字转换单元输出的转化文字与其它的文字转换单元输出的转化文字不同区域;

通过区别文字对比模块把文字比对模块输出的不同区域的转化文字进行相同站队求占比;

通过错误文字选定模块根据区别文字对比模块输出的占比数据,确定转化错误部分文字,并确定错误文字语音位置,

通过错误文字语音截取模块根据错误文字选定模块输出的错误文字语音位置对语音数据进行截取,并把截取的语音数据传回给多个文字转换单元二次转化;

使用错误纠正模块选定二次转化后均未能转化正确的文字,并对没能转化正确的文字根据语音量标注拼音,同时截取相应文字位置的语音数据。

预先对语音数据进行使用声音库模型进行滤波处理,减少杂刺音的影响,同时由多个文字转换单元同时对语音进行转化,把转换的结果数据由结果对比找错单元进行对比查找区别,然后根据区别的占比,确定为错位转化后截取相应的语音数据进行二次文字转化,从而使得转化的文字准确率更高,减少文字转化错误率,同时设置了人工错误纠正单元,用户可以人工对系统个别转化不成功或者错误的数据进行人工的输入,同时错误的文字相对应的语音数据已经截取留存,方便用户听取键盘输入正确的数据。本系统主要应用在电脑的语音输入中,或者报告和会员总结的语音文字转换,同时还可以是一些赛事的语音转文字直播,具有转化效率高,速度快的优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1