专利名称:原音校正文稿工具的制作方法
技术领域:
本发明原音校正文稿工具,属于计算机汉字语音识别输入技术领域。
目前计算机汉字输入方法除,音形码,字形码方法外,又有了新的突破,出现了一种符合人类用语习惯的语音输入文字的新方法,采用汉字语音输入典型的有四达-863A汉字。语音系统,该系统将特定人(通过话筒)读入计算机的汉字文稿,由计算机进行识别理解后输出,但由于计算机语音识别和语音(言)理解的局限性,会产生很多错误。当识别的错误率高到一定程度时,因不能根据句子的上下文意思判断句子的错误,使校对文稿的工作变得很困难,不能真正做到脱稿校对。而具有校对功能的校对系统,典型的如华夏_唐武智能技术有限公司的唐氏中文自动校对系统,把人工智能原理运用于汉语文稿处理,通过计算机对文本可进行语音校对。但这类校对系统只能对已输入计算机的文稿进行校对,系统本身不能进行汉字输入,文稿必须由其它文字处理系统先输入。现有计算机语音合成技术,只是能读出已输入的文稿,而不管输入的文稿是否有错,要找出错误则必须对照原稿,如果是不打草稿,把自己的构思直接输入计算机的,用语音合成进行校对则会影响人的构思。同样,具有录放音功能的录(放)音机却不具有计算机的编辑、排版等功能,因为作为录音机本身不可能把录入的声音转变为可看、可读,可排版打印的文字,而计算机语音输入(同时进行原音录入)时,已把全部声音转变为可看、可读、可排版打印的文字,通常用语音输入文稿输入时,文稿的编辑工作已完成了60%_90%以上,这是具有录放功能的录(放)音机所无法达到的。
本发明的目的,是针对前述技术或工具之不足,提供一种方便轻松的语音校对系统,当用户因文稿语音输入出现理解错误无法用上下文判断语意时,可以有原始资料备查,这等于是在用户使用语音输入的过程中,给用户提供一个类似录音机的备选功能,放出原音,就能判断或知道错在什么地方,知道一句或一段话的语意。
本发明的基本特征是在识别语音过程的同时,将经过压缩的原始语音数据,同步(按发音顺序)地存到磁盘中语音输入系统下某一个用于存放语音的目录中,同时,编辑窗出现录音开始的标志。其中数据压缩比例为8倍,因为在通常情况下,压缩比例越小,放出的原音音色更好,更接近人的原音。但在压缩4倍时,虽然音色好,压缩时间短,可是数据占据的空间大,影响其它有用数据的存放;将数据压缩到16倍时,虽然数据占有的空间大大缩小,但原音音色差,原音失真,且压缩时间长,更完善的原音压缩比例尚有待于进一步应用开发。本发明采用的压缩比例为8倍,它介于上述两种比例之间,既能使原音数据不占过多的空间以保证其它数据地存放,压缩时间又不致太长,又能保证原音不失真。在原音录放时,原音语音文件以1000个字或词为限,按一个音节平均占10K空间计算,压缩后占1.25K,1000字或词占1兆至1.25兆的空间,当文稿数字达到1000字或词时,提示修改文稿并删除原音语音数据文件;当对磁盘空间的检查不足时,自动提示用户删除最早的原音语音记录文件。对于放音系统的控制,设置两个热键一个键使放音序号前指30个字或词,一个键使放音序号后指30字或词,当前位置的缺省值是录音开始的第一语音数据。
下面是使用本发明的一实例在有语音+手写汉字输入方法的文字处理系统下,选择“语音+手写”命令,并按下录音键,用语音(通过话筒)输入下面这段话“在邓小平同志去年初的重要讲话和党的十四大精神指引下,一年多来,各方面的工作都打开了新的局面,国民经济蓬勃发展,围绕建立社会主义市场经济体制的各项改革对外开放取得新的进展,其它各项事业也有新的成就,现在我国经济发展,政治稳定,民族团结,社会进步,总的形势确定是好的。”在输入这段话的同时把原音录了下来。经过语音识别和语音理解后的文稿,输出为“在邓小平同志去献出的重要讲话和党的十字大精神制品向,一年多来,各方面的工作都打开了近的局面,国民轻地蓬勃发展,为绕建立社会主义市场经济体制的各项改革对外非党取得新的进展,其它各项事业也有新的成就,现在我国经济差展,政治稳定,民族团结,社会进步,总的形势确实是好的。”出现的错误有的是显而易见的,有的则很难判断,甚至不能判断上下文的意思,这时按下放音键,刚录进的原音就清晰地放出来,录入者不用看原稿听着放音便能方便地校正文稿了。如果原音录音超过1000字或词,系统提示修改文稿并删除原音语音数据文件。
本发明的突出特点1.通过放出原始读音,便能改正错误,使得校正工作变得方便轻松。
2.采用本发明进行文稿校对,可以完全脱离原稿校对。
3.文稿输入者完全可以不打草稿,直接上机输入。因为录入的原音就已代替了草稿。
4.本发明为各行业各部门的主管人士及其助手提供了极大的方便。因为和单纯的录(放)音机相比,使用本发明能减轻或减少他们一半以上的工作量和工作时间,主管人士用语音输入方式(按下原音录音键)将需要助手整理、打印成文的各种文件先读入计算机后,文件编辑工作便已完成了60%到90%以上,其助手只需听着主管人士的原音直接在编辑窗内进行修改,便可正式打印成文了。
5.本发明支持带有语音+手写汉字输入方法的文字处理系统,录入者输入汉字文稿不用键盘,只需把文稿读入并录下,文稿的编辑工作就已基本完成,这就特别能体现管理或办公的自动化和智能化。本发明是提高计算机普及率不可缺少的工具之一。
6.本发明不仅适用于有语音汉字输入及其它汉字输入方法的文字处理系统,更适用于近远程网络和通讯。
权利要求
1.本发明原音校正文稿工具,其基本技术特征在于在语音识别系统进行语音识别时,将原始语音数据经过压缩同步地保存在磁盘、光盘或其它适当的高密度媒体中,当录入的文稿中有通过上下文不不能判定的错误时,放出原音,便可方便、快捷地予以校正。
2.根据权利要求1所述,原音校正文稿工具的特征在于在原音录入时采用数据压缩技术,压缩比例在8倍以上。
3.根据权利要求1所述,原音校正文稿工具的特征在于在识别语音过程的同时,将原始语音数据同步(按发音顺序)地存到磁盘、光盘或其它适当的高密度媒体中。
4.根据权利要求1或2所述,原音校正文稿工具的特征在于在语音输入系统下开一个专门存放原音语音的目录,每个文件以1000个字或词为限,按一个音节平均占10K空间计算,压缩后占1.25K,1000字或词占1兆以上的空间,当文稿数字达到1000字或词时,提示修改文稿并删除语音数据文件,当对磁盘空间的检查不足时,自动删除最早的语音记录文件;对于放音系统的控制,设置两个热键一个键使放音序号前指30个字或词,一个键使放音序号后指30个字或词,当前位置的缺省值是录音开始的第一语音数据。
5.根据权利要求1所述,原音校正文稿工具的特征在于原音校正的文稿限于中文文稿。
6.根据权利要求1所述,原音校正文稿工具的特征在于在语音+手写无键汉字输入时,进行原音录放,校正文稿。
7.根据权利要求1所述,原音校正文稿工具的特征在于原音录放并校正文稿适用于近远程网络和通讯。
全文摘要
本发明原音校正文稿工具,属于计算机语音识别输入系统技术领域。本发明在语音识别系统进行语音识别时,将原始语音数据经过压缩,同步地保存在磁盘、光盘或其它媒体中,当录入的文稿中有通过上下文不能判定的错误时,放出原音,便可方便地予以校正。采用本发明使得文稿校正工作可以完全脱离原稿,文字录入、输出的工作量和时间减少一半以上。
文档编号G06F17/27GK1112251SQ94105058
公开日1995年11月22日 申请日期1994年5月16日 优先权日1994年5月16日
发明者孙益寰, 卜伟, 马国华, 夷延有 申请人:北京超凡电子科技有限公司