语音识别修正方法、装置和存储介质与流程

文档序号：20373069发布日期：2020-04-14 13:30阅读：172来源：国知局

本发明涉及电视语音交互领域，尤其涉及一种语音识别修正方法、装置和计算机可读存储介质。

背景技术：

语音识别(automaticspeechrecognition,asr)是指将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。语音识别技术目前已应用到越来越多的行业当中，例如家电、通信、汽车电子、医疗、家庭服务、消费电子产品等。

但是，语音识别是一种依靠计算机深度学习的识别技术方法，因此，在语音识别的过程中，往往会因为用户的口音和计算机的的技术限制等原因，产生语音识别错误的问题，导致无法准确识别出用户想要表达的语音信息。

技术实现要素：

本发明的主要目的在于提供一种语音识别修正方法、装置和计算机可读存储介质，旨在实现在用户语音识别过程中发生错误时，对用户的语音识别结果进行修正。

为实现上述目的，本发明提供一种语音识别修正方法，所述语音识别修正方法包括以下步骤：

在语音识别过程中，监测到用户删除语音识别结果时，获取用户重新输入的语音信息；

对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果序列；

将所述语音识别结果序列按照预设规则进行显示。

可选地，所述将所述语音识别结果序列按照预设规则进行显示的步骤包括：

将所述语音识别结果序列中的语音识别结果按照排序依次进行显示；

若监测到用户删除正在显示的语音识别结果，则获取所述语音识别结果序列中排序后一位的语音识别结果；

将所述排序后一位的语音识别结果进行显示。

可选地，所述将所述语音识别结果序列按照预设规则进行显示的步骤包括：

获取所述语音识别结果序列中排序预设个数的语音识别结果；

将所述排序预设个数的语音识别结果进行显示，以便于用户进行选择。

可选地，所述对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果序列的步骤包括：

对所述语音信息进行大数据比对，获得所述语音信息进行语音识别后的语音识别结果集合；

对所述语音识别结果集合按照使用次数进行排序，获得所述语音信息对应的语音识别结果序列。

可选地，所述对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果序列的步骤包括：

获取当前设备的地址信息；

根据所述地址信息确定所述语音信息的大数据比对区域；

对所述语音信息在所述大数据比对区域内进行大数据比对，获取所述语音信息对应的语音识别结果序列。

可选地，所述获取当前设备的地址信息的步骤包括：

获取当前设备的ip地址；

根据所述ip地址确定当前设备的地址信息。

可选地，所述对所述语音信息在所述大数据比对区域内进行大数据比对，获取所述语音信息对应的语音识别结果序列的步骤包括：

对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果集合；

对所述语音识别结果集合按照预设距离算法进行排序，获得所述语音信息对应的语音识别结果序列。

可选地，所述对所述语音识别结果集合按照预设距离算法进行排序，获得所述语音信息对应的语音识别结果序列的步骤包括：

获取所述语音识别结果集合中每一项语音识别结果的矩阵值；

对所述矩阵值进行符串扫描，获得矩阵最后值；

判断所述矩阵最后值是否大于预设阈值；

若是，则根据矩阵最后值对所述语音识别结果进行排序。

此外，为实现上述目的，本发明还提供一种语音识别修正装置，所述语音识别修正装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音识别修正程序，所述语音识别修正程序被所述处理器执行时实现如上所述的语音识别修正方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音识别修正程序，所述语音识别修正程序被处理器执行时实现上述的语音识别修正方法的步骤。

本发明提供一种语音识别修正方法、装置和计算机存储介质。在该方法中，在语音识别过程中，监测到用户删除语音识别结果时，获取用户重新输入的语音信息；对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果序列；将所述语音识别结果序列按照预设规则进行显示。通过上述方式，本发明能在用户语音识别过程中，监测到用户有删除语音识别结果的情况时，通过大数据对比的方式对用户语音输入的识别文字进行纠错，减少用户的语音重复次数，提升用户语音交互体验。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图；

图2为本发明语音识别修正方法第一实施例的流程示意图；

图3为本发明语音识别修正方法第二实施例的流程示意图；

图4为本发明语音识别修正方法第三实施例的流程示意图；

图5为本发明语音识别修正方法第四实施例的流程示意图；

图6为本发明语音识别修正方法第五实施例的流程示意图；

图7为本发明语音识别修正方法第六实施例的流程示意图；

图8为本发明语音识别修正方法第七实施例的流程示意图；

图9为本发明语音识别修正方法第八实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。

本发明实施例终端可以是pc，也可以是智能手机、平板电脑、便携计算机等具有数据处理功能的终端设备。

如图1所示，该终端可以包括：处理器1001，例如cpu，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、rf(radiofrequency，射频)电路，传感器、音频电路、wi-fi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音识别修正程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的语音识别修正程序，并执行以下操作：

在语音识别过程中，监测到用户删除语音识别结果时，获取用户重新输入的语音信息；

对所述语音信息进行大数据比对，获取所述语音信息对应的语音识别结果序列；

将所述语音识别结果序列按照预设规则进行显示。