语音异常诊断方法、装置、设备及存储介质与流程

文档序号:27242933发布日期:2021-11-03 19:27阅读:231来源:国知局
语音异常诊断方法、装置、设备及存储介质与流程

1.本发明涉及智能语音识别技术领域,尤其涉及一种语音异常诊断方法、装置、设备及存储介质。


背景技术:

2.最近几年来随着深度学习技术的突破,大数据技术以及自然语言理解能力的提升,带动了一波产业热潮。智能语音正在改变着我们的生活习惯,主要应用在移动设备、汽车、家居三大场景,用来变革原有人机交互方式。
3.语音识别,越来越被大众认可,搭载语音功能的设备也越来越多。智能语音给人们带来方便的同时,偶尔也会有点脾气。远场语音无法唤醒,语音无法识别,语音指令无法正确执行等。语音功能,包括录音、语音识别、语义理解、指令执行等。链路比较长,语音问题分析不太方便。
4.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

5.本发明的主要目的在于提供了一种语音异常诊断方法、装置、设备及存储介质,旨在解决现有技术中带有语音功能的设备发生语音异常时,需要运维人员到场维修,导致的维修繁琐、效率低的技术问题。
6.为实现上述目的,本发明提供了一种语音异常诊断方法,所述方法包括以下步骤:
7.将语音服务切换至录音模式,并播放预先录制的原始语音;
8.在所述录音模式下对所述原始语音进行录制,获得录制语音;
9.通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断。
10.可选地,所述通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断的步骤,包括:
11.根据预设截取规则对所述录制语音进行截取,得到目标录制语音;
12.通过预设通话算法和所述原始语音对所述目标录制语音进行分析,并根据分析结果进行语音异常诊断。
13.可选地,所述通过预设通话算法和所述原始语音对所述目标录制语音进行分析,并根据分析结果进行语音异常诊断的步骤之后,还包括:
14.根据所述分析结果确定所述目标录制语音的振幅;
15.根据所述振幅判断所述目标录制语音是否为数据能量低的录音;
16.在所述目标录制语音为数据能量低的录音时,反馈预设提示信息。
17.可选地,所述根据所述分析结果确定所述目标录制语音的振幅的步骤之后,还包括:
18.根据所述振幅判断所述目标录制语音是否为数据全零的录音;
19.在所述目标录制语音为数据全零的录音时,提示用户检测麦克风的连接线路是否正确。
20.可选地,所述将语音服务切换至录音模式,并播放预先录制的原始语音的步骤之前,还包括:
21.在语音服务功能异常时,判断当前网络环境是否正常;
22.在所述当前网络环境正常时,执行所述将语音服务切换至录音模式,并播放预先录制的原始语音的步骤。
23.可选地,所述在语音服务功能异常时,判断当前网络环境是否正常的步骤包括:
24.在语音服务功能异常时,获取语音服务器的域名;
25.根据所述域名向所述语音服务器发送验证数据包,并接收所述语音服务器基于所述验证数据包反馈的回复报文;
26.根据所述回复报文判断当前网络环境是否正常。
27.可选地,所述通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断的步骤之后,还包括:
28.在根据所述分析结果判定所述录制语音正常时,保存预设时间段内的系统日志和所述录制语音;
29.将所述系统日志和所述录制语音上传至语音服务器。
30.此外,为实现上述目的,本发明还提供一种语音异常诊断装置,所述装置包括:
31.切换模块,用于将语音服务切换至录音模式,并播放预先录制的原始语音;
32.录制模块,用于在所述录音模式下对所述原始语音进行录制,获得录制语音;
33.分析模块,用于通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断。
34.此外,为实现上述目的,本发明还提出一种语音异常诊断设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音异常诊断程序,所述语音异常诊断程序配置为实现如上文所述的语音异常诊断方法的步骤。
35.此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有语音异常诊断程序,所述语音异常诊断程序被处理器执行时实现如上文所述的语音异常诊断方法的步骤。
36.本发明通过将语音服务切换至录音模式,并播放预先录制的原始语音;在录音模式下对原始语音进行录制,获得录制语音;通过预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断。由于本发明是根据对预先录制的原始语言进行播放,然后获得录制语音,根据预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断,相对于现有的语音出现故障后就联系运维解决的方式,本发明上述方式能够对语音异常进行初步分析,提高了语音异常诊断的效率。
附图说明
37.图1是本发明实施例方案涉及的硬件运行环境的语音异常诊断设备的结构示意图;
38.图2为本发明语音异常诊断方法第一实施例的流程示意图;
39.图3为本发明语音异常诊断方法第二实施例的流程示意图;
40.图4为本发明语音异常诊断方法第二实施例的语音异常诊断流程示意图;
41.图5为本发明语音异常诊断装置第一实施例的结构框图。
42.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
43.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
44.参照图1,图1为本发明实施例方案涉及的硬件运行环境的语音异常诊断设备结构示意图。
45.如图1所示,该语音异常诊断设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless

fidelity,wi

fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram),也可以是稳定的非易失性存储器(non

volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
46.本领域技术人员可以理解,图1中示出的结构并不构成对语音异常诊断设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
47.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音异常诊断程序。
48.在图1所示的语音异常诊断设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明语音异常诊断设备中的处理器1001、存储器1005可以设置在语音异常诊断设备中,所述语音异常诊断设备通过处理器1001调用存储器1005中存储的语音异常诊断程序,并执行本发明实施例提供的语音异常诊断方法。
49.基于上述语音异常诊断设备,本发明实施例提供了一种语音异常诊断方法,参照图2,图2为本发明语音异常诊断方法第一实施例的流程示意图。
50.本实施例中,所述语音异常诊断方法包括以下步骤:
51.步骤s10:将语音服务切换至录音模式,并播放预先录制的原始语音。
52.需要说明的是,本实施例的执行主体可以是一种具有数据处理、网络通信以及程序运行功能的计算服务设备,例如手机、平板电脑、个人电脑等,或者是一种能够实现上述功能的电子设备或语音异常诊断设备。以下以所述语音异常诊断设备为例,对本实施例及下述各实施例进行说明。
53.需要说明的是,所述录音模式可以是预先设置的可以在语音异常时进行初步诊断的模式,例如,可以是自播自录的模式,即自己播放预先设置的语音并录制的模式。所述原始语音可以是预先录制的用于在语音异常时进行初步诊断的语音。
54.在具体实施中,当带有智能语音功能的设备出现语音异常时,语音异常诊断设备
将当前的语音服务切换至预设的自播自录的模式,并播放预先录制的原始语音。
55.步骤s20:在所述录音模式下对所述原始语音进行录制,获得录制语音。
56.需要说明的是,所述录制语音可以是对原始语音进行录制,获得的语音。
57.在具体实施中,语音异常诊断设备在自播自录的模式下录制播放的原始语音,获得录制语音
58.步骤s30:通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断。
59.需要说明的是,所述预设通话算法可以是能够对所述录制语音进行特征提取,分析等的算法,例如,通过算法计算得到所述录制语音的振幅。可以是对获得的录制语音采用pcm编码,得到录制语音的原始pcm数据,根据原始pcm数据得到录制语音的振幅信息,根据录制语音的振幅信息得到录制语音的分析结果。根据分析结果进行语音异常诊断可以是根据分析结果中的录制语音的振幅大小与预先设置的振幅阈值进行比较得到语音异常诊断结果。所述录制语音的振幅大小可以是所述录制语音的振幅总和。
60.应理解的是,原始语音的频率和振幅对录制语音的频率和振幅会有一定的影响,因此,在对录制语音进行分析,得到分析结果的时候,需要考虑原始语音的特征信息,例如,振幅和频率。一般来说,原始语音的振幅越大,录制语音的振幅也相对越大。此时,预先设置的振幅阈值也相对较大。其中,麦克风的原始音增益也是一个分析因素,例如,某些电视麦克风原始音增益为0,则预先设置的振幅阈值就设置的比较小,如果麦克风原始音加了比较大的增益,那预先设置的振幅阈值就较大。
61.在具体实施中,语音异常诊断设备对获得的录制语音采用pcm编码,得到录制语音的原始pcm数据,根据原始pcm数据得到录制语音的振幅信息获得原始语音的特征信息,例如频率和振幅,获取录制所述录制语音的麦克风的原始音增益,根据原始语音的特征信息和麦克风原始音增益确定一个振幅阈值,用来对所述录制语音进行诊断。将录制语音的振幅与振幅阈值进行比较,得到语音异常诊断结果。根据原始语音的特征信息和麦克风原始音增益确定振幅阈值可以是通过语音异常诊断的经验确定,本实施例在此不加以限制。
62.进一步的,为了得到对目标录制语音进行分析的分析结果,所述步骤s10之前,还包括:
63.步骤s01:在语音服务功能异常时,判断当前网络环境是否正常。
64.步骤s02:在所述当前网络环境正常时,执行所述将语音服务切换至录音模式,并播放预先录制的原始语音的步骤。
65.需要说明的是,所述语音服务功能异常可以是带有语音功能的设备不能正常运行。例如,远场语音无法唤醒,语音无法识别,语音指令无法正确执行等。语音功能包括录音、语音识别、语义理解、指令执行等。
66.进一步的,所述步骤s01可包括:在语音服务功能异常时,获取语音服务器的域名;根据所述域名向所述语音服务器发送验证数据包,并接收所述语音服务器基于所述验证数据包反馈的回复报文;根据所述回复报文判断当前网络环境是否正常。
67.需要说明的是,所述向语音服务器发送验证数据包可以通过ping语音服务器的方式获得语音服务器的回复报文,若ping语音服务器之后,没有收到语音服务器的回复报文或者报文缺失,即可以判断当前的网络环境异常。
68.进一步的,为了得到语音异常进一步的诊断结果,所述步骤s30之后,还包括:在根据所述分析结果判定所述录制语音正常时,保存预设时间段内的系统日志和所述录制语音;将所述系统日志和所述录制语音上传至语音服务器。
69.需要说明的是,所述预设时间段可以是预先设置的时长。所述系统日志可以是包括有用户使用语音服务设备时的系统数据。所述语音服务器可以是预先与语音服务设备关联的语音服务器。
70.在具体实施中,语音异常诊断设备在根据所述分析结果判定所述录制语音正常时,保存预先设置的时间段内的系统日志和所述录制语音,将所述系统日志和所述录制语音上传至语音服务器。以使开发人员根据系统日志和录制语音分析语音异常是软件原因还是硬件原因并及时维修。
71.本实施例将语音服务切换至录音模式,并播放预先录制的原始语音;在录音模式下对原始语音进行录制,获得录制语音;通过预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断。由于本实施例是根据对预先录制的原始语言进行播放,然后获得录制语音,根据预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断,相对于现有的语音出现故障后就联系运维解决的方式,本实施例上述方式能够对语音异常进行初步分析,提高了语音异常诊断的效率。
72.参考图3,图3为本发明语音异常诊断方法第二实施例的流程示意图。
73.基于上述第一实施例,在本实施例中,所述步骤s30包括:
74.步骤s301:根据预设截取规则对所述录制语音进行截取,得到目标录制语音。
75.需要说明的是,所述预设截取规则可以是预先设置的为了使诊断结果更加准确的截取规则,因为在录制前的一段时间,可能会出现一些异常的信号,导致检测失效,因此,在检测中,需要跳过一些字节的录制语音进行检测,例如,在实际应用中,录音前40960字节,可能会出现一些异常信号,导致全零检测失效。因此全零检测需跳过40960字节,防止测试失效。所述目标录制语音可以是通过预设截取规则对录制语音进行截取后的语音。
76.在具体实施中,语音异常诊断设备根据预设截取规则对所述录制语音进行截取,得到目标录制语音。例如,预设截取规则为剔除录制语音的前5秒的语音,则在通过预设通话算法对所述录制语音进行分析的时候,跳过所述录制语言的前5秒语音进行分析。
77.步骤s302:通过预设通话算法和所述原始语音对所述目标录制语音进行分析,并根据分析结果进行语音异常诊断。
78.需要说明的是,根据分析结果进行语音异常诊断可以是根据分析结果中的目标录制语音的振幅大小与预先设置的振幅阈值进行比较得到语音异常诊断结果。所述目标录制语音的振幅大小可以是所述目标录制语音的振幅总和。
79.进一步的,为了得到语音异常诊断结果,所述步骤s302之后,还包括步骤:
80.步骤s3021:根据所述分析结果确定所述目标录制语音的振幅。
81.步骤s3022:根据所述振幅判断所述目标录制语音是否为数据能量低的录音。
82.步骤s3023:在所述目标录制语音为数据能量低的录音时,反馈预设提示信息。
83.需要说明的是,所述目标录制语音的振幅可以是所述目标录制语音的振幅总和。所述根据所述振幅判断所述目标录制语音是否为数据能量低的录音可以是将所述振幅与预先设置的振幅阈值进行比较,若所述振幅小于所述预先设置的振幅阈值,即判定所述目
标录制语音为数据能量低的录音。所述预设提示信息可以是提示用户检查麦克风上的保护膜是否没有撕掉的信息,或者是其他的外界因素导致的语音设备虽然正常但是采集到的语音能量低即振幅小于预设振幅阈值。提示用户的方式可以为在可视界面上显示预设的提示信息,或者是语音播报等方式,本实施例在此不加以限制。
84.进一步的,为了得到语音异常诊断结果,所述步骤s3021之后,还包括步骤:根据所述振幅判断所述目标录制语音是否为数据全零的录音;在所述目标录制语音为数据全零的录音时,提示用户检测麦克风的连接线路是否正确。
85.需要说明的是,所述根据所述振幅判断所述目标录制语音是否为数据全零的录音可以是判断所述振幅的大小是否为0或接近于0,此时可以认为麦克风基本没有采集到播放的录制语音。此时,语音异常的故障一般为麦克风的连接线路故障,因此,提示用户检测麦克风的连接线路是否正确。
86.在具体实施中,语音异常诊断设备根据所述分析结果确定所述目标录制语音的振幅,判断所述振幅是否为0或基本为0,在所述目标录制语音的振幅为0或基本为0时,提示用户检测麦克风的连接线路是否正确。将所述振幅与预设的振幅阈值进行比较,在所述振幅小于所述预设的振幅阈值时,反馈麦克风的保护膜没撕开或其他外界因素导致的采集音过小的提示信息。
87.在具体实施中,可参照图4,图4为本发明语音异常诊断方法第二实施例的语音异常诊断流程示意图。依据图4可知,在语音异常时,先校验语音服务是否连接,在语音服务可以访问的时候,切换录音模式,即自播自录的模式,录制预先设置的麦克风的原始语音,得到录制语音,分析录制语音是否正常,在录制语音正常的时候,保存录制的音频,提醒用户正常使用语音,并上传日志和录制语音到后台的语音服务器,以使开发人员进一步的分析诊断。在录制语音不正常时,判断录制的语音是否为录音数据全零的语音,即振幅为0,在录制语音为录音数据全零的语音时,提醒用户检测麦克风(mic)线连接是否正确,在录制语音为数据能量低的语音时,即录制语音的振幅小于预设的振幅阈值,提醒用户确认是否为麦克风上的保护膜没有撕掉。
88.本实施例根据预设截取规则对所述录制语音进行截取,得到目标录制语音;通过预设通话算法和所述原始语音对所述目标录制语音进行分析,并根据分析结果进行语音异常诊断。根据所述分析结果确定所述目标录制语音的振幅;根据所述振幅判断所述目标录制语音是否为数据能量低的录音;在所述目标录制语音为数据能量低的录音时,反馈预设提示信息。本实施例通过目标录制语音的振幅判断语音异常的初步诊断结果,并发出预设的提示信息,完成了语音异常的初步诊断,提高了语音异常时的诊断效率。
89.参照图5,图5为本发明语音异常诊断装置第一实施例的结构框图。
90.如图5所示,本发明实施例提出的语音异常诊断装置包括:
91.切换模块10,用于将语音服务切换至录音模式,并播放预先录制的原始语音;
92.录制模块20,用于在所述录音模式下对所述原始语音进行录制,获得录制语音;
93.分析模块30,用于通过预设通话算法和所述原始语音对所述录制语音进行分析,并根据分析结果进行语音异常诊断。
94.本实施例将语音服务切换至录音模式,并播放预先录制的原始语音;在录音模式下对原始语音进行录制,获得录制语音;通过预设通话算法和原始语音对录制语音进行分
析,并根据分析结果进行语音异常诊断。由于本实施例是根据对预先录制的原始语言进行播放,然后获得录制语音,根据预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断,相对于现有的语音出现故障后就联系运维解决的方式,本实施例上述方式能够对语音异常进行初步分析,提高了语音异常诊断的效率。
95.需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
96.另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的参数运行方法,此处不再赘述。
97.基于本发明上述语音异常诊断装置第一实施例,提出本发明语音异常诊断装置的第二实施例。
98.在本实施例中,所述分析模块30,还用于根据预设截取规则对所述录制语音进行截取,得到目标录制语音;通过预设通话算法和所述原始语音对所述目标录制语音进行分析,并根据分析结果进行语音异常诊断。
99.进一步的,所述分析模块30,还用于根据所述分析结果确定所述目标录制语音的振幅;根据所述振幅判断所述目标录制语音是否为数据能量低的录音;在所述目标录制语音为数据能量低的录音时,反馈预设提示信息。
100.进一步的,所述分析模块30,还用于根据所述振幅判断所述目标录制语音是否为数据全零的录音;在所述目标录制语音为数据全零的录音时,提示用户检测麦克风的连接线路是否正确。
101.进一步的,所述切换模块10,还用于在语音服务功能异常时,判断当前网络环境是否正常;在所述当前网络环境正常时,执行所述将语音服务切换至录音模式,并播放预先录制的原始语音的步骤。
102.进一步的,所述切换模块10,还用于在语音服务功能异常时,获取语音服务器的域名;根据所述域名向所述语音服务器发送验证数据包,并接收所述语音服务器基于所述验证数据包反馈的回复报文;根据所述回复报文判断当前网络环境是否正常。
103.进一步的,所述分析模块30,还用于在根据所述分析结果判定所述录制语音正常时,保存预设时间段内的系统日志和所述录制语音;将所述系统日志和所述录制语音上传至语音服务器。
104.本发明语音异常诊断装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
105.此外,本发明实施例还提出一种存储介质,所述存储介质上存储有语音异常诊断程序,所述语音异常诊断程序被处理器执行时实现如上文所述的语音异常诊断方法的步骤。
106.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
107.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
108.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
109.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1