语音数据的语义识别方法、装置、设备及存储介质与流程

文档序号:29850603发布日期:2022-04-30 07:44阅读:200来源:国知局
语音数据的语义识别方法、装置、设备及存储介质与流程

1.本技术涉及到人工智能技术领域,特别是涉及到一种语音数据的语义识别方法、装置、介质及设备。


背景技术:

2.智能客户、ai助手、人机对话等是ai科学重要的领域,然而在将ai应用于现实场景中时,就需要多个领域的系统协同配合才能模仿人类进行工作,在这种情况下,只有准确理解对方的语言所表达的含义,机器才能做出正确的响应。现有技术中,在对方答复的数据量较小的情况下,有可能导致模型的泛化能力不足,影响语音识别的准确度的问题,


技术实现要素:

3.本技术的主要目的为提供一种语音数据的语义识别方法、装置、介质及设备,旨在解决现有技术中的在对方答复的数据量较小的情况下,难以准确进行语义识别的技术问题。
4.为了实现上述发明目的,本技术提出一种语音数据的语义识别方法,所述方法包括:
5.获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
6.接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
7.分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
8.将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
9.进一步的,所述根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,包括:
10.建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向;
11.根据所述梯度方向的反方向进行所述损失函数的权重更新,以使所述损失函数收敛,根据收敛后的所述损失函数求解所述约束参数,并根据求解的所述约束参数对所述第一识别模型进行更新。
12.进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,包括:
13.识别所述语音数据的语音序列,将所述语音序列与每一条预设的非正常序列分别进行相似度计算;
14.当每一个所述相似度均小于预设的相似阈值时,将所述语音数据输入目标识别模
型中,以使所述目标识别模型对所述语音数据进行语义识别。
15.进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
16.识别所述语音数据的空白数据;
17.在所述空白数据对应的位置添加分隔符,并删除所述空白数据,得到语音分隔数据;
18.将所述语音分隔数据输入所述目标识别模型,以使所述目标识别模型对所述语音分隔数据进行语义识别。
19.进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
20.将所述语音数据转换为文本数据,并通过预设的条件随机场分词模型对所述文本数据进行分词,得到若干个词语段落,其中,每一个所述词语段落分别包含至少一个语义;
21.通过所述目标识别模型,根据所述词语段落进行语义识别。
22.进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
23.从云端服务器中获取通过第一密钥加密的加密源数据;
24.校验所述加密源数据的签名是否与解密密钥的签名匹配,若匹配,通过所述目标识别模型,对所述加密源数据解密后得到的所述语音数据进行语义识别。
25.进一步的,所述计算所述第一识别结果的对应的第一损失值,包括:
26.通过交叉熵损失函数,计算所述第一识别结果的对应的第一损失值。
27.本技术还提出了一种语音数据的语义识别装置,包括:
28.第一模型构建模块,用于获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
29.第一语义识别模块,用于接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
30.模型更新模块,用于分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
31.第二语义识别模块,用于将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
32.本技术还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
33.本技术还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
34.本技术的语音数据的语义识别方法、装置、介质及设备,通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题;通过随机删除隐藏
神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险;通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度;通过将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,在语音数据有噪音的情况下,提升了模型的泛化能力,从而降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,进而提高了目标识别模型进行语音识别的准确度。
附图说明
35.图1为本技术一实施例的语音数据的语义识别方法的流程示意图;
36.图2为本技术一实施例的语音数据的语义识别装置的结构示意框图;
37.图3为本技术一实施例的计算机设备的结构示意框图。
38.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
39.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
40.参照图1,本技术实施例中提供一种为了实现上述发明目的,本技术提出一种语音数据的语义识别方法,所述方法包括:
41.s1:获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
42.s2:接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
43.s3:分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
44.s4:将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
45.本实施例通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题;通过随机删除隐藏神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险;通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度;通过将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,在语音数据有噪音的情况下,
提升了模型的泛化能力,从而降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,进而提高了目标识别模型进行语音识别的准确度。
46.对于步骤s1,本实施例应用于语义识别,尤其是语义识别模型的训练中,可以基于人工智能技术对模型进行训练。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。上述初始识别模型为包含语音识别和识别算法的神经网络模型,其中包括若干个神经元。在实际的对话场景中,如:机器人提问,q:请问你住在a城市还是b城市?客户回答:我就住在**区(县);然而在实际场景中,asr(自动语音识别技术,automatic speech recognition)将客户语音转为文本后,插入等错误较高,如asr的文本可能会转为:额救住在**区,而“额救住在**区”等识别错误的文本会作为噪声数据,在初始识别模型的训练时,如果模型中的约束和噪声参数较多,但是训练样本较少时,会容易导致训练得到的模型产生过拟合的问题,导致模型泛化能力差。因此在具体的实施方式中,可以通过dropout的方式,即对于神经网络单元,按照一定的概率将其暂时从网络中丢弃的方式,随机选取一部分隐藏神经元进行删除,从而对初始识别模型进行优化,简化模型中的约束,形成简化后的第一识别模型。本技术通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题。
47.对于步骤s2,生成第一识别模型后,获取训练样例,将训练样例通过第一识别模型的输入神经元向模型内传播,以使简化后的第一识别模型根据上述语义识别算法对训练样例进行语义识别,由于dropout的随机性,当删除的隐藏神经元不同时,同一个训练样例输入dropout后,有可能得到不同的特征变量的第一识别结果。本技术中,通过随机删除隐藏神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险。
48.对于步骤s3,通过第一识别模型对训练样本进行识别后,可以对第一识别结果进行loss计算,得到第一损失值;具体来说,可以通过损失函数进行第一损失值计算,上述损失函数通常由真实值和预测值组成,当预测值和真实值相等时,loss值最小,当预测值和真实值相差值越大,loss值越大;通过计算第一损失值,能够对当前的第一识别模型的语义识别的准确性进行量化,当第一损失值较大时,表示当前的第一识别模型的识别准确率较低,应当根据第一损失值对第一语义识别中,语义识别算法的约束参数进行更改,得到新的识别模型,若新的识别模型的识别结果对应的损失值仍然过大,则再次对新的识别模型进行参数更新,最终循环得到损失值满足条件的识别模型。本技术中,通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度。
49.对于步骤s4,当对第一识别模型中的约束参数更新后,若第一损失值能够满足上述预设的损失范围,则表示当前的第一识别模型为准确度较高的语义识别模型,因此,可以将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,从而在语音数据有噪音的情况下,提升模型的泛化能力,降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,提升客户体验。
50.在一个实施例中,所述根据所述第一损失值对所述第一识别模型中语义识别算法
的约束参数进行更新,包括:
51.s31:建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向;
52.s32:根据所述梯度方向的反方向进行所述损失函数的权重更新,以使所述损失函数收敛,根据收敛后的所述损失函数求解所述约束参数,并根据求解的所述约束参数对所述第一识别模型进行更新。
53.本实施例通过建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向,可以计算损失函数收敛时对应的约束参数,从而更新第一识别模型,使其对训练样例再次进行分类,提高了模型更新的准确性和稳定性。
54.对于步骤s31,可以基于随机梯度下降法进行约束参数更新,具体地,可以把要最小化或最大化的函数作为目标函数,当需要对目标函数进行最小化时,就可以将其视为损失函数,对于损失函数,可以通过计算损失函数曲面上方向导数的最大值,并将最大值的方向视为梯度方向,因此在进行梯度下降时,是沿着梯度的反方向进行权重的更新,从而有效地找到全局的最优解。最小值、极小值、鞍点等梯度为0的点均可作为上述损失函数收敛的点。
55.对于步骤s32,当得到收敛后的损失函数后,计算损失函数收敛时对应的约束参数,将约束参数代入模型中,从而完成第一识别模型更新,使其对训练样例再次进行分类,提高了模型更新的准确性和稳定性。
56.在一个实施例中,所述通过所述目标识别模型对接收到的语音数据进行语义识别,包括:
57.s41:识别所述语音数据的语音序列,将所述语音序列与每一条预设的非正常序列分别进行相似度计算;
58.s42:当每一个所述相似度均小于预设的相似阈值时,将所述语音数据输入目标识别模型中,以使所述目标识别模型对所述语音数据进行语义识别。
59.本实施例通过对语音数据的语音序列与预设的非正常序列进行相似度计算,并对相似度较小的语音数据进行语义识别,避免了对环境音或其它非人声数据的识别,提高了识别效率和有效性。
60.对于步骤s41,由于在ai与用户的语音沟通过程中,不可避免地会收录到环境音,若环境音过大时,可能会导致环境音被目标识别模型错误识别,导致模型资源浪费,并且也无法得到有意义的语音识别结果。因此,在通过目标识别模型进行语义识别之前,先获取语音数据进行语音序列,该语音序列可以为特征向量,将特征向量与预设的非正常序列进行相似度计算,从而判断该语音数据是否为正常的人声数据。示例性地,上述非正常序列可以为车辆发动声对应的序列,也可以为动物叫声对应的序列。
61.对于步骤s42,将语音序列与每一条预设的非正常序列分别进行相似度计算后,会得到分别对应不同非正常序列的相似度,当每一个相似度均小于预设的相似阈值时,判定该条语音序列对应的语音数据为正常语音;若存在一个或多个相似度不小于预设的相似度阈值,即与非正常序列过于相近,则认为该语音序列对应的语音数据为非正常语音。
62.在一个实施例中,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
63.s43:识别所述语音数据的空白数据;
64.s44:在所述空白数据对应的位置添加分隔符,并删除所述空白数据,得到语音分隔数据;
65.s45:将所述语音分隔数据输入所述目标识别模型,以使所述目标识别模型对所述语音分隔数据进行语义识别。
66.本实施例通过识别语音数据中的空白数据,并在空白数据所在的位置添加分隔符,以便于目标识别模型根据分隔符对语音数据进行断句,从而提高对语音数据识别的准确性。
67.对于步骤s43,ai与用户的对话过程中,往往会由于用户存在思考和语言组织时间,导致存在一定的空档期,该空档期内,若不存在环境音,则往往是空白数据的形式出现,因此,可以根据当前语音数据的音量大小或声纹状况判断当前的语音数据是否存在空白数据,从而对空白数据进行删除。
68.对于步骤s44,由于空白数据出现时往往是对话的中断时间,空白数据的上文和下文往往是属于不同的语句,因此可以在空白数据所在的位置添加分隔符,以便于目标识别模型根据分隔符对语音数据进行断句,从而提高对语音数据识别的准确性。
69.在一个实施例中,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
70.s46:将所述语音数据转换为文本数据,并通过预设的条件随机场分词模型对所述文本数据进行分词,得到若干个词语段落,其中,每一个所述词语段落分别包含至少一个语义;
71.s47:通过所述目标识别模型,根据所述词语段落进行语义识别。
72.本实施例通过对语音数据对应的文本数据进行分词,避免了对整体语句进行识别时的语义偏差,从而提高了目标识别模型的语义识别准确性。
73.对于步骤s46,上述条件随机场分词模型包括crf(条件随机场,conditional random fields),在具体的实施方式中,可以将文本数据输入预设的正则表达式中进行文本切割,再通过预设的bert(双向编码器,bidirectional encoder representation from transformers)和crf(条件随机场,conditional random fields)进行输出词语段落;具体来说,将上述文本数据对应的特征向量输入bert中,得到文本数据中每个字符的全局向量,并将全局向量输入crf中,得到分词结果,其中,经过bert输出的全局变量是能够融合左右上下文信息的深层双向语言表征,而crf能够通过特征函数将全局变量划分为动词、名词等,以“我吃苹果”为例,crf能够将其拆分为“我”(名词)、“吃”(动词)、“苹果”(名词),避免出现“苹”和“果”等不完整的识别结果,从而确保每一个上述词语段落分别表征一个完整的含义。
74.在一个实施例中,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
75.s48:从云端服务器中获取通过第一密钥加密的加密源数据;
76.s49:校验所述加密源数据的签名是否与解密密钥的签名匹配,若匹配,通过所述目标识别模型,对所述加密源数据解密后得到的所述语音数据进行语义识别。
77.本实施例通过从云端服务器中获取加密后的数据,并对数据进行签名校验,避免了用户信息在传输过程中被盗取,以及避免了获取到的数据被恶意篡改的问题。
78.对于步骤s48,当搭载在服务机器人等智能问答设备中的ai获取到用户的回复语音后,通过第一密钥对回复语音进行加密形成加密源数据,并在加密源数据中添加第一密钥唯一对应的签名,并上传至云端服务器。而本步骤的执行端从云端服务器中获取加密源数据。
79.对于步骤s49,获取到加密源数据后,首先校验加密源数据中是否存在第一密钥的完整签名,若存在,则表示加密源数据未经损坏和篡改,此时可以继续进行后续语义识别;若不存在,则对云端服务器发送告警信号,以便于对通信环境和云端服务器进行安全性排查。
80.在一个实施例中,所述计算所述第一识别结果的对应的第一损失值,包括:
81.s33:通过交叉熵损失函数,计算所述第一识别结果的对应的第一损失值。
82.本实施例通过交叉熵损失函数,计算所述第一识别结果的对应的第一损失值,从而准确衡量神经网络的预测值与实际值之间的差距,从而更有效地促进模型的训练。
83.对于步骤s33,在具体的实施方式中,可以根据下式计算上述第一损失值:
[0084][0085]
公式中x表示样本,y表示实际的标签,a表示预测的输出,n表示样本总数量。在具体的实施方式中,只需要在模型训练过程中将一个batch中的数据重复输入到模型,同一个样本对就是正样本对,就可以实现在某个样本的基础上构造出一个新的样本,然后计算相应的第一损失值loss,进行模型参数的更新。
[0086]
参照图2,本技术还提出了一种语音数据的语义识别装置,包括:
[0087]
第一模型构建模块100,用于获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
[0088]
第一语义识别模块200,用于接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
[0089]
模型更新模块300,用于分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
[0090]
第二语义识别模块400,用于将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
[0091]
本实施例通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题;通过随机删除隐藏神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险;通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度;通过将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,在语音数据有噪音的情况下,
提升了模型的泛化能力,从而降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,进而提高了目标识别模型进行语音识别的准确度。
[0092]
在一个实施例中,模型更新模块300具体用于:
[0093]
建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向;
[0094]
根据所述梯度方向的反方向进行所述损失函数的权重更新,以使所述损失函数收敛,根据收敛后的所述损失函数求解所述约束参数,并根据求解的所述约束参数对所述第一识别模型进行更新。
[0095]
在一个实施例中,第二语义识别模块400具体用于:
[0096]
识别所述语音数据的语音序列,将所述语音序列与每一条预设的非正常序列分别进行相似度计算;
[0097]
当每一个所述相似度均小于预设的相似阈值时,将所述语音数据输入目标识别模型中,以使所述目标识别模型对所述语音数据进行语义识别。
[0098]
在一个实施例中,第二语义识别模块400具体用于:
[0099]
识别所述语音数据的空白数据;
[0100]
在所述空白数据对应的位置添加分隔符,并删除所述空白数据,得到语音分隔数据;
[0101]
将所述语音分隔数据输入所述目标识别模型,以使所述目标识别模型对所述语音分隔数据进行语义识别。
[0102]
在一个实施例中,第二语义识别模块400具体用于:
[0103]
将所述语音数据转换为文本数据,并通过预设的条件随机场分词模型对所述文本数据进行分词,得到若干个词语段落,其中,每一个所述词语段落分别包含至少一个语义;
[0104]
通过所述目标识别模型,根据所述词语段落进行语义识别。
[0105]
在一个实施例中,第二语义识别模块400具体用于:
[0106]
从云端服务器中获取通过第一密钥加密的加密源数据;
[0107]
校验所述加密源数据的签名是否与解密密钥的签名匹配,若匹配,通过所述目标识别模型,对所述加密源数据解密后得到的所述语音数据进行语义识别。
[0108]
在一个实施例中,模型更新模块300具体用于:
[0109]
通过交叉熵损失函数,计算所述第一识别结果的对应的第一损失值。
[0110]
参照图3,本技术实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存语音数据的语义识别方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音数据的语义识别方法。所述语音数据的语义识别方法,包括:获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干
个第一识别结果;分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
[0111]
本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种语音数据的语义识别方法,包括步骤:获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
[0112]
上述执行的语音数据的语义识别方法,本实施例通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题;通过随机删除隐藏神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险;通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度;通过将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,在语音数据有噪音的情况下,提升了模型的泛化能力,从而降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,进而提高了目标识别模型进行语音识别的准确度。
[0113]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0114]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该
要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0115]
以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1