语音信号的识别方法、装置、电子设备、存储介质及产品与流程

文档序号:29565724发布日期:2022-04-09 02:23阅读:120来源:国知局
语音信号的识别方法、装置、电子设备、存储介质及产品与流程

1.本技术涉及语音交互技术领域,特别涉及一种语音信号的识别方法、装置、电子设备、存储介质及产品。


背景技术:

2.目前,语音唤醒功能在语音交互技术中得到了广泛的应用。在用户与电子设备进行语音交互之前,需要通过唤醒词唤醒电子设备。
3.相关技术中,电子设备对接收到的语音信号进行识别,确定识别结果与唤醒词之间的相似度;若相似度大于预设阈值,则唤醒电子设备,若相似度不大于预设阈值,则不唤醒电子设备。
4.但是,在上述相关技术中,为了满足不同用户的需求,一般将预设阈值设定为一个适中的固定值,但是这样可能存在与唤醒词读音相近的词语(例如,与唤醒词“小度”读音相近的词语“小兔”),识别结果与唤醒词之间的相似度会大于预设阈值,从而出现误唤醒电子设备的情况,所以上述方法的误唤醒率较高。


技术实现要素:

5.本技术实施例提供了一种语音信号的识别方法、装置、电子设备、存储介质及产品,能够降低语音唤醒的误唤醒率。所述技术方案如下:
6.一方面,提供了一种语音信号的识别方法,所述方法包括:
7.接收目标语音信号,确定所述目标语音信号包括的多个语音帧;
8.确定所述多个语音帧在第一解码图中的第一路径的第一解码参数,以及确定所述多个语音帧在第二解码图中的第二路径的第二解码参数,所述第一解码图包括多个基础语音信号对应的解码路径,所述第二解码图包括多个唤醒语音信号对应的解码路径;
9.在所述第一解码参数和所述第二解码参数的差值不大于预设差值的情况下,确定所述第一路径包括的多个第一节点和每个第一节点的解码参数;
10.基于所述第一解码参数、所述多个第一节点和所述每个第一节点的解码参数,确定所述目标语音信号的识别结果,所述识别结果用于表示是否唤醒电子设备。
11.在一种可能的实现方式中,所述基于所述第一解码参数、所述多个第一节点和所述每个第一节点的解码参数,确定所述目标语音信号的识别结果,包括:
12.将所述第一解码参数、所述多个第一节点和所述每个第一节点的解码参数输入语音识别模型,得到所述目标语音信号的识别结果,所述语音识别模型用于基于路径的解码参数、路径包括的多个节点和每个节点的解码参数得到识别结果。
13.在另一种可能的实现方式中,训练所述语音识别模型的过程,包括:
14.获取样本语音信号,所述样本语音信号包括第一语音信号和第二语音信号,所述第一语音信号为唤醒词对应的语音信号,所述第二语音信号为非唤醒词对应的语音信号;
15.基于所述第一语音信号和所述第二语音信号,对初始识别模型进行训练,直至所
述初始识别模型的准确率达到预设阈值,得到所述语音识别模型。
16.在另一种可能的实现方式中,所述基于所述第一语音信号和所述第二语音信号,对初始识别模型进行训练,包括:
17.确定所述第一语音信号包括的多个语音帧在所述第一解码图中的第三路径,以及所述第二语音信号包括的多个语音帧在所述第一解码图中的第四路径;
18.确定第一路径信息和第二路径信息,所述第一路径信息包括第三路径的解码参数、所述第三路径包括的多个第三节点和每个第三节点的解码参数,所述第二路径信息包括第四路径的解码参数、所述第四路径包括的多个第四节点和每个第四节点的解码参数;
19.基于所述第一路径信息和所述第二路径信息,对初始识别模型进行训练。
20.在另一种可能的实现方式中,所述获取样本语音信号,包括:
21.接收唤醒词对应的语音信号和非唤醒词对应的语音信号;
22.对所述唤醒词对应的语音信号进行加噪处理,得到第一语音信号,以及,对所述非唤醒词对应的语音信号进行加噪处理,得到第二语音信号。
23.在另一种可能的实现方式中,所述确定所述多个语音帧在第一解码图中的第一路径的第一解码参数,包括:
24.确定所述多个语音帧在所述第一解码图中的多个解码路径的解码参数;
25.从所述多个解码路径的解码参数中,确定数值最大的解码参数为第一路径的第一解码参数。
26.在另一种可能的实现方式中,所述确定所述多个语音帧在第一解码图中的多个解码路径的解码参数,包括:
27.对于第一解码图中的每个解码路径,确定所述解码路径对应的基础语音信号;确定所述多个语音帧在所述解码路径下的第一语言解码参数和第一声学解码参数,所述第一语言解码参数用于表示所述多个语音帧与所述基础语音信号对应的词序列之间的匹配概率,所述第一声学解码参数用于表示所述多个语音帧与第一音素序列的匹配概率,所述第一音素序列为基于所述词序列分解得到的;
28.确定所述第一语言解码参数和所述第一声学解码参数的乘积,得到所述多个语音帧在所述解码路径下的解码参数。
29.在另一种可能的实现方式中,所述确定所述多个语音帧在第二解码图中的第二路径的第二解码参数,包括:
30.确定所述多个语音帧在所述第二解码图中的多个解码路径的解码参数;
31.从所述多个解码路径的解码参数中,确定数值最大的解码参数为第二路径的第二解码参数。
32.在另一种可能的实现方式中,所述确定所述多个语音帧在第二解码图中的多个解码路径的解码参数,包括:
33.对于第二解码图中的每个解码路径,确定所述解码路径对应的唤醒语音信号;确定所述多个语音帧在所述解码路径下的第二语言解码参数和第二声学解码参数,所述第二语言解码参数用于表示所述多个语音帧与唤醒语音信号对应的唤醒词序列之间的匹配概率,所述第二声学解码参数用于表示所述多个语音帧与第二音素序列的匹配概率,所述第二音素序列为基于所述唤醒词序列分解得到的;
34.确定所述第二语言解码参数和所述第二声学解码参数的乘积,得到所述多个语音帧在所述解码路径下的解码参数。
35.在另一种可能的实现方式中,每个语音帧包括第一预设时长的语音信号;
36.所述确定所述目标语音信号包括的多个语音帧,包括:
37.按照预设周期,对所述目标语音信号进行划分,得到所述目标语音信号包括的多个语音帧。
38.在另一种可能的实现方式中,所述确定所述第一路径包括的多个第一节点和每个第一节点的解码参数,包括:
39.确定所述第一路径包括的多个第一节点的跳转顺序;
40.根据所述跳转顺序,确定每个第一节点对应的语音帧;
41.确定所述每个第一节点对应的音素与所述语音帧对应的音素相一致的概率值,将所述概率值作为所述每个第一节点的解码参数。
42.另一方面,提供了一种语音信号的识别装置,所述装置包括:
43.接收模块,用于接收目标语音信号,确定所述目标语音信号包括的多个语音帧;
44.第一确定模块,用于确定所述多个语音帧在第一解码图中的第一路径的第一解码参数,以及确定所述多个语音帧在第二解码图中的第二路径的第二解码参数,所述第一解码图包括多个基础语音信号对应的解码路径,所述第二解码图包括多个唤醒语音信号对应的解码路径;
45.第二确定模块,用于在所述第一解码参数和所述第二解码参数的差值不大于预设差值的情况下,确定所述第一路径包括的多个第一节点和每个第一节点的解码参数;
46.第三确定模块,用于基于所述第一解码参数、所述多个第一节点和所述每个第一节点的解码参数,确定所述目标语音信号的识别结果,所述识别结果用于表示是否唤醒电子设备。
47.在一种可能的实现方式中,所述第三确定模块,用于将所述第一解码参数、所述多个第一节点和所述每个第一节点的解码参数输入语音识别模型,得到所述目标语音信号的识别结果,所述语音识别模型用于基于路径的解码参数、路径包括的多个节点和每个节点的解码参数得到识别结果。
48.在另一种可能的实现方式中,所述装置还包括训练模块,所述训练模块,包括:
49.获取单元,用于获取样本语音信号,所述样本语音信号包括第一语音信号和第二语音信号,所述第一语音信号为唤醒词对应的语音信号,所述第二语音信号为非唤醒词对应的语音信号;
50.训练单元,用于基于所述第一语音信号和所述第二语音信号,对初始识别模型进行训练,直至所述初始识别模型的准确率达到预设阈值,得到所述语音识别模型。
51.在另一种可能的实现方式中,所述训练单元,用于确定所述第一语音信号包括的多个语音帧在所述第一解码图中的第三路径,以及所述第二语音信号包括的多个语音帧在所述第一解码图中的第四路径;确定第一路径信息和第二路径信息,所述第一路径信息包括第三路径的解码参数、所述第三路径包括的多个第三节点和每个第三节点的解码参数,所述第二路径信息包括第四路径的解码参数、所述第四路径包括的多个第四节点和每个第四节点的解码参数;基于所述第一路径信息和所述第二路径信息,对初始识别模型进行训
练。
52.在另一种可能的实现方式中,所述获取单元,用于接收唤醒词对应的语音信号和非唤醒词对应的语音信号;对所述唤醒词对应的语音信号进行加噪处理,得到第一语音信号,以及,对所述非唤醒词对应的语音信号进行加噪处理,得到第二语音信号。
53.在另一种可能的实现方式中,第一确定模块,用于确定所述多个语音帧在所述第一解码图中的多个解码路径的解码参数;从所述多个解码路径的解码参数中,确定数值最大的解码参数为第一路径的第一解码参数。
54.在另一种可能的实现方式中,所述第一确定模块,用于对于第一解码图中的每个解码路径,确定所述解码路径对应的基础语音信号;确定所述多个语音帧在所述解码路径下的第一语言解码参数和第一声学解码参数,所述第一语言解码参数用于表示所述多个语音帧与所述基础语音信号对应的词序列之间的匹配概率,所述第一声学解码参数用于表示所述多个语音帧与第一音素序列的匹配概率,所述第一音素序列为基于所述词序列分解得到的;确定所述第一语言解码参数和所述第一声学解码参数的乘积,得到所述多个语音帧在所述解码路径下的解码参数。
55.在另一种可能的实现方式中,所述第一确定模块,还用于确定所述多个语音帧在所述第二解码图中的多个解码路径的解码参数;从所述多个解码路径的解码参数中,确定数值最大的解码参数为第二路径的第二解码参数。
56.在另一种可能的实现方式中,所述第一确定模块,还用于对于第二解码图中的每个解码路径,确定所述解码路径对应的唤醒语音信号;确定所述多个语音帧在所述解码路径下的第二语言解码参数和第二声学解码参数,所述第二语言解码参数用于表示所述多个语音帧与所述唤醒语音信号对应的唤醒词序列之间的匹配概率,所述第二声学解码参数用于表示所述多个语音帧与第二音素序列的匹配概率,所述第二音素序列为基于所述唤醒词序列分解得到的;确定所述第二语言解码参数和所述第二声学解码参数的乘积,得到所述多个语音帧在所述解码路径下的解码参数。
57.在另一种可能的实现方式中,每个语音帧包括第一预设时长的语音信号;
58.所述接收模块,用于按照预设周期,对所述目标语音信号进行划分,得到所述目标语音信号包括的多个语音帧。
59.在另一种可能的实现方式中,所述第二确定模块,用于确定所述第一路径包括的多个第一节点的跳转顺序;根据所述跳转顺序,确定每个第一节点对应的语音帧;确定所述每个第一节点对应的音素与所述语音帧对应的音素相一致的概率值,将所述概率值作为所述每个第一节点的解码参数。
60.另一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如上述任一实现方式所述的语音信号的识别方法。
61.另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如上述任一实现方式所述的语音信号的识别方法。
62.另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条程序
代码,所述至少一条程序代码由处理器加载并执行,以实现如上述任一实现方式所述的语音信号的识别方法。
63.本技术实施例提供的技术方案的有益效果至少包括:
64.本技术实施例提供了一种语音信号的识别方法,由于通过第一解码参数和第二解码参数的差值,考虑了语音信号与唤醒信号之间相似关系,通过第一路径对应的解码参数、第一路径上的多个第一节点和每个第一节点的解码参数等多个参数,考虑了语音信号对应的解码路径信息,这样既考虑到了语音信号与唤醒信号之间相似关系,又考虑到了语音信号对应的解码路径信息,所以提高了识别结果的准确性,降低了误唤醒率。
附图说明
65.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
66.图1是本技术实施例提供的一种实施环境的示意图;
67.图2是本技术实施例提供的一种语音信号的识别方法的流程图;
68.图3是本技术实施例提供的一种语音信号的识别方法的流程图;
69.图4是本技术实施例提供的一种语音信号的识别装置的框图;
70.图5是本技术实施例提供的一种语音信号的识别装置的框图;
71.图6是本技术实施例提供的一种电子设备的框图。
具体实施方式
72.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
73.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
74.图1是本技术实施例提供的一种实施环境的示意图。参见图1,该实施环境中包括电子设备101和服务器102。电子设备101上安装有服务器102提供服务的客户端,电子设备101对应的用户可以通过该客户端与服务器102之间实现例如数据传输、语音交互等功能。该客户端至少具备语音信号的识别功能,也即识别语音信号是否唤醒电子设备101,该客户端还可以具备语音控制功能等。其中,该客户端可以为语音助手或者语音控制应用等。
75.在一种可能的实现方式中,电子设备101对语音信号进行识别,识别出该语音信号用于唤醒电子设备101后,唤醒电子设备101,然后再次采集语音信号,识别再次采集的语音信号对应的控制指令,执行该控制指令对应的操作。其中,电子设备101识别再次采集的语音信号对应的控制指令,或者将再次采集的语音信号发送至服务器102,由服务器102识别再次采集的语音信号对应的控制指令,并返回给电子设备101。
76.电子设备101可以为电脑、手机、音响、空调、电视或者其他电子设备。服务器102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
77.图2是本技术实施例提供的一种语音信号的识别方法流程图,参见图2,该方法包括:
78.201、接收目标语音信号,确定目标语音信号包括的多个语音帧。
79.202、确定多个语音帧在第一解码图中的第一路径的第一解码参数,以及确定多个语音帧在第二解码图中的第二路径的第二解码参数,第一解码图包括多个基础语音信号对应的解码路径,第二解码图包括多个唤醒语音信号对应的解码路径。
80.203、在第一解码参数和第二解码参数的差值不大于预设差值的情况下,确定第一路径包括的多个第一节点和每个第一节点的解码参数。
81.204、基于第一解码参数、多个第一节点和每个第一节点的解码参数,确定目标语音信号的识别结果,识别结果用于表示是否唤醒电子设备。
82.在一种可能的实现方式中,基于第一解码参数、多个第一节点和每个第一节点的解码参数,确定目标语音信号的识别结果,包括:
83.将第一解码参数、多个第一节点和每个第一节点的解码参数输入语音识别模型,得到目标语音信号的识别结果,语音识别模型用于基于路径的解码参数、路径包括的多个节点和每个节点的解码参数得到识别结果。
84.在另一种可能的实现方式中,训练语音识别模型的过程,包括:
85.获取样本语音信号,样本语音信号包括第一语音信号和第二语音信号,第一语音信号为唤醒词对应的语音信号,第二语音信号为非唤醒词对应的语音信号;
86.基于第一语音信号和第二语音信号,对初始识别模型进行训练,直至初始识别模型的准确率达到预设阈值,得到语音识别模型。
87.在另一种可能的实现方式中,基于第一语音信号和第二语音信号,对初始识别模型进行训练,包括:
88.确定第一语音信号包括的多个语音帧在第一解码图中的第三路径,以及第二语音信号包括的多个语音帧在第一解码图中的第四路径;
89.确定第一路径信息和第二路径信息,第一路径信息包括第三路径的解码参数、第三路径包括的多个第三节点和每个第三节点的解码参数,第二路径信息包括第四路径的解码参数、第四路径包括的多个第四节点和每个第四节点的解码参数;
90.基于第一路径信息和第二路径信息,对初始识别模型进行训练。
91.在另一种可能的实现方式中,获取样本语音信号,包括:
92.接收唤醒词对应的语音信号和非唤醒词对应的语音信号;
93.对唤醒词对应的语音信号进行加噪处理,得到第一语音信号,以及,对非唤醒词对应的语音信号进行加噪处理,得到第二语音信号。
94.在另一种可能的实现方式中,确定多个语音帧在第一解码图中的第一路径的第一解码参数,包括:
95.确定多个语音帧在第一解码图中的多个解码路径的解码参数;
96.从多个解码路径的解码参数中,确定数值最大的解码参数为第一路径的第一解码参数。
97.在另一种可能的实现方式中,确定多个语音帧在第一解码图中的多个解码路径的解码参数,包括:
98.对于第一解码图中的每个解码路径,确定该解码路径对应的基础语音信号;确定多个语音帧在解码路径下的第一语言解码参数和第一声学解码参数,第一语言解码参数用于表示多个语音帧与基础语音信号对应的词序列之间的匹配概率,第一声学解码参数用于表示多个语音帧与第一音素序列的匹配概率,第一音素序列为基于词序列分解得到的;
99.确定第一语言解码参数和第一声学解码参数的乘积,得到多个语音帧在解码路径下的解码参数。
100.在另一种可能的实现方式中,确定多个语音帧在第二解码图中的第二路径的第二解码参数,包括:
101.确定多个语音帧在第二解码图中的多个解码路径的解码参数;
102.从多个解码路径的解码参数中,确定数值最大的解码参数为第二路径的第二解码参数。
103.在另一种可能的实现方式中,一个唤醒语音信号对应一个唤醒词序列;
104.确定多个语音帧在第二解码图中的多个解码路径的解码参数,包括:
105.对于第二解码图中的每个解码路径,确定该解码路径对应的唤醒语音信号;
106.确定多个语音帧在解码路径下的第二语言解码参数和第二声学解码参数,第二语言解码参数用于表示多个语音帧与唤醒语音信号对应的唤醒词序列之间的匹配概率,第二声学解码参数用于表示多个语音帧与第二音素序列的匹配概率,第二音素序列为基于唤醒词序列分解得到的;
107.确定第二语言解码参数和第二声学解码参数的乘积,得到多个语音帧在解码路径下的解码参数。
108.在另一种可能的实现方式中,每个语音帧包括第一预设时长的语音信号;
109.确定目标语音信号包括的多个语音帧,包括:
110.按照预设周期,对目标语音信号进行划分,得到目标语音信号包括的多个语音帧。
111.在另一种可能的实现方式中,确定第一路径包括的多个第一节点和每个第一节点的解码参数,包括:
112.确定第一路径包括的多个第一节点的跳转顺序;
113.根据跳转顺序,确定每个第一节点对应的语音帧;
114.确定每个第一节点对应的音素与语音帧对应的音素相一致的概率值,将概率值作为每个第一节点的解码参数。
115.本技术实施例提供了一种语音信号的识别方法,由于通过第一解码参数和第二解码参数的差值,考虑了语音信号与唤醒信号之间相似关系,通过第一路径对应的解码参数、第一路径上的多个第一节点和每个第一节点的解码参数等多个参数,考虑了语音信号对应的解码路径信息,这样既考虑到了语音信号与唤醒信号之间相似关系,又考虑到了语音信号对应的解码路径信息,所以提高了识别结果的准确性,降低了误唤醒率。
116.图3是本技术实施例提供的一种语音信号的识别方法流程图,由电子设备执行,参见图3,该方法包括:
117.301、电子设备接收目标语音信号,确定目标语音信号包括的多个语音帧。
118.电子设备包括休眠状态和唤醒状态,电子设备处于休眠状态时,通过语音信号唤醒电子设备,电子设备从休眠状态转换到唤醒状态。在一种可能的实现方式中,目标语音信号是电子设备处于休眠状态下接收到的任一语音信号。可选的,语音信号为用户发出的唤醒词对应的语音信号。
119.在一种可能的实现方式中,每个语音帧包括第一预设时长的语音信号。相应的,电子设备确定目标语音信号包括的多个语音帧的步骤为:电子设备按照预设周期,对目标语音信号进行划分,得到目标语音信号包括的多个语音帧。可选的,预设周期为第一预设时长,电子设备每间隔第一预设时长划分一次。在本技术实施例中,对第一预设时长的数值不作具体限定,可以根据需要进行设定并修改。可选的,第一预设时长为0.01s至0.1s之间的任一数值,例如:第一预设时长为0.01s、0.05s、0.1s等。
120.在一种可能的实现方式中,目标语音信号为信号时长大于第二预设时长的语音信号。相应的,电子设备接收目标语音信号的步骤为:电子设备接收语音信号,确定该语音信号的信号时长,若信号时长大于第二预设时长,确定该语音信号为目标语音信号。在本技术实施例中,对第二预设时长的数值不作具体限定,可以根据需要进行设定并修改。可选的,第二预设时长为0.5s至5s之间的任一数值,例如:第二预设时长为0.5s、1s、1.5s等。
121.在本技术实施例中,由于在语音信号的信号时长满足预设时长的情况下,才确定该语音信号为目标语音信号,从而能够筛除信号时长过短的无效语音信号,提高了目标语音信号的有效性,进而提高了该识别方法的准确性。
122.302、电子设备确定多个语音帧在第一解码图中的第一路径的第一解码参数,第一解码图包括多个基础语音信号对应的解码路径。
123.在一种可能的实现方式中,第一解码图为wfst(weighted finite state transducers,加权有限状态转换器)解码图中的基础解码图,该基础解码图包括多个基础语音信号对应的解码路径,其中,多个基础语音信号包括唤醒词对应的语音信号和非唤醒词对应的语音信号。路径的解码参数表示该路径在第一解码图中的路径得分,当通过第一解码图对语音信号进行解码时,在基础解码图中确定路径得分最高的最优路径为该语音信号对应的解码路径。
124.在一种可能的实现方式中,在通过第一解码图对目标语音信号进行解码时,第一解码图中第一路径的第一解码参数的数值最大;其中,第一解码参数为第一路径的路径得分,也就是说,第一路径为目标语音信号在第一解码图中得分最高的最优路径。相应的,电子设备确定多个语音帧在第一解码图中的第一路径的第一解码参数的步骤为:电子设备确定多个语音帧在第一解码图中的多个解码路径的解码参数;从多个解码路径的解码参数中,确定数值最大的解码参数为第一路径的第一解码参数。
125.在一种可能的实现方式中,电子设备通过声学解码参数和语言解码参数,确定多个语音帧在第一解码图的每个解码路径下的解码参数。相应的,电子设备确定多个语音帧在第一解码图中的多个解码路径的解码参数的步骤为:电子设备对于第一解码图中的每个解码路径,确定该解码路径对应的基础语音信号;确定多个语音帧在该解码路径下的第一语言解码参数和第一声学解码参数,第一语言解码参数用于表示多个语音帧与基础语音信号对应的词序列之间的匹配概率,第一声学解码参数用于表示多个语音帧与第一音素序列的匹配概率,第一音素序列为基于基础语音信号对应的词序列分解得到的;确定第一语言
解码参数和第一声学解码参数的乘积,得到多个语音帧在该解码路径下的解码参数。
126.可选地,在第一解码图中,多个语音帧在该解码路径下的解码参数用于表示通过该解码路径对多个语音帧进行解码的路径得分。在一种可能的实现方式中,电子设备通过chain model(链状模型)中的语言学模型,确定多个语音帧与基础语音信号对应的词序列之间的匹配概率,确定该匹配概率为多个语音帧在该解码路径下的第一语言解码参数。电子设备通过chain model中的声学模型,确定多个语音帧与第一音素序列的匹配概率,确定该匹配概率为多个语音帧在该解码路径下的第一声学解码参数。
127.在本技术实施例中,由于电子设备通过chain model中的语言学模型和声学模型,确定解码路径的解码参数,从而综合参考了语言解码参数和声学解码参数,所以提高了确定的解码参数的准确性。
128.303、电子设备确定多个语音帧在第二解码图中的第二路径的第二解码参数,第二解码图包括多个唤醒语音信号对应的解码路径。
129.在一种可能的实现方式中,wfst解码图能够对唤醒语音信号进行解码,得到唤醒语音信号对应的解码路径。第二解码图包括多个唤醒语音信号对应的解码路径。唤醒语音信号可以是电子设备内存储的唤醒词对应的语音信号。电子设备内存储的唤醒词可以是任一唤醒词。例如:电子设备内存储的唤醒词为“您好”,则唤醒语音信号为唤醒词“您好”对应的语音信号。
130.在一种可能的实现方式中,在通过第二解码图中对目标语音信号进行解码时,第二解码图中第二路径的第二解码参数的数值最大;其中,第二解码参数为第二路径的路径得分,也就是说,第二路径为目标语音信号在第二解码图中得分最高的最优路径。相应的,电子设备确定多个语音帧在第二解码图中的第二路径的第二解码参数的步骤为:电子设备确定多个语音帧在第二解码图中的多个解码路径的解码参数;从多个解码路径的解码参数中,确定数值最大的解码参数为第二路径的第二解码参数。
131.在一种可能的实现方式中,电子设备通过声学解码参数和语言解码参数,确定多个语音帧在第二解码图的每个解码路径下的解码参数。相应的,电子设备确定多个语音帧在第二解码图中的多个解码路径的解码参数的步骤为:电子设备对于第二解码图中的每个解码路径,确定该解码路径对应的唤醒语音信号;确定多个语音帧在该解码路径下的第二语言解码参数和第二声学解码参数,第二语言解码参数用于表示多个语音帧与唤醒语音信号对应的唤醒词序列之间的匹配概率,第二声学解码参数用于表示多个语音帧与第二音素序列的匹配概率,第二音素序列为基于唤醒词序列分解得到的;确定第二语言解码参数和第二声学解码参数的乘积,得到多个语音帧在该解码路径下的解码参数。
132.可选地,在第二解码图中,多个语音帧在该解码路径下的解码参数用于表示通过该解码路径对多个语音帧进行解码的路径得分。在一种可能的实现方式中,电子设备通过chain model中的语言学模型,确定多个语音帧与唤醒语音信号对应的词序列之间的匹配概率,确定该匹配概率为多个语音帧在该解码路径下的第二语言解码参数。电子设备通过chain model中的声学模型,确定多个语音帧与第二音素序列的匹配概率,确定该匹配概率为多个语音帧在该解码路径下的第二声学解码参数。
133.在本技术实施例中,由于电子设备通过chain model中的语言学模型和声学模型,确定解码路径的解码参数,从而综合参考了语言解码参数和声学解码参数,所以提高了确
定的解码参数的准确性。
134.需要说明的一点是,步骤302和步骤303之间没有必要的先后顺序,电子设备可以先执行步骤302,再执行步骤303;也可以先执行步骤303,再执行步骤302,还可以同时执行步骤302和步骤303。
135.304、电子设备在第一解码参数和第二解码参数的差值不大于预设差值的情况下,确定第一路径包括的多个第一节点和每个第一节点的解码参数。
136.在一种可能的实现方式中,若目标语音信号为唤醒词对应的语音信号,通过第一解码图和第二解码图对该目标语音信号进行解码,得到的第一解码参数和第二解码参数相差较近;若目标语音信号为非唤醒词对应的语音信号,通过第一解码图和第二解码图对该目标语音信号进行解码,得到的第一解码参数和第二解码参数相差较大。电子设备确定第一路径包括的多个第一节点和每个第一节点的解码参数之前,需要先确定第一解码参数和第二解码参数的差值是否大于预设差值。在电子设备在第一解码参数和第二解码参数的差值不大于预设差值的情况下,才执行确定第一路径包括的多个第一节点和每个第一节点的解码参数的步骤;在第一解码参数和第二解码参数的差值大于预设差值的情况下,确定目标语音信号无效,不唤醒该电子设备。在本步骤中,对预设差值的数值不作具体限定,可以根据需要进行设定并修改。可选的,预设差值为0.001至0.1之间的任一数值,例如:预设差值为0.005、0.05、0.1等。
137.在本技术实施例中,由于电子设备通过第一解码参数和第二解码参数的差值,对目标语音信号进行初级判断,也即,在目标语音信号满足唤醒语音的条件时,才根据路径信息特征进一步确定该目标语音信号的识别结果,从而有效的避免了无效语音信号的干扰,所以提高了该识别方法的识别效率。
138.在一种可能的实现方式中,电子设备确定第一路径包括的多个第一节点和每个第一节点的解码参数的步骤为:电子设备确定第一路径包括的多个第一节点的跳转顺序;根据跳转顺序,确定每个第一节点对应的语音帧;确定每个第一节点对应的音素与语音帧对应的音素相一致的概率值,将概率值作为每个第一节点的解码参数。可选的,音素为最小的语音单元。例如,英语中的元音、辅音等;再如,汉语中的声母、韵母等。
139.在一种可能的实现方式中,电子设备确定第一路径包括的多个第一节点的跳转顺序的步骤为:电子设备根据多个语音帧的时间顺序,依次对多个语音帧进行解码,得到多个第一节点;根据解码顺序,确定第一路径包括的多个第一节点的跳转顺序。
140.例如,多个语音帧的时间顺序为语音帧1

语音帧2

语音帧3

语音帧4

语音帧5;依次对多个语音帧进行解码,得到多个第一节点为节点1、节点2、节点3、节点4和节点5;根据解码顺序,确定多个第一节点的跳转顺序为:节点1

节点2

节点3

节点4

节点5,确定语音帧1对应节点1、语音帧2对应节点2、语音帧3对应节点3、语音帧4对应节点4、语音帧5对应节点5。
141.例如,节点1、节点2、节点3、节点4和节点5依次对应的音素为“x、i、ao、y、i”;确定节点1对应的音素x与语音帧1对应的音素相一致的概率值,得到节点1的解码参数;确定节点2对应的音素i与语音帧2对应的音素相一致的概率值,得到节点2的解码参数;确定节点3对应的音素ao与语音帧3对应的音素相一致的概率值,得到节点3的解码参数;确定节点4对应的音素y与语音帧4对应的音素相一致的概率值,得到节点4的解码参数;确定节点5对应
的音素i与语音帧5对应的音素相一致的概率值,得到节点5的解码参数。
142.305、电子设备基于第一解码参数、多个第一节点和每个第一节点的解码参数,确定目标语音信号的识别结果,识别结果用于表示是否唤醒电子设备。
143.在一种可能的实现方式中,电子设备根据语音识别模型,确定目标语音信号的识别结果。相应的,本步骤为:电子设备将第一解码参数、多个第一节点和每个第一节点的解码参数输入语音识别模型,得到目标语音信号的识别结果,语音识别模型用于基于路径的解码参数、路径包括的多个节点和每个节点的解码参数得到识别结果。可选的,语音识别模型为全连接神经网络模型。
144.在一种可能的实现方式中,电子设备将第一解码参数、多个第一节点和每个第一节点的解码参数对应的特征向量输入语音识别模型,得到目标语音信号的识别结果。可选地,第一解码参数为路径得分,第一节点的解码参数为节点得分。例如,第一解码参数为:0.0279,多个第一节点和每个第一节点的解码参数为:节点1和节点1的解码参数0.35、节点2和节点2的解码参数0.5、节点3和节点3的解码参数0.25、节点4和节点4的解码参数0.75、节点5和节点5的解码参数0.85。第一解码参数、多个第一节点和每个第一节点的解码参数对应的特征向量为:{0.0279、节点1、0.35、节点2、0.5、节点3、0.25、节点4、0.75、节点5、0.85}。
145.在本技术实施例中,由于通过语音识别模型确定识别结果,而语音识别模型能够结合路径对应的解码参数、多个节点和节点的解码参数确定识别结果,这样在语音信号进行识别时,能够考虑路径对应的解码参数、多个节点和节点的解码参数等解码路径信息,所以提高了确定的识别结果的准确性。
146.需要说明的一点是,在通过语音识别模型得到识别结果之前,电子设备可以先获取样本语音信号,通过训练得到该语音识别模型。
147.在一种可能的实现方式中,电子设备训练语音识别模型的过程为:电子设备获取样本语音信号,样本语音信号包括第一语音信号和第二语音信号,第一语音信号为唤醒词对应的语音信号,第二语音信号为非唤醒词对应的语音信号;基于第一语音信号和第二语音信号,对初始识别模型进行训练,直至初始识别模型的准确率达到预设阈值,得到语音识别模型。可选地,非唤醒词为误唤醒词。该误唤醒词为非唤醒词中通过现有技术中的语音唤醒方法能够唤醒电子设备的唤醒词。在本技术实施例中,对预设阈值的数值不作具体限定,可以根据需要进行设定并修改。可选的,预设阈值为80%至100%之间的任一数值,例如:预设阈值为85%、90%、95%等。
148.在一种可能的实现方式中,电子设备获取样本语音信号的步骤为:电子设备接收唤醒词对应的语音信号和非唤醒词对应的语音信号;对唤醒词对应的语音信号进行加噪处理,得到第一语音信号,以及,对非唤醒词对应的语音信号进行加噪处理,得到第二语音信号。可选的,噪声为背景噪声。相应的,本步骤为:电子设备将唤醒词对应的语音信号与背景噪声信号进行叠加,得到第一语音信号,以及,将非唤醒词对应的语音信号与背景噪声信号进行叠加,得到第二语音信号。
149.在本技术实施例中,由于通过对语音信号进行加噪处理,得到样本语音信号,这样在通过样本语音信号进行训练,得到的语音识别模型具有较高的抗噪能力,进而提高了基于语音识别模型,确定的识别结果的准确性。
150.在一种可能的实现方式中,根据第一语音信号和第二语音信号在第一解码图中的解码路径信息,对初始识别模型进行训练。相应的,电子设备基于第一语音信号和第二语音信号,对初始识别模型进行训练的步骤为:电子设备确定第一语音信号包括的多个语音帧在第一解码图中的第三路径,以及第二语音信号包括的多个语音帧在第一解码图中的第四路径;确定第一路径信息和第二路径信息,第一路径信息包括第三路径的解码参数、第三路径包括的多个第三节点和每个第三节点的解码参数,第二路径信息包括第四路径的解码参数、第四路径包括的多个第四节点和每个第四节点的解码参数;基于第一路径信息和第二路径信息,对初始识别模型进行训练。
151.可选的,初始识别模型为全连接神经网络模型,输入的样本为第一路径信息和第二路径信息对应的特征向量。相应的,电子设备基于第一路径信息和第二路径信息,对初始识别模型进行训练的步骤为:电子设备确定第一路径信息对应的特征向量和第二路径信息对应的特征向量,将第一路径信息对应的特征向量和第二路径信息对应的特征向量输入初始识别模型,对该初始识别模型进行训练。
152.可选地,路径的解码参数为路径得分,节点的解码参数为节点得分。例如,第一路径信息包括:第三路径的解码参数0.025、第三节点a、第三节点a的解码参数0.25
……
第三节点p、第三节点p的解码参数0.5;第一路径信息对应的特征向量为{0.025、a、0.25
……
p、0.5}。其中,多个第三节点的数量与第一语音信号包括的多个语音帧的数量正相关。例如,第二路径信息包括:第四路径的解码参数0.015、第四节点a、第四节点a的解码参数0.35
……
第四节点p、第四节点p的解码参数0.45;第二路径信息对应的特征向量为{0.015、a、0.35
……
p、0.45}。其中,多个第四节点的数量与第二语音信号包括的多个语音帧的数量正相关。
153.在一种可能的实现方式中,样本语音信号为多个,且多个样本语音信号对应的特征向量的维数相同。相应的,电子设备确定第一路径信息和第二路径信息对应的特征向量的步骤为:电子设备确定第一路径信息和第二路径信息对应的特征向量的维数,若该维数小于预设维数,将该特征向量的维数补齐至预设维数,若该维数大于预设维数,将该特征向量的维数截断至预设维数。可选地,补齐维数对应的参数为0。在本技术实施例中,对预设维数的数值不作具体限定,可以根据需要进行设定并修改。可选的,预设维数为30至100维之间的任一数值,例如:预设维数为50维、60维、80维等。
154.在本技术实施例中,由于多个样本语音信号对应的特征向量的维数相同,这样在通过维数相同的特征向量对初始识别模型进行训练时,避免了维数对训练结果的影响,所以提高了训练语音识别模型的效率。
155.306、电子设备在识别结果用于表示唤醒电子设备的情况下,唤醒该电子设备,在识别结果用于表示不唤醒电子设备的情况下,不唤醒该电子设备。
156.在一种可能的实现方式中,电子设备通过唤醒模块,唤醒电子设备。相应的,本步骤为;电子设备在识别结果用于表示唤醒电子设备的情况下,向唤醒模块发送唤醒指令,唤醒模块接收到唤醒指令,唤醒电子设备;电子设备在识别结果用于表示不唤醒电子设备的情况下,不向唤醒模块发送唤醒指令。
157.在一种可能的实现方式中,唤醒电子设备以后,电子设备处于唤醒状态,电子设备采集新的语音信号,对新的语音信号进行识别,得到新的语音信号对应的控制指令;根据该
控制指令控制电子设备执行相关操作或者反馈,实现语音信号的控制。
158.本技术实施例提供了一种语音信号的识别方法,由于通过第一路径对应的解码参数和第二路径对应的解码参数,考虑了语音信号与唤醒信号之间相似关系,通过第一路径对应的解码参数、第一路径上的多个第一节点和每个第一节点的解码参数等多个参数,考虑了语音信号对应的解码路径信息,这样既考虑到了语音信号与唤醒信号之间相似关系,又考虑到了语音信号对应的解码路径信息,所以提高了识别结果的准确性,降低了误唤醒率。
159.图4是本技术实施例提供的一种语音信号的识别装置的框图,参见图4,该装置包括:
160.接收模块401,用于接收目标语音信号,确定目标语音信号包括的多个语音帧;
161.第一确定模块402,用于确定多个语音帧在第一解码图中的第一路径的第一解码参数,以及确定多个语音帧在第二解码图中的第二路径的第二解码参数,第一解码图包括多个基础语音信号对应的解码路径,第二解码图包括多个唤醒语音信号对应的解码路径;
162.第二确定模块403,用于在第一解码参数和第二解码参数的差值不大于预设差值的情况下,确定第一路径包括的多个第一节点和每个第一节点的解码参数;
163.第三确定模块404,用于基于第一解码参数、多个第一节点和每个第一节点的解码参数,确定目标语音信号的识别结果,识别结果用于表示是否唤醒电子设备。
164.在一种可能的实现方式中,第三确定模块404,用于将第一解码参数、多个第一节点和每个第一节点的解码参数输入语音识别模型,得到目标语音信号的识别结果,语音识别模型用于基于路径的解码参数、路径包括的多个节点和每个节点的解码参数得到识别结果。
165.在另一种可能的实现方式中,参见图5,该装置还包括训练模块405,训练模块405,包括:
166.获取单元4051,用于获取样本语音信号,样本语音信号包括第一语音信号和第二语音信号,第一语音信号为唤醒词对应的语音信号,第二语音信号为非唤醒词对应的语音信号;
167.训练单元4052,用于基于第一语音信号和第二语音信号,对初始识别模型进行训练,直至初始识别模型的准确率达到预设阈值,得到语音识别模型。
168.在另一种可能的实现方式中,训练单元4052,用于确定第一语音信号包括的多个语音帧在第一解码图中的第三路径,以及第二语音信号包括的多个语音帧在第一解码图中的第四路径;确定第一路径信息和第二路径信息,第一路径信息包括第三路径的解码参数、第三路径包括的多个第三节点和每个第三节点的解码参数,第二路径信息包括第四路径的解码参数、第四路径包括的多个第四节点和每个第四节点的解码参数;基于第一路径信息和第二路径信息,对初始识别模型进行训练。
169.在另一种可能的实现方式中,获取单元4051,用于接收唤醒词对应的语音信号和非唤醒词对应的语音信号;对唤醒词对应的语音信号进行加噪处理,得到第一语音信号,以及,对非唤醒词对应的语音信号进行加噪处理,得到第二语音信号。
170.在另一种可能的实现方式中,第一确定模块402,用于确定多个语音帧在第一解码图中的多个解码路径的解码参数;从多个解码路径的解码参数中,确定数值最大的解码参
数为第一路径的第一解码参数。
171.在另一种可能的实现方式中,第一确定模块402,用于对于第一解码图中的每个解码路径,确定该解码路径对应的基础语音信号;确定多个语音帧在解码路径下的第一语言解码参数和第一声学解码参数,第一语言解码参数用于表示多个语音帧与基础语音信号对应的词序列之间的匹配概率,第一声学解码参数用于表示多个语音帧与第一音素序列的匹配概率,第一音素序列为基于词序列分解得到的;确定第一语言解码参数和第一声学解码参数的乘积,得到多个语音帧在解码路径下的解码参数。
172.在另一种可能的实现方式中,第一确定模块402,还用于确定多个语音帧在第二解码图中的多个解码路径的解码参数;从多个解码路径的解码参数中,确定数值最大的解码参数为第二路径的第二解码参数。
173.在另一种可能的实现方式中,第一确定模块402,还用于对于第二解码图中的每个解码路径,确定该解码路径对应的唤醒语音信号;确定多个语音帧在解码路径下的第二语言解码参数和第二声学解码参数,第二语言解码参数用于表示多个语音帧与唤醒语音信号对应的唤醒词序列之间的匹配概率,第二声学解码参数用于表示多个语音帧与第二音素序列的匹配概率,第二音素序列为基于唤醒词序列分解得到的;确定第二语言解码参数和第二声学解码参数的乘积,得到多个语音帧在解码路径下的解码参数。
174.在另一种可能的实现方式中,每个语音帧包括第一预设时长的语音信号;
175.接收模块401,用于按照预设周期,对目标语音信号进行划分,得到目标语音信号包括的多个语音帧。
176.在另一种可能的实现方式中,第二确定模块403,用于确定第一路径包括的多个第一节点的跳转顺序;根据跳转顺序,确定每个第一节点对应的语音帧;确定每个第一节点对应的音素与语音帧对应的音素相一致的概率值,将概率值作为每个第一节点的解码参数。
177.本技术实施例提供了一种语音信号的识别装置,由于通过第一路径对应的解码参数和第二路径对应的解码参数,考虑了语音信号与唤醒信号之间相似关系,通过第一路径对应的解码参数、第一路径上的多个第一节点和每个第一节点的解码参数等多个参数,考虑了语音信号对应的解码路径信息,这样既考虑到了语音信号与唤醒信号之间相似关系,又考虑到了语音信号对应的解码路径信息,所以提高了识别结果的准确性,降低了误唤醒率。
178.图6示出了本发明一个示例性实施例提供的电子设备600的结构框图。该电子设备600可以是:智能手机、平板电脑、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备600还可能被称为用户设备、便携式电子设备、膝上型电子设备、台式电子设备等其他名称。
179.通常,电子设备600包括有:处理器601和存储器602。
180.处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主
处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
181.存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所执行以实现本技术中方法实施例提供的语音信号的识别方法。
182.在一些实施例中,电子设备600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。
183.外围设备接口603可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
184.射频电路604用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它电子设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
185.显示屏605用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置电子设备600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在电子设备600的不同表面或呈折叠设计;在再一些实施例中,显示屏605可以是柔性显示屏,设置在电子设备600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发光二极管)等材质制备。
186.摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在电子设备的前面板,后置摄像头设置在电子设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
187.音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
188.定位组件608用于定位电子设备600的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件608可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
189.电源609用于为电子设备600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
190.在一些实施例中,电子设备600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于:加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。
191.加速度传感器611可以检测以电子设备600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号,控制显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。
192.陀螺仪传感器612可以检测电子设备600的机体方向及转动角度,陀螺仪传感器612可以与加速度传感器611协同采集用户对电子设备600的3d动作。处理器601根据陀螺仪传感器612采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
193.压力传感器613可以设置在电子设备600的侧边框和/或显示屏605的下层。当压力传感器613设置在电子设备600的侧边框时,可以检测用户对电子设备600的握持信号,由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在显示屏605的下层时,由处理器601根据用户对显示屏605的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜
单控件中的至少一种。
194.指纹传感器614用于采集用户的指纹,由处理器601根据指纹传感器614采集到的指纹识别用户的身份,或者,由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器601授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置电子设备600的正面、背面或侧面。当电子设备600上设置有物理按键或厂商logo时,指纹传感器614可以与物理按键或厂商logo集成在一起。
195.光学传感器615用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器615采集的环境光强度,控制显示屏605的显示亮度。具体地,当环境光强度较高时,调高显示屏605的显示亮度;当环境光强度较低时,调低显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器615采集的环境光强度,动态调整摄像头组件606的拍摄参数。
196.接近传感器616,也称距离传感器,通常设置在电子设备600的前面板。接近传感器616用于采集用户与电子设备600的正面之间的距离。在一个实施例中,当接近传感器616检测到用户与电子设备600的正面之间的距离逐渐变小时,由处理器601控制显示屏605从亮屏状态切换为息屏状态;当接近传感器616检测到用户与电子设备600的正面之间的距离逐渐变大时,由处理器601控制显示屏605从息屏状态切换为亮屏状态。
197.本领域技术人员可以理解,图6中示出的结构并不构成对电子设备600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
198.本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现如上述任一实现方式所述的语音信号的识别方法。
199.本技术实施例还提供了一种计算机程序产品,计算机程序产品包括至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现如上述任一实现方式所述的语音信号的识别方法。
200.在一些实施例中,本技术实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
201.以上仅为本技术的可选实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1