数据处理方法以及计算机设备与流程

文档序号:28109107发布日期:2021-12-22 13:44阅读:132来源:国知局
数据处理方法以及计算机设备与流程

1.本技术涉及互联网技术领域,尤其涉及一种数据处理方法以及计算机设备。


背景技术:

2.随着英语口语在生活中应用愈加广泛,英语口语的锻炼越来越受人重视。各年龄段的人使用英语口语评测软件时,有不同的评测标准需求。
3.实际应用时,针对不同评测对象,需要不同的评测宽松度。对于幼龄儿童评测需要相对宽松,对于成人评测需要相对严格。针对成人中的不同水平,使用的评测标准也不尽相同。
4.当前市场上,口语评测应用为一个固定专业水平的人群类型而设计,例如,一口语评测应用主要针对人群类型可以是学前、小学、中学或大学中的一种。若同一人进行不同的专业水平测试,需要下载不同专业水平所针对的软件,用户需要分别使用这些软件才能获得多种不同评分标准的发音评分,这种方式无疑增加了用户的使用成本,而且多款针对不同专业水平的口语测评应用无疑也增加了开发成本。当前的口语评测应用针对人群类型专业水平单一,无法满足同一使用对象对不同专业水平测试的需求。


技术实现要素:

5.本技术实施例提供一种数据处理方法以及计算机设备,可以高效地为用户提供多种不同评分标准的发音评分,可以降低使用成本和开发成本。
6.本技术一方面提供了一种数据处理方法,包括:
7.获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
8.提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;
9.获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,
10.根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
11.进一步地,提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分,包括:
12.提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
13.通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分。
14.进一步地,目标宽松度调整参数包括目标发音评分均值和目标发音评分标准差;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评
分,包括:
15.获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差;
16.在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差;
17.根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
18.进一步地,根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,包括:
19.将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值;样本发音评分均值和样本发音评分标准差均是基于样本音频数据集合所对应的样本发音评分所确定的;
20.将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分。
21.进一步地,目标宽松度调整参数包括第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数;
22.获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,包括:
23.若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识;
24.获取第一宽松度标识对应的第一权重,以及第二宽松度标识对应的第二权重;
25.根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数;
26.根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
27.进一步地,宽松度调整参数包括发音评分均值和发音评分标准差;
28.根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数,包括:
29.根据第一权重和第二权重,对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到融合发音评分均值;
30.根据第一权重的平方值以及第二权重的平方值,对第一宽松度标识对应的发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差;
31.将融合发音评分均值和融合发音评分标准差确定为融合宽松度调整参数。
32.进一步地,目标宽松度调整参数包括目标插值表;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行
评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,包括:
33.获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的插值表;
34.在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标插值表;
35.根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
36.进一步地,根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,包括:
37.获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分;
38.在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分;
39.根据最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分,将发音质量评分映射为目标发音质量评分。
40.进一步地,目标宽松度调整参数包括第三宽松度标识对应的插值表以及第四宽松度标识对应的插值表;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,包括:
41.若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识;
42.获取第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重;
43.根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分;
44.根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分;
45.根据第三权重和第四权重,对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。
46.本技术一方面提供了一种数据处理方法,包括:
47.终端设备获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求;
48.将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的;
49.对服务器所返回的目标发音质量评分进行输出。
50.进一步地,终端设备获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求,包括:
51.终端设备响应针对语音输入页面的宽松度输入操作,将所输入的参数确定为目标宽松度标识;
52.响应针对语音输入页面的音频采集操作,获取音频数据,生成包含音频数据和目标宽松度标识的语音质量识别请求。
53.本技术一方面提供了一种数据处理装置,包括:
54.获取模块,用于获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
55.评分模块,用于提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;
56.宽松度调整模块,用于获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
57.其中,评分模块包括:
58.特征提取单元,用于提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
59.语音质量识别单元,用于通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分。
60.其中,目标宽松度调整参数包括目标发音评分均值和目标发音评分标准差;宽松度调整模块包括:
61.第一参数获取单元,用于获取宽松度参数集合;松度参数集合包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差;
62.第一参数获取单元,还用于在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差;
63.第一评分调整单元,用于根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
64.其中,评分调整单元,具体用于将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值,将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分;样本发音评分均值和样本发音评分标准差均是基于样本音频数据集合所对应的样本发音评分所确定的。
65.其中,目标宽松度调整参数包括第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数;
66.宽松度调整模块包括:
67.第二参数获取单元,用于若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识;
68.第二参数获取单元,还用于获取第一宽松度标识对应的第一权重,以及第二宽松
度标识对应的第二权重;
69.第一融合单元,用于根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数;
70.第二评分调整单元,用于根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
71.其中,宽松度调整参数包括发音评分均值和发音评分标准差;
72.第一融合单元,具体用于根据第一权重和第二权重,对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到融合发音评分均值,根据第一权重的平方值以及第二权重的平方值,对第一宽松度标识对应的发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差,将融合发音评分均值和融合发音评分标准差确定为融合宽松度调整参数。
73.其中,目标宽松度调整参数包括目标插值表;
74.宽松度调整模块包括:
75.第三参数获取单元,用于获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的插值表;
76.第三参数获取单元,还用于在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标插值表;
77.第三评分调整单元,用于根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
78.其中,第三评分调整单元,具体用于获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分,在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分,根据最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分,将发音质量评分映射为目标发音质量评分。
79.其中,目标宽松度调整参数包括第三宽松度标识对应的插值表以及第四宽松度标识对应的插值表;
80.宽松度调整模块包括:
81.第四参数获取单元,用于若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识;
82.第四参数获取单元,还用于获取第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重;
83.插值评分单元,用于根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分;
84.插值评分单元,还用于根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分;
85.第二融合单元,用于根据第三权重和第四权重,对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。
86.本技术一方面提供了一种数据处理装置,包括:
87.请求生成模块,用于获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求;
88.发送模块,用于将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的;
89.输出模块,用于对服务器所返回的目标发音质量评分进行输出。
90.其中,请求生成模块,具体用于响应针对语音输入页面的宽松度输入操作,将所输入的参数确定为目标宽松度标识,响应针对语音输入页面的音频采集操作,获取音频数据,生成包含音频数据和目标宽松度标识的语音质量识别请求。
91.本技术另一方面提供了一种计算机设备,包括:处理器、存储器以及网络接口;
92.处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,存储器用于存储程序代码,处理器用于调用程序代码,以执行如本技术实施例中一方面中的方法。
93.本技术另一方面提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序适于由处理器加载并执行如本技术实施例中一方面中的方法。
94.本技术实施例通过获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。本技术在口语评分过程中引入了可由用户选择的宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
附图说明
95.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
96.图1是本技术实施例提供的一种网络架构示意图;
97.图2是本技术实施例提供的一种调整发音质量评分的场景示意图;
98.图3是本技术实施例提供的一种数据处理方法的流程示意图;
99.图4是本技术实施例提供的一种数据处理方法的流程示意图;
100.图5是本技术实施例提供的一种数据处理方法的流程示意图;
101.图6a是本技术实施例提供的一种数据处理方法的流程示意图;
102.图6b是本技术实施例提供的一种基于插值表调整发音质量评分的示意图;
103.图7是本技术实施例提供的一种数据处理方法的流程示意图;
104.图8是本技术实施例提供的一种数据处理装置的流程示意图;
105.图9a是本技术实施例提供的一种数据处理装置的结构示意图;
106.图9b是本技术实施例提供的一种数据处理装置的结构示意图;
107.图10是本技术实施例提供的一种计算机设备的结构示意图;
108.图11是本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
109.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
110.请参见图1,是本发明实施例提供的一种网络架构示意图。该网络架构可以包括服务器100和多个终端设备(如图1所示,具体包括终端设备200a、终端设备200b、终端设备200c等),服务器100可以通过网络与每个终端设备进行通信,每个终端设备均可以安装口语评测应用,服务器100可以为该口语评测应用对应的后台服务器,因此,每个终端设备均可以通过该口语评测应用对应的客户端与服务器100进行数据传递。终端设备可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mid,mobile internet device)、pos(point of sales,销售点)机、可穿戴设备(例如智能手表、智能手环等)。每个终端设备都可以在安装口语评测应用,并使用口语评测应用进行评测。
111.请参见图2,图2为一种调整发音质量评分的场景示意图。在图2中,口语评测应用可以应用于客观题型,如朗读题型中,也可应用于主观题型,如看图说话、口头作文等。以终端设备200c为例,终端设备200c可以打开口语评测应用界面,在宽松度输入编辑框201c中输入目标宽松度标识,如目标宽松度标识可以是3,然后即可以开始口语评测。输入目标宽松度标识后,点击开始跟读按钮,开始跟读句子。当开始跟读句子后,这时宽松度输入编辑框显示为目标宽松度标识3,并变更状态为不可更改状态,这时可以将开始跟读按钮切换显示为结束跟读按钮,当用户跟读句子结束,且点击结束跟读按钮时,结束跟读句子,输出显示目标发音质量评分。服务器中的流程调用也请参见图2。
112.在图2中,终端设备200c可以将用户输入的目标宽松度标识和终端设备采集到的音频封装为语音质量识别请求,再向服务器100发送语音质量识别请求,服务器100获取语音质量识别请求,通过获取语音质量识别请求获得音频数据和目标宽松度标识。然后,服务器100通过特征提取模块提取语音质量识别请求中的音频数据对应的音频特征,再通过评分模块生成音频特征对应的发音质量评分。服务器100再通过宽松度调整模块获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,以此达到发音质量评分的高效变换。服务器100向终端设备200c发送目标发音质量评分,终端设备
200c接收并显示目标发音质量评分,如图2所示,其中显示区域202c所显示的是目标发音质量评分,显示区域203c是根据目标发音质量评分占总分数的百分比,来点亮星星的数量。例如,若总分数为100分,目标发音质量评分为80,则目标发音质量评分占总分数的百分比为80%,则点亮5颗星星中的80%,即点亮4颗星星。
113.通过上述所提供的宽松度变换方法,可实现针对不同年龄人群,以不同的宽松度进行口语评测,保证了口语评测软件的实用性。
114.可选的,上述服务器100获取语音质量识别请求,通过获取语音质量识别请求获得音频数据和目标宽松度标识,提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分,获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分的过程也可以在终端设备200c中实现,这里不再进行赘述。
115.请参见图3,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由计算机设备执行,计算机设备可以为终端设备或服务器,方法可以包括:
116.s301,获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
117.其中,计算机设备可以获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识。音频数据是通过从语音中提取得到,目标宽松度标识是口语评测应用打开后评测人输入的宽松度数值,例如,宽松度数值取值范围可以是0

4,并且宽松度数值取值可以是非整数,例如宽松度数值可以是1.2、2.6、3.7。例如,终端设备打开口语评测软件后,会有提醒输入宽松度的指示框,在指示框中输入2,即代表宽松度标识为2。
118.具体的,数字化的声音数据就是音频数据。数字化声音的过程实际上就是以一定的频率对来自语音输入设备的连续的模拟音频信号进行模数转换得到音频数据的过程;数字化声音的播放就是将音频数据进行数模转换变成模拟音频信号输出。在数字化声音时有两个重要的指标,即采样频率和采样大小。采样频率即单位时间内的采样次数,采样频率越大,采样点之间的间隔越小,数字化得到的声音就越逼真,但相应的数据量增大,处理起来就越困难;采样大小即记录每次样本值大小的数值的位数,它决定采样的动态变化范围,位数越多,所能记录声音的变化程度就越细腻,所得的数据量也越大。
119.进一步地,当向计算机设备输入目标宽松度标识,再输入语音后,计算机设备对输入数据进行分析,发现目标宽松度标识和语音皆有输入,则条件达成,进而可以触发获取语音质量识别请求。其中,可以借助音频提取装置,通过音频提取装置从输入语音中提取音频数据。
120.s302,提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;
121.具体的,计算机设备通过对音频数据的分析处理,可以提取对应的音频特征,当前计算机设备根据音频特征生成音频数据对应的发音质量评分的过程可以借助卷积神经网络模型识别的方法。计算机设备可以基于人工标签对卷积神经网络模型进行模型训练,通过训练好的卷积神经网络模型可以输出音频数据对应的发音质量评分。例如,具有英语背景的专业人员可以针对口语评测的目标宽松度标识,选取合适的口语评测人工标签,计算
机设备基于选取的口语评测人工标签,进行卷积神经网络模型训练,得到一个能够准确识别音频数据对应的发音质量评分的卷积神经网络模型,进而服务器可以将语音质量识别请求中的音频数据对应的音频特征输入训练好的卷积神经网络模型,通过卷积神经网络模型输出发音质量评分。
122.s303,获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
123.具体的,语音质量识别请求中的目标宽松度标识在取值范围中,不同的目标宽松度标识可以对应不同的目标宽松度调整参数,选取不同的目标宽松度调整参数可以得到与不同目标宽松度标识相匹配的目标发音质量评分,通过所获取到的目标宽松度调整参数可以调整对应的发音质量评分,进而得到所需的目标发音质量评分。例如,目标宽松度标识可以是2,目标宽松度标识为2所对应的目标宽松度调整参数为a,目标宽松度标识也可以是4,目标宽松度标识为4所对应的目标宽松度调整参数为b,当目标宽松度标识为2时,选取的对应目标宽松度调整参数a可以是比目标宽松度调整参数b更宽松的,即针对同一个音频数据,使用目标宽松度调整参数a所调整得到的目标发音质量评分会大于使用目标宽松度调整参数b所调整得到的目标发音质量评分。
124.进一步的,根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到待优化发音质量评分,若待优化发音质量评分小于发音质量评分取值范围内的最小值,则将发音质量评分取值范围内的最小值确定为与目标宽松度标识相匹配的目标发音质量评分;若待优化发音质量评分大于发音质量评分取值范围内的最大值,则将发音质量评分取值范围内的最大值确定为与目标宽松度标识相匹配的目标发音质量评分。在一个实施例中,待优化发音质量评分可以用p(improve)表示,发音质量评分取值范围内的最小值为c,发音质量评分取值范围内的最大值为d。若发音质量评分取值范围内的最小值c为0,发音质量评分取值范围内的最大值d为100,则目标发音质量评分为min(max(p(improve),0),100)。
125.本技术实施例通过计算机设备获取语音质量识别请求,获得音频数据和目标宽松度标识。然后,计算机设备提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分。计算机设备获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,以此达到发音质量评分的快速变换。本技术在口语评分过程中引入了可由用户选择的宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
126.请参见图4,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由计算机设备执行,计算机设备可以为终端设备或服务器,方法可以包括:
127.s401,获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
128.本步骤的具体过程可以参见上述图3所对应实施例中的s301,这里不再进行赘述。
129.s402,提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
130.具体的,在获取语音质量识别请求中的音频数据后,可以提取音频数据对应的有效特征,有效特征可以包含文本特征和声学特征。文本特征主要包含语义特征、语用特征、关键词特征、文本不流利特征。关键词特征主要包括提取标准答案中的关键词与答题内容的关键词,计算精确率、召回率等。语用特征包括答题内容的词语的多样性,句式的多样性以及基于语言模型分析答题内容的语法准确性。语义特征包含答题内容的主题特征、词频逆文本频率指数(term frequency

inverse document frequency,tf

idf)特征等。tf

idf与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比,用于衡量某个词在文档中的重要性。声学特征主要分为发音准确度、发音流利度、发音韵律度等。发音准确度指音素、单词、句子级别等发音分数。发音流利度包含发音过程中的语速特征、基于时长统计的特征如发音段的平均时长,发音段之间的平均停顿时长等特征。发音韵律度包含对发音节奏感的评估、句子中单词重读正确性评估、句子边界调评估等。进一步可以将文本特征和声学特征统称为音频特征,在得到音频特征后,可以将音频特征输入语音质量识别模型,语音质量识别模型可以是回归模型或分类模型,既可以是传统的回归模型,也可以新兴的回归模型,选择的回归模型可以是最邻近结点算法(k

nearestneighbor,knn)模型、支持向量回归(support vector regression,svr)模型、梯度提升决策树(gradient boosted trees,gbt)模型和深度神经网络模型等。
131.s403,通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分;
132.具体的,将音频特征输入语音质量识别模型中,首先经过卷积处理,通过具体分析音频特征的局部信息,可以得到音频的隐藏特征,将得到的音频隐藏特征输入语音质量模型的分类层,分类层对得到的音频隐藏特进行分类匹配,得出相匹配的发音质量评分。
133.s404,获取宽松度参数集合;
134.具体的,获取宽松度参数集合,宽松度参数集合包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差。例如,宽松度参数集合中可以包含0

4的范围中的两个宽松度标识,如果宽松度参数集合中包括的两个宽松度标识是2和3,那么宽松度参数集合则包含宽松度标识2对应的发音评分均值、宽松度标识2对应的发音评分标准差、宽松度标识3对应的发音评分均值、宽松度标识3对应的发音评分标准差。
135.s405,在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差;
136.具体的,从语音质量识别请求中获取的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差,不同的目标发音评分均值与目标发音评分标准差代表不同目标宽松度标识的参数,如比较宽松的目标发音质量评分,目标发音评分均值比较大,目标发音评分标准差比较小。对于比较严格的目标发音质量评分,目标发音评分均值比较小,目标发音
评分标准差比较大。例如宽松度标识为2对应的发音评分标准差会小于,宽松度标识为3对应的发音评分标准差。在宽松度参数集合中,包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差,当目标宽松度标识确定后,可以先从宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差。
137.s406,将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值;样本发音评分均值和样本发音评分标准差均是基于样本音频数据集合所对应的样本发音评分所确定的;
138.具体的,从大量已经评测完成的数据中随机采样一定数量的语音样本,提取语音样本音频数据中的声学特征和文本特征,再对样本音频数据的声学特征和文本特征进行卷积处理,得到音频隐藏特征,再通过分类层,得到一批样本发音评分p1、p2、p3、p4、
……
、pn,若这批样本发音评分符合高斯分布,得到样本发音均值mean(raw)和样本发音评分标准差std(raw),将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值。例如,若用p表示发音质量评分,则p

mean(raw)即为第一目标差值,即为第一目标比值。
139.s407,将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分。
140.具体的,基于s406的步骤,将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分。例如,若目标宽松度标识为i,则目标发音评分均值可以是mean
i
,目标发音评分标准差可以是std
i
,用p表示发音质量评分,则std
i
即为第一目标乘积,即为目标发音质量评分。
141.本技术在口语评分过程中引入了可由用户选择的目标宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的目标宽松度标识,来选择不同的目标发音评分均值和目标发音评分标准差,通过目标发音评分均值和目标发音评分标准差可以将发音质量评分调整为用户所期望的目标发音质量评分效果,而且本技术通过设置目标宽松度标识即可实现多种不同口语评测应用所实现的功能,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
142.请参见图5,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由计算机设备执行,计算机设备可以为终端设备或服务器,方法可以包括:
143.s501,获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
144.本步骤的具体过程可以参见上述图3所对应实施例中的s301,这里不再进行赘述。
145.s502,提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
146.本步骤的具体过程可以参见上述图4所对应实施例中的s402,这里不再进行赘述。
147.s503,通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分;
148.本步骤的具体过程可以参见上述图4所对应实施例中的s403,这里不再进行赘述。
149.s504,若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识;
150.具体的,若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,借助最小整数区间内的两个整数的宽松度标识来获取非整数的目标宽松度标识的参数,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识。例如,若目标宽松度标识为2.2,则对应的最小整数区间为2至3,则2即为第一宽松度标识,3即为第二宽松度标识。
151.s505,获取第一宽松度标识对应的第一权重,以及第二宽松度标识对应的第二权重;
152.具体的,通过借助最小整数区间的最小整数的宽松度标识和最大整数的宽松度标识,可以先获取第一宽松度标识对应的第一权重,以及第二宽松度标识对应的第二权重。例如,若floor表示宽松度标识i向最小整数区间的最小整数取整,ceil表示宽松度i向最小整数区间的最大整数取整,在一个实施例中,i可以是2.2,则floor(i)为2,ceil(i)为3。其中,第一权重可以为(1

(i

floor(i))),第二权重可以为(i

floor(i))。
153.s506,根据第一权重和第二权重,对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到融合发音评分均值;
154.具体的,获取融合发音评分均值可以借助最小整数区间的最小整数(即第一宽松度标识)的发音评分均值和最大整数(即第二宽松度标识)的发音评分均值所生成,具体通过对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和得到。例如,若floor表示宽松度i向最小整数区间的最小整数取整,ceil表示宽松度i向最小整数区间的最大整数取整,第一宽松度标识对应的发音评分均值可以是mean(floor(i)),第二宽松度标识对应的发音评分均值可以是mean(ceil(i)),在最小整数区间的最小整数和最大整数中,宽松度i与最小整数的取整距离,宽松度i与最大整数的取整距离,俩者相比,取整距离更小的那个整数(最小整数或最大整数)证明宽松度i与之更贴近,则取整距离更小的那个整数的发音评分均值,比取整距离更大的那个整数的发音评分均值,对宽松度i对应的评分调整因素的影响更大,即宽松度i取整的权重参数的数值大小与宽松度i取整的取整距离大小成反比,因此,可以基于第一权重(1

(i

floor(i)))和第二权重(i

floor(i)),对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到(1

(i

floor(i)))*mean(floor(i))+(i

floor(i))*mean(ceil(i))即为融合发音评分均值;在一个实施例中,i可以是2.2,则mean(floor(i))即为mean(2),mean(ceil(i))即为mean(3),即2.2距2的距离小于2.2距3的距离,因此,第一权重的数值大小将大于第二权重的数值大小,则融合发音评分均值为(1

(2.2

2))*mean(2)+(2.2

2)*mean(3)。
155.s507,根据第一权重的平方值以及第二权重的平方值,对第一宽松度标识对应的
发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差;
156.具体的,获取融合发音评分标准差可以借助最小整数区间的最小整数(即第一宽松度)对应的发音评分标准差和最大整数(即第二宽松度)对应的发音评分标准差所生成,具体通过对第一宽松度标识对应的发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差。例如,若floor表示宽松度i向最小整数区间的最小整数取整,ceil表示宽松度i向最小整数区间的最大整数取整,则第一权重可以为(1

(i

floor(i))),第二权重可以为(i

floor(i)),第一宽松度标识对应的发音评分标准差的平方值可以为std(floor(i))2,第二宽松度标识对应的发音评分标准差的平方值可以为std(ceil(i))2,融合发音评分标准差的平方值为std
i2
=((1

(i

floor(i))))2*std(floor(i))2+(i

floor(i))2*std(ceil(i))2,对融合发音评分标准差的平方值开根号即可获取融合发音评分标准差。
157.s508,将融合发音评分均值和融合发音评分标准差确定为融合宽松度调整参数。
158.s509,根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
159.具体的,基于s508步骤,在得到融合宽松度调整参数后,可以根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。其评分调整过程可以参见上述图4所对应实施例中的步骤s407,这里不再进行赘述。本技术在口语评分过程中引入了可由用户选择的宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的目标宽松度标识,设置的目标宽松度标识也可以是非整数,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置目标宽松度标识即可实现多种不同口语评测应用所实现的功能,通过对非整数目标宽松度标识的处理,可以有更多的选择,目标发音质量评分颗粒度可以更细,细化了目标宽松度标识的使用维度,提供了更加全面的专业水平覆盖,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
160.请参见图6a,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由计算机设备执行,计算机设备可以为终端设备或服务器,方法可以包括:
161.s601,获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
162.本步骤的具体过程可以参见上述图3所对应实施例中的s301,这里不再进行赘述。
163.s602,提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
164.本步骤的具体过程可以参见上述图4所对应实施例中的s402,这里不再进行赘述。
165.s603,通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音
频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分;
166.本步骤的具体过程可以参见上述图4所对应实施例中的s403,这里不再进行赘述。
167.s604,获取宽松度参数集合;
168.具体的,获取宽松度参数集合,宽松度参数集合包括至少两个宽松度标识分别对应的插值表。插值表为线性插值的图表,线性插值是指插值函数为一次多项式的插值方式。本技术采用线性插值的方式,对分数进行宽松度进行调整。线性插值表示,给定(x0,y0),(x1,y1)对在x0和x1之间的样本进行x进行值的预测。最终得到插值结果y。通过设计不同的插值表,实现宽松度变换。例如,宽松度参数集合中可以包含0

4的范围中的两个宽松度标识,如果宽松度参数集合中包括的两个宽松度标识是2和3,那么宽松度参数集合则包含宽松度标识2对应的插值表和宽松度标识3对应的插值表。
169.s605,在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标插值表;
170.具体的,宽松度参数集合中可以含有多个宽松度标识对应的插值表,获取目标宽松度标识后,即可以获取语音质量识别请求中的目标宽松度标识对应的目标插值表。
171.s606,获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分;
172.具体的,插值表中可以有多个不同的平滑变换区间,通过查看插值表,可以获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分。请一并参见图6b,图6b为一种基于插值表调整发音质量评分的示意图,在图6b中,其中横轴可以是发音质量评分,纵轴可以是目标发音质量评分,x0可以最小原始发音质量评分,x1可以是最大原始发音质量评分。在一种插值表中,若发音质量评分为74分,则从插值表中找到74分对应的平滑区间,若74分对应的平滑区间为73

75分,则平滑变换区间中的最大原始发音质量评分为75分,则平滑变换区间中的最小原始发音质量评分为73分。
173.s607,在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分;
174.具体的,通过查看插值表,可以在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分。再请参见图6b,y0可以是最小调整发音质量评分,y1可以是最大调整发音质量评分,在一种插值表中,若发音质量评分为74分,则从插值表中找到74分对应的平滑区间,若74分对应的平滑区间为73

75分,则通过插值表的对应关系可以得到最大原始发音质量评分所映射的最大调整发音质量评分为87分,最小原始发音质量评分所映射的最小调整发音质量评分为86分。
175.s608,根据最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分,将发音质量评分映射为目标发音质量评分。
176.具体的,从插值表中,可以获得最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分在平滑变换区间的对应关系,依照最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分在平滑变换区间的对应关系,将发音质量评分映射为目标发音质量评分。再请参见
图6b,对给定(x0,y0),(x1,y1)对在x0和x1之间的样本发音质量评分x进行预测,即为目标发音质量评分,最终得到样本目标发音质量评分y。在一种插值表中若发音质量评分为74分,则从插值表中找到74分对应的平滑区间,若74分对应的平滑区间为73

75分,则通过插值表的对应关系可以得到最大原始发音质量评分所映射的最大调整发音质量评分为87分,最小原始发音质量评分所映射的最小调整发音质量评分为86分,则最终调整后的分数为86.5分。每张插值表代表一种宽松度标识。
177.本技术在口语评分过程中引入了可由用户选择的宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,通过使用插值表这种目标宽松度调整参数,可以更自由的构建使用模型,增加目标宽松度参数集合的多样性,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为不同人群类型提供合适的发音评分,且可以降低使用成本和开发成本。
178.请参见图7,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由计算机设备执行,计算机设备可以为终端设备或服务器,方法可以包括:
179.s701,获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
180.本步骤的具体过程可以参见上述图3所对应实施例中的s301,这里不再进行赘述。
181.s702,提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
182.本步骤的具体过程可以参见上述图4所对应实施例中的s402,这里不再进行赘述。
183.s703,通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分;
184.本步骤的具体过程可以参见上述图4所对应实施例中的s403,这里不再进行赘述。
185.s704,若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识;
186.具体的,若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,借助最小整数区间内的两个整数的宽松度标识来获取非整数的目标宽松度标识的参数,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识。例如,若目标宽松度标识为2.2,则对应的最小整数区间为2至3,则2即为第三宽松度标识,3即为第四宽松度标识。
187.s705,获取第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重;
188.例如,若floor表示宽松度i向最小整数区间的最小整数取整,ceil表示宽松度i向最小整数区间的最大整数取整,则第三权重可以为(1

(i

floor(i))),第四权重可以为(i

floor(i))。
189.s706,根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分;
190.具体的,在宽松度参数集合中获取第三宽松度标识对应的插值表,宽松度参数集合可以含有多个宽松度标识对应的插值表,根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分。例如,若目标宽松度标识为2.2,则对应的最小整数区间为2至3,则2即为第三宽松度标识,根据第三宽松度标识2对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分。
191.s707,根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分;
192.具体的,在上述的宽松度参数集合中获取第四宽松度标识对应的插值表,根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分。例如,若目标宽松度标识为2.2,则对应的最小整数区间为2至3,则3即为第四宽松度标识,根据第四宽松度标识3对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分。
193.s708,根据第三权重和第四权重,对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。
194.具体的,通过第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重,可以对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。例如,若目标宽松度标识为2.2,则对应的最小整数区间为2至3,2即为第三宽松度标识,根据第三宽松度标识2对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分,3即为第四宽松度标识,根据第四宽松度标识3对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分,若floor表示宽松度i向最小整数区间的最小整数取整,ceil表示宽松度i向最小整数区间的最大整数取整,则第三权重可以为(1

(i

floor(i))),第四权重可以为(i

floor(i)),若第一插值发音质量评分为a,第二插值发音质量评分为b,则目标发音质量评分可以为(1

(i

floor(i)))*a+(i

floor(i))*b。
195.从本技术实施例中,可以看出,经过宽松度变换后,随着宽松度增加,分数整体权重向高分方向偏移。
196.本技术在口语评分过程中引入了可由用户选择的宽松度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,通过使用插值表这种目标宽松度调整参数,对非整数目标宽松度标识的处理,目标发音质量评分颗粒度可以更细,提供了更加全面的专业水平覆盖,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为不同人群类型提供合适的发音评分,且可以降低使用成本和开发成本。
197.请参见图8,是本技术实施例提供的一种数据处理方法的流程示意图,方法可以由
终端设备执行,方法可以包括:
198.s801,终端设备获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求;
199.具体的,终端设备响应针对语音输入页面的宽松度输入操作,将所输入的参数确定为目标宽松度标识;响应针对语音输入页面的音频采集操作,获取音频数据,生成包含音频数据和目标宽松度标识的语音质量识别请求。
200.s802,将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的;
201.具体的,终端设备将语音识别请求发送至服务器,服务器根据语音质量识别请求中的目标宽松度标识与目标宽松度调整参数的对应关系,获取目标宽松度调整参数,再通过目标宽松度调整参数对发音质量评分进行评分调整,则得到的目标发音质量评分就是与目标宽松度标识相匹配的。服务器调整发音质量评分的过程可以参见上述图3

图7所对应的实施例,这里不再进行赘述。
202.s803,对服务器所返回的目标发音质量评分进行输出;
203.具体的,终端设备接收服务器发送的目标发音质量评分,将接收到的目标发音质量评分进行输出显示。
204.本技术实施例通过终端设备获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求,将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的,终端设备对服务器所返回的目标发音质量评分进行输出,以此达到发音质量评分的快速变换。本技术在口语评分过程中引入了可由用户选择的宽松度标识,优化了终端设备与服务器之间的交互流程,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,提高了终端设备与服务器之间的交互效率,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
205.请参见图9a,是本技术实施例提供的一种数据处理装置的结构示意图。如图9a所示,该数据处理装置1可以应用于上述图1对应实施例中的任意一个终端设备,该数据处理装置1可以包括:获取模块11、评分模块12、宽松度调整模块13;
206.获取模块11,用于获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;
207.上述获取模块11的具体实施方式可以参见上述图3实施例中的步骤s301,这里不再进行赘述。
208.评分模块12,用于提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;
209.其中,评分模块12的具体实施方式可以参见上述图3实施例中的步骤s302,这里不再进行赘述。
210.宽松度调整模块13,用于获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
211.上述宽松度调整模块13的具体实施方式可以参见上述图3实施例中的步骤s303,这里不再进行赘述。
212.其中,评分模块12包括:
213.特征提取单元121,用于提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;
214.上述特征提取单元121的具体实施方式可以参见上述图4实施例中的步骤s402,这里不再进行赘述。
215.语音质量识别单元122,用于通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分;
216.上述语音质量识别单元122的具体实施方式可以参见上述图4实施例中的步骤s403,这里不再进行赘述。
217.其中,目标宽松度调整参数包括目标发音评分均值和目标发音评分标准差;宽松度调整模块13包括:
218.第一参数获取单元131,用于获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差;
219.上述第一参数获取单元131的具体实施方式可以参见上述图4实施例中的步骤s404,这里不再进行赘述。
220.第一参数获取单元131,还用于在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差;
221.其中,第一参数获取单元131的具体实施方式可以参见上述图4实施例中的步骤s405,这里不再进行赘述。
222.第一评分调整单元132,用于根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
223.上述第一评分调整单元132的具体实施方式可以参见上述图4实施例中的步骤s406、s407,这里不再进行赘述。
224.其中,第一评分调整单元132,用于将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值,将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分;样本发音评分均值和样本发音评分标准差均是基于样本音频数据集合所对应的样本发音评分所确定的;
225.上述第一评分调整单元132的具体实施方式可以参见上述图4实施例中的步骤s406、s407,这里不再进行赘述。
226.其中,目标宽松度调整参数包括第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数;
227.宽松度调整模块13还包括:
228.第二参数获取单元133,用于若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识;
229.上述第二参数获取单元133的具体实施方式可以参见上述图5例中的步骤s504,这里不再进行赘述。
230.第二参数获取单元133,还用于获取第一宽松度标识对应的第一权重,以及第二宽松度标识对应的第二权重;
231.上述第二参数获取单元133的具体实施方式可以参见上述图5实施例中的步骤s505,这里不再进行赘述。
232.第一融合单元134,用于根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数;
233.上述第一融合单元134的具体实施方式可以参见上述图5实施例中的步骤s506,这里不再进行赘述。
234.第二评分调整单元135,用于根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
235.上述第二评分调整单元135的具体实施方式可以参见上述图5实施例中的步骤s509,这里不再进行赘述。
236.其中,宽松度调整参数包括发音评分均值和发音评分标准差;
237.第一融合单元134,具体用于根据第一权重和第二权重,对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到融合发音评分均值,根据第一权重的平方值以及第二权重的平方值,对第一宽松度标识对应的发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差,将融合发音评分均值和融合发音评分标准差确定为融合宽松度调整参数;
238.上述第一融合单元134的具体实施方式可以参见上述图5实施例中的步骤s507、s508,这里不再进行赘述。
239.其中,目标宽松度调整参数包括目标插值表;
240.宽松度调整模块13还包括:
241.第三参数获取单元136,用于获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的插值表;
242.上述第三参数获取单元136的具体实施方式可以参见上述图6a实施例中的步骤s604,这里不再进行赘述。
243.第三参数获取单元136,还用于在宽松度参数集合中,获取语音质量识别请求中的
目标宽松度标识对应的目标插值表;
244.上述第三参数获取单元136的具体实施方式可以参见上述图6a实施例中的步骤s605,这里不再进行赘述。
245.第三评分调整单元137,用于根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;
246.上述第三评分调整单元137的具体实施方式可以参见上述图6a实施例中的步骤s606、s607、s608,这里不再进行赘述。
247.其中,第三评分调整单元137,具体用于获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分,在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分,根据最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分,将发音质量评分映射为目标发音质量评分;
248.上述第三评分调整单元137的具体实施方式可以参见上述图6a实施例中的步骤s606、s607、s608,这里不再进行赘述。
249.其中,目标宽松度调整参数包括第三宽松度标识对应的插值表以及第四宽松度标识对应的插值表;
250.宽松度调整模块13还包括:
251.第四参数获取单元138,用于若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识;
252.上述第四参数获取单元138的具体实施方式可以参见上述图7实施例中的步骤s704,这里不再进行赘述。
253.第四参数获取单元138,还用于获取第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重;
254.上述第四参数获取单元138的具体实施方式可以参见上述图7实施例中的步骤s705,这里不再进行赘述。
255.插值评分单元139,用于根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分;
256.上述插值评分单元139的具体实施方式可以参见上述图7实施例中的步骤s706,这里不再进行赘述。
257.插值评分单元139,还用于根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分;
258.上述插值评分单元139的具体实施方式可以参见上述图7实施例中的步骤s707,这里不再进行赘述。
259.第二融合单元1310,用于根据第三权重和第四权重,对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。
260.上述第二融合单元1310的具体实施方式可以参见上述图7实施例中的步骤s708,
这里不再进行赘述。
261.请参见图9b,是本技术实施例提供的一种数据处理装置的结构示意图。如图9b所示,该数据处理装置2可以应用于上述图1对应实施例中的任意一个终端设备,该数据处理装置2可以包括:请求生成模块21、发送模块22、输出模块23;请求生成模块21,用于获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求;
262.上述请求生成模块21的具体实施方式可以参见上述图8实施例中的步骤s801,这里不再进行赘述。
263.发送模块22,用于将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的;
264.上述发送模块22的具体实施方式可以参见上述图8实施例中的步骤s802,这里不再进行赘述。
265.输出模块23,用于对服务器所返回的目标发音质量评分进行输出。
266.上述输出模块23的具体实施方式可以参见上述图8实施例中的步骤s803,这里不再进行赘述。
267.其中,请求生成模块21,具体用于响应针对语音输入页面的宽松度输入操作,将所输入的参数确定为目标宽松度标识,响应针对语音输入页面的音频采集操作,获取音频数据,生成包含音频数据和目标宽松度标识的语音质量识别请求。
268.上述请求生成模块21的具体实施方式可以参见上述图8实施例中的步骤s801,这里不再进行赘述。
269.本技术实施例通过终端设备获取语音质量识别请求,获得音频数据和目标宽松度标识。然后,终端设备提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分。终端设备获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分,以此达到发音质量评分的快速变换。通过上述所提供的宽松度变换方法,可实现针对不同年龄人群,以不同的宽松度进行口语评测,保证了口语评测软件的实用性。
270.请参见图10,是本技术实施例提供的又一种计算机设备的结构示意图。如图10示,该计算机设备可以应用于上述图1对应实施例中的终端设备。计算机设备1000包括:处理器1001,网络接口1004和存储器1005,此外,计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(display)、键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。存储器1004可以是高速ram存储器,也可以是非不稳定的存储器(non

volatile memory),例如至少一个磁盘存储器。存储器1004可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
271.在图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能,以用于与
服务器进行通信;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1004中存储的设备控制应用程序,以实现:
272.处理器1001获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
273.在一个实施例中,处理器1001在将提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分时,具体执行以下步骤:
274.提取语音质量识别请求中的音频数据对应的声学特征,识别音频数据的文本信息,提取文本信息对应的文本特征,将声学特征和文本特征确定为音频特征,将音频特征输入语音质量识别模型;通过语音质量识别模型对音频特征进行卷积处理,得到音频隐藏特征,将音频隐藏特征输入语音质量识别模型中的分类层,通过分类层输出发音质量评分。
275.在一个实施例中,处理器1001在将获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
276.获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的发音评分均值和发音评分标准差;在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标发音评分均值和目标发音评分标准差;根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
277.在一个实施例中,处理器1001在将根据目标发音评分均值和目标发音评分标准差,对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
278.将发音质量评分与样本发音评分均值的差值确定为第一目标差值,将第一目标差值与样本发音评分标准差的比值确定为第一目标比值;样本发音评分均值和样本发音评分标准差均是基于样本音频数据集合所对应的样本发音评分所确定的;将第一目标比值与目标发音评分标准差的乘积确定为第一目标乘积,将第一目标乘积与目标发音评分均值的和确实为目标发音质量评分。
279.在一个实施例中,处理器1001在将获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,目标宽松度调整参数包括第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
280.若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第一宽松度标识,将最小整数区间中的最大整数值确定为第二宽松度标识;获取第一宽松度标识对应的第一权重,以及第二宽松度标识对应的第二权重;根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数;根据融合宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量
评分。
281.在一个实施例中,处理器1001在将根据第一权重和第二权重,对第一宽松度标识对应的宽松度调整参数以及第二宽松度标识对应的宽松度调整参数进行加权求和,得到融合宽松度调整参数时,具体执行以下步骤:
282.根据第一权重和第二权重,对第一宽松度标识对应的发音评分均值以及第二宽松度标识对应的发音评分均值进行加权求和,得到融合发音评分均值;根据第一权重的平方值以及第二权重的平方值,对第一宽松度标识对应的发音评分标准差的平方值以及第二宽松度标识对应的发音评分标准差的平方值进行加权求和,得到融合发音评分标准差的平方值,从融合发音评分标准差的平方值中获取融合发音评分标准差;将融合发音评分均值和融合发音评分标准差确定为融合宽松度调整参数。
283.在一个实施例中,处理器1001在将获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
284.获取宽松度参数集合;宽松度参数集合包括至少两个宽松度标识分别对应的插值表;在宽松度参数集合中,获取语音质量识别请求中的目标宽松度标识对应的目标插值表;根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。
285.在一个实施例中,处理器1001在将根据目标插值表对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
286.获取发音质量评分在目标插值表中的平滑变换区间,获取平滑变换区间中的最大原始发音质量评分和最小原始发音质量评分;在平滑变换区间中获取最大原始发音质量评分所映射的最大调整发音质量评分,以及最小原始发音质量评分所映射的最小调整发音质量评分;根据最大原始发音质量评分、最大调整发音质量评分、最小原始发音质量评分以及最小调整发音质量评分,将发音质量评分映射为目标发音质量评分。
287.在一个实施例中,处理器1001在将获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分时,具体执行以下步骤:
288.若目标宽松度标识为非整数,则获取目标宽松度标识所处的最小整数区间,将最小整数区间中的最小整数值确定为第三宽松度标识,将最小整数区间中的最大整数值确定为第四宽松度标识;获取第三宽松度标识对应的第三权重,以及第四宽松度标识对应的第四权重;根据第三宽松度标识对应的插值表对发音质量评分进行评分调整,得到第一插值发音质量评分;根据第四宽松度标识对应的插值表对发音质量评分进行评分调整,得到第二插值发音质量评分;根据第三权重和第四权重,对第一插值发音质量评分和第二插值发音质量评分进行加权求和,得到与目标宽松度标识相匹配的目标发音质量评分。
289.本技术实施例通过获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。本技术在口语评分过程中引入了可由用户选择的宽松
度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
290.应当理解,本技术实施例中所描述的计算机设备1000可执行前文图3、图4、图5、图6a、图7、图8中任一个所对应实施例中对数据处理方法的描述,也可执行前文图8所对应实施例中对计算机设备的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
291.请参见图11,是本技术实施例提供的又一种计算机设备的结构示意图。如图11示,该计算机设备可以应用于上述图1对应实施例中的终端设备。计算机设备1100包括:处理器1101,网络接口1104和存储器1105,此外,计算机设备1100还可以包括:用户接口1103,和至少一个通信总线1102。其中,通信总线1102用于实现这些组件之间的连接通信。其中,用户接口1103可以包括显示屏(display)、键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1104可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。存储器1104可以是高速ram存储器,也可以是非不稳定的存储器(non

volatile memory),例如至少一个磁盘存储器。存储器1104可选的还可以是至少一个位于远离前述处理器1101的存储装置。如图11所示,作为一种计算机存储介质的存储器1104中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
292.在图11所示的计算机设备1100中,网络接口1104可提供网络通讯功能,以用于与服务器进行通信;而用户接口1103主要用于为用户提供输入的接口;而处理器1101可以用于调用存储器1104中存储的设备控制应用程序,以实现:
293.处理器1101获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求;将语音质量识别请求发送至服务器,以使服务器获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分;发音质量评分是根据语音质量识别请求中的音频数据对应的音频特征所生成的;对服务器所返回的目标发音质量评分进行输出。
294.在一个实施例中,处理器1101在将终端设备获取音频数据和目标宽松度标识,生成包括音频数据和目标宽松度标识的语音质量识别请求时,具体执行以下步骤:
295.终端设备响应针对语音输入页面的宽松度输入操作,将所输入的参数确定为目标宽松度标识;响应针对语音输入页面的音频采集操作,获取音频数据,生成包含音频数据和目标宽松度标识的语音质量识别请求。
296.本技术实施例通过获取语音质量识别请求;语音质量识别请求包括音频数据和目标宽松度标识;提取语音质量识别请求中的音频数据对应的音频特征,根据音频特征生成音频数据对应的发音质量评分;获取语音质量识别请求中的目标宽松度标识对应的目标宽松度调整参数,根据目标宽松度调整参数对发音质量评分进行评分调整,得到与目标宽松度标识相匹配的目标发音质量评分。本技术在口语评分过程中引入了可由用户选择的宽松
度标识,因此,当用户有不同的评分需求时,可以通过设置不同的宽松度标识,来选择不同的宽松度调整参数,通过宽松度调整参数可以将发音质量评分调整为用户所期望的评分效果,而且本技术通过设置宽松度标识即可实现多种不同口语评测应用所实现的功能,使得用户在需要不同评分标准的发音评分时无需分别下载和操作多个口语评测应用,开发人员也无需针对不同评分标准分别开发不同的口语评测应用,因此,本技术可以高效地为用户提供多种不同评分标准的发音评分,且可以降低使用成本和开发成本。
297.应当理解,本技术实施例中所描述的计算机设备1100可执行前文图3、图4、图5、图6a、图7、图8中任一个所对应实施例中对数据处理方法的描述,也可执行前文图8所对应实施例中对计算机设备的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
298.此外,这里需要指出的是:本技术实施例还提供了一种计算机存储介质,且计算机存储介质中存储有前文提及的计算机设备所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图2、图3、图4、图5、图6a、图7、图8任一个所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本技术所涉及的计算机存储介质实施例中未披露的技术细节,请参照本技术方法实施例的描述。
299.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)或随机存储记忆体(random access memory,ram)等。
300.以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1