基于仿真的语音测试方法、装置、电子设备及存储介质与流程

文档序号:24826322发布日期:2021-04-27 15:56阅读:143来源:国知局
基于仿真的语音测试方法、装置、电子设备及存储介质与流程

1.本申请涉及自动驾驶、车辆网等人工智能领域,尤其涉及一种基于仿真的语音测试方法、装置、电子设备、程序产品、车辆及存储介质。


背景技术:

2.随着人工智能技术的发展,语音处理技术被广泛地应用于各个领域,如智能驾驶和智能家居等。
3.在现有技术中,如在对车辆上部署的音频处理方法进行测试时,通常需要召集测试人员,并由测试人员在车辆上对音频处理方法进行测试,得到相应的测试报告,并由音频处理方法对应的工程师基于测试报告对音频处理方法进行适应性调整,再由测试人员在车辆上对调整后的音频处理方法进行测试,以此类推,直至得到满足需求的音频处理方法。
4.然而,采用上述方法,可能造成测试时间长,测试效率低的弊端。


技术实现要素:

5.本申请提供了一种用于提高语音测试效率的一种基于仿真的语音测试方法、装置、电子设备、程序产品、车辆及存储介质。
6.根据本申请的一方面,提供了一种基于仿真的语音测试方法,包括:
7.获取基于真实车辆采集的待测试音频,所述待测试音频中携带有语音信息,所述语音信息用于指示真实车辆执行与所述语音信息对应的业务操作;
8.在仿真环境中,依据预设音频处理参数,对所述待测试音频进行处理,得到与所述音频处理参数对应的语音信息;
9.在仿真环境的仿真车辆中,执行与所述音频处理参数对应的语音信息,得到语音测试结果。
10.根据本申请的另一方面,提供了一种基于仿真的语音测试装置,包括:
11.第一获取模块,用于获取基于真实车辆采集的待测试音频,所述待测试音频中携带有语音信息,所述语音信息用于指示真实车辆执行与所述语音信息对应的业务操作;
12.处理模块,用于在仿真环境中,依据预设音频处理参数,对所述待测试音频进行处理,得到与所述音频处理参数对应的语音信息;
13.执行模块,用于在仿真环境的仿真车辆中,执行与所述音频处理参数对应的语音信息,得到语音测试结果。
14.根据本申请的另一方面,提供了一种电子设备,包括:
15.至少一个处理器;以及
16.与所述至少一个处理器通信连接的存储器;其中,
17.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上实施例所述的方法。
18.根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,所述计算机指令用于使所述计算机执行如上实施例所述的方法。
19.根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据如上实施例所述的方法。
20.根据本申请的另一方面,提供了一种车辆,包括:音频采集器、处理器、以及控制器;其中,
21.所述音频采集器,用于对待处理音频进行采集,所述待处理音频中携带有语音信息,所述语音信息用于指示车辆执行与所述语音信息对应的业务操作;
22.所述处理器,用于基于预设的音频处理参数对所述待处理音频进行处理,得到与所述音频处理参数对应的音频信息,所述音频处理参数是基于上述实施例所述的方法得到的;
23.所述控制器,用于基于与所述音频处理参数对应的音频信息控制所述车辆执行相应的业务操作。
24.应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
25.附图用于更好地理解本方案,不构成对本申请的限定。其中:
26.图1是根据本申请第一实施例的示意图;
27.图2是可以实现本申请实施例的基于仿真的语音测试方法的场景图;
28.图3是根据本申请第二实施例的示意图;
29.图4是根据本申请第三实施例的示意图;
30.图5是根据本申请第四实施例的示意图;
31.图6是根据本申请第五实施例的示意图;
32.图7是根据本申请第六实施例的示意图;
33.图8是根据本申请第七实施例的示意图;
34.图9是根据本申请第八实施例的示意图。
具体实施方式
35.以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
36.随着人工智能技术的发展,语音处理被广泛地应用于各个领域,如智能驾驶、智能家居、智能出行、以及智能助手等。
37.语音处理可以基于音频处理方法实现,如消噪算法等,而一般地,音频处理算法需要在测试之后,部署于相应的设备,如实现智能驾驶的车载终端,又如实现智能家居的家电设备等。
38.以智能驾驶场景为例,在相关技术中,由音频处理算法对应的工程师设计并将音频处理算法部署于车载终端,并召集测试人员在车辆上对音频处理算法进行测试,得到相
应的测试报告,如果测试达不到预设的测试需求,则由工程师基于经验调整音频处理算法,并由测试人员在车辆上再次对调整后的音频处理算法进行测试,以此类推,直至得到满足测试需求的音频处理方法。
39.然而,通过上述相关技术中的方法,测试人员必须在车辆上对音频处理算法进行测试,导致效率低,且消耗车辆资源的弊端。
40.本申请的发明人经过创造性地劳动,得到了本申请的发明构思:在如电脑pc端上部署车辆的仿真环境,并基于仿真环境实现对音频处理算法的测试,从而实现节约人工成本,提高测试效率等技术效果。
41.基于上述发明构思,本申请提供一种基于仿真的语音测试方法、装置、电子设备、存储介质、程序产品、以及车辆,应用于自动驾驶、车辆网等人工智能领域,以达到提高语音测试的效率的技术效果。
42.图1是根据本申请第一实施例的示意图,如图1所示,本申请实施例提供的基于仿真的语音测试方法,包括:
43.s101:获取基于真实车辆采集的待测试音频,待测试音频中携带有语音信息,语音信息用于指示真实车辆执行与语音信息对应的业务操作。
44.示例性地,本实施例的执行主体可以为基于仿真的语音测试装置(下文简称测试装置),且测试装置可以为计算机、服务器、终端设备、以及电脑(如台式电脑和笔记本电脑等pc端)。
45.图2是可以实现本申请实施例的基于仿真的语音测试方法的场景图,结合如图2所示的应用场景对该步骤地理解如下:
46.测试装置201(图2中以测试装置为台式电脑为例进行了示范性地展示)可以获取基于真实车辆202采集的待测试音频,待测试音频中携带用于指示真实车辆202执行业务操作的语音信息,业务操作可以为打开天窗,也可以为打开左边的窗户,还可以为播放音乐等。
47.具体地,以业务操作为打开天窗为例,结合如图2所示的应用场景对该步骤地理解如下:
48.测试人员203乘坐于真实车辆202中,并发起打开天窗的语音信息,真实车辆202采集到携带语音信息的待测试音频,并将待测试音频发送给测试装置201,相应地,测试装置201获取到由真实车辆202采集的待测试音频。
49.其中,测试装置201可以采用多种方式获取基于真实车辆202采集的待测试音频,例如:
50.一种方式中,可以如图2中所示,建立真实车辆202与测试装置201之间的通信链路,测试装置201可以基于通信链路获取基于真实车辆202采集的待测试音频。
51.另一种方式中,可以由测试人员203将由真实车辆202采集的待测试音频,转存(如拷贝等)至测试装置201。
52.应该理解地是,上述示例只是用于示范性地测试装置可能采用的获取待测试音频的方式,而不能理解为对测试装置获取待测试音频的方式的限定。
53.值得说明地是,在本实施例中,由测试装置获取基于真实车辆采集的待测试音频,以便测试装置执行后续的语音测试,无需由测试人员反复在真实车辆上对待测试音频进行
语音测试,提供了语音测试的效率,且节约了人工成本。
54.s102:在仿真环境中,依据预设音频处理参数,对待测试音频进行处理,得到与音频处理参数对应的语音信息。
55.示例性地,仿真环境可以理解为:基于真实车辆的语音测试环境在测试装置中仿真得到的语音测试环境。
56.其中,音频处理方法中包括音频处理参数,基于音频处理方法对语音进行处理,实际上是基于音频处理参数对语音进行处理,因此,在本实施例中,可以基于音频处理参数对待测试音频进行处理,得到与音频处理参数对应的语音信息。
57.在一些实施例中,音频处理参数为基于数字信号处理(digital signal process,dsp)的音频处理方法中的音频处理参数。
58.s103:在仿真环境的仿真车辆中,执行与音频处理参数对应的语音信息,得到语音测试结果。
59.示例性地,该步骤可以理解为:测试装置在测试装置中部署真实车辆的仿真环境,得到仿真车辆,并基于仿真车辆执行与音频处理参数对应的语音信息,得到语音测试结果。
60.值得说明地是,仿真环境可以包括仿真车辆,相应地,s102的执行也可以在仿真环境中的仿真车辆中执行。
61.基于上述分析可知,本申请实施例提供了一种基于仿真的语音测试方法,包括:获取基于真实车辆采集的待测试音频,待测试音频中携带有语音信息,语音信息用于指示真实车辆执行与语音信息对应的业务操作,在仿真环境中,依据预设音频处理参数,对待测试音频进行处理,得到与音频处理参数对应的语音信息,在仿真环境的仿真车辆中,执行与音频处理参数对应的语音信息,得到语音测试结果,通过依据音频处理参数对基于真实车辆采集的待测试音频进行处理,并结合仿真环境的仿真车辆执行与音频处理参数对应的语音信息,得到语音测试结果,避免了需要由测试人员在真实车辆反复进行语音测试造成的人工成本偏高,且效率偏低的问题,实现了人力资源,提高语音测试的效率的技术效果。
62.图3是根据本申请第二实施例的示意图,如图3所示,本申请实施例提供的基于仿真的语音测试方法,包括:
63.s301:获取基于真实车辆采集的待测试音频,待测试音频中携带有语音信息,语音信息用于指示真实车辆执行与语音信息对应的业务操作。
64.示例性地,关于s301地描述可以参见s101,此次不再赘述。
65.s302:在仿真环境中,依据多组音频处理参数,对待测试音频分别进行处理,得到与每一组音频处理参数对应的语音信息。
66.在本实施例中,音频处理参数的数量可以为多组,且可以基于每一组音频处理参数对待测试音频分别进行处理,得到与每一组音频处理参数对应的语音信息。
67.例如,音频处理参数的数量为30组,针对30组中的每一组音频处理参数,均对待测试音频进行处理,相应地,可以得到30组语音信息,且一组语音信息与一组音频处理参数对应。
68.在一些实施例中,得到每一组音频处理参数对应的语音信息包括如下步骤:依据每一组音频处理参数,对待测试音频进行噪音消除处理,得到与每一组音频处理参数对应的语音信息。
69.在一些实施例中,依据每一组音频处理参数,对待测试音频进行噪音消除处理,得到与每一组音频处理参数对应的语音信息,可以具体包括如下步骤:
70.步骤1:依据每一组音频处理参数,去除待测试音频中的回音音频,得到去除了回音音频的待测试音频。
71.示例性地,该步骤可以理解为对待测试音频进行回声消除处理,得到去除了回音音频的待测试音频。
72.步骤2:依据每一组音频处理参数,消除去除了回音音频的待测试音频中的环境音频,得到与音频处理参数对应的语音信息。
73.示例性地,该步骤可以理解为对步骤1得到的待测试音频进行环境降噪处理,得到与每一组音频处理参数对应的语音信息。
74.应该理解地是,在本实施例中,可以优先执行步骤1,而后执行步骤2;也可以优先执行步骤2,而后执行步骤1,本实施例不做限定。
75.值得说明地是,在实施例中,通过对待测试音频进行回声消除和去除环境音频处理,可以使得语音测试与实际的语音处理高度贴合,从而提高语音测试的可靠性和适用性的技术效果。
76.在一些实施例中,环境音频可以包括多种环境的各自对应的音频,如空调为打开状态时的环境音频、窗户为打开状态时的环境音频、以及音响为打开状态时的环境音频等。
77.例如,结合如图2所示的应用场景,待测试音频可以为真实车辆采集的包括多组环境音频的音频,具体地,待测试音频可以包括:多组环境音频、语音信息、以及回声信息。相应地,测试装置针对每一组环境音频,均执行在仿真环境中,依据音频处理参数进行相应地处理。
78.s303:在仿真环境的仿真车辆中,执行与每一组音频处理参数对应的语音信息,得到多组语音测试结果。
79.结合上述示例,音频处理参数的数量为30组,则经过处理后得到的语音信息为30个,相应地,在仿真车辆执行的语音信息的次数也为30次,得到30组语音测试结果。
80.结合如图2所示的应用场景,在一些实施例中,可以从多组语音测试结果中选择最优的语音测试结果,并将最优的语音测试结果对应的音频处理参数部署于真实车辆。
81.结合上述示例,若待测试音频中包括多组环境音频,则针对每一组环境音频,均可以得到与每一组环境音频对应的多组测试结果。
82.相应地,结合如图2所示的应用场景,在一些实施例中,可以在真实车辆中,部署针对每一组环境音频最优的音频处理结果对应的音频处理参数。相应地,真实车辆可以基于环境信息(如是否打开空调,是否打开窗户,是否播放音乐等)从各音频处理参数中,选择与环境信息对应的音频处理参数,并基于选择的音频处理参数对音频信息进行相应地处理,从而提高音频处理的效率和准确性的技术效果。
83.值得说明地是,在本实施例中,通过设置多组音频处理参数对待测试音频分别进行处理,并在仿真车辆中相应地执行处理得到的语音信息,得到多组语音测试结果,可以提高得到的语音测试结果的多样性和丰富性,从而提高语音测试的全面性和可靠性的技术效果。
84.图4是根据本申请第三实施例的示意图,如图4所示,本申请实施例提供的基于仿
真的语音测试方法,包括:
85.s401:获取基于真实车辆采集的待测试音频,待测试音频中携带有语音信息,语音信息用于指示真实车辆执行与语音信息对应的业务操作。
86.示例性地,关于s401地描述可以参见s101,此次不再赘述。
87.音频处理参数的数量为多组,重复执行s402和s404,直至得到最优的语音测试结果。
88.s402:在仿真环境中,依据当前的音频处理参数,对待测试音频进行处理,得到当前的语音信息。
89.示例性地,关于s402地原理可以参见s102地描述,或者s302地描述,此次不再赘述。
90.在一些实施例中,测试装置可以获取基于真实车辆采集的待测试音频,还可以获取部署于真实车辆的音频处理参数,则在测试装置首次依据当前的音频处理参数,对待测试音频进行处理时,当前的音频处理参数是对真实车辆的音频处理参数进行调整后的音频处理参数。
91.一个示例中,对真实车辆的音频处理参数进行调整可以由工作人员(如工程师)基于经验实现。
92.另一个示例中,对真实车辆的音频处理参数进行调整,也可以由测试装置基于需求、历史记录、以及试验等方式实现。
93.再一个示例中,对真实车辆的音频处理参数进行调整,还可以由测试装置获取真实车辆基于部署于真实车辆的音频处理参数,对待测试音频进行处理得到的语音测试结果,并基于该语音测试结果对真实车辆的音频处理参数进行调整。
94.例如,结合如图2所示的应用场景对测试装置获取基于真实车辆采集的语音测试结果对本实施例的理解如下:
95.真实车辆部署有音频处理参数,真实车辆可以基于该音频处理参数对真实车辆获取到的待测试音频进行处理,得到相应的语音信息,真实车辆可以执行该语音信息,即执行与该语音信息对应的业务操作,得到真实车辆的语音测试结果。
96.测试装置获取部署于真实车辆的音频处理参数、以及真实车辆得到的语音测试结果,测试装置基于真实车辆得到的语音测试结果对部署于真实车辆的音频处理参数进行调整,并将调整后的音频处理参数部署于测试装置,作为当前的音频处理参数。或者,
97.测试装置可以将部署于真实车辆的音频处理参数部署于测试装置中,并获取真实车辆得到的音频测试结果,测试装置基于真实车辆得到的语音测试结果对部署于测试装置的音频处理参数进行调整,得到当前的音频处理参数。
98.值得说明地是,在本实施例中,通过基于部署于真实车辆的音频处理参数对应的语音测试结果确定部署于仿真环境中的音频处理参数,可以提高语音测试的准确性和可靠性,且可以提高语音测试的效率的技术效果。
99.s403:在仿真环境的仿真车辆中执行当前的语音信息,得到当前的语音测试结果。
100.s404:依据当前的语音测试结果调整当前的音频处理参数。
101.值得说明地是,在本实施例中,通过反复执行s402至s404,直至得到最优的语音测试结果,可以提高语音测试的准确性和可靠性的技术效果。
102.在一些实施例中,可以将最优的语音测试结果对应的音频处理参数部署于真实车辆,以便真实车辆基于该音频参数对音频进行处理。
103.例如,结合上述示例以及如图2所示的应用场景,测试装置在确定出最优的语音测试结果之后,可以确定与最优的语音测试结果对应的音频处理参数,则将该音频处理参数发送给真实车辆,由真实车辆基于该音频处理参数对音频进行处理。
104.在一些实施例中,s404可以包括如下步骤:
105.步骤1:依据当前的语音测试结果和预设的测试需求信息,确定调整参数。
106.示例性地,测试需求信息可以表征与测试结果的需求相关的信息,如唤醒相关的信息和识别相关的信息等。
107.在一些实施例中,调整信息包括参数调整方向和参数调整幅度,步骤1可以包括如下子步骤:
108.子步骤1:确定当前的语音测试结果和预设的测试需求信息之间的差异信息。
109.在一些实施例中,测试需求包括:需求的语音唤醒率和需求的语音识别率;当前的语音测试结果包括:仿真的语音唤醒率和仿真的语音识别率;语音识别率表征语音信息的识别率,语音唤醒率表征是否成功执行语音信息所指示的业务操作,子步骤1可以包括:根据仿真的语音唤醒率和需求的语音唤醒率,确定语音唤醒差异信息,并根据仿真的语音识别率和需求的语音识别率,确定语音识别差异信息,且根据语音唤醒差异信息和语音识别差异信息,确定当前的语音测试结果和测试需求之间的差异信息。
110.示例性地,语音信息的识别率(即语音识别率)具体可以理解为:可以将语音信息转换为字符串,识别出的字符串占总字符串的比值。
111.语音唤醒率具体可以理解为:是否成功执行语音信息所指示的业务操作,如仿真的语音唤醒率可以理解为仿真车辆是否成功执行与当前的语音信息所指示的业务操作,如打开天窗等。
112.值得说明地是,在本实施例中,差异信息可以包括两个维度的内容,分别为语音唤醒差异信息和语音识别差异信息,可以增加确定出的差异信息的丰富程度,从而提高确定出的差异信息的准确性和可靠性的技术效果。
113.子步骤2:根据差异信息确定参数调整方向和参数调整幅度。
114.示例性地,参数调整方向可以表征将当前的音频处理参数往大的方向调整或者往小的方向调整。参数调整幅度可以表征对当前的音频处理参数进行调整的范围。
115.例如,若基于差异信息确定当前的语音测试结果与测试需求信息之间的差异较大,则确定出的参数调整幅度相对较大;若基于差异信息确定当前的语音测试结果与测试需求信息之间的差异较小,则确定出的参数调整幅度相对较小。
116.又如,若基于差异信息确定当前的语音测试结果小于测试需求信息,则确定出参数调整方向为将当前的音频处理参数往大的方向调整;若基于差异信息确定当前的语音测试结果大于测试需求信息,则确定出参数调整方向为将当前的音频处理参数往小的方向调整。
117.值得说明地是,在本实施例中,通过基于差异信息确定包括两个维度的内容的调整信息,即参数调整方向和参数调整幅度,可以提高确定出的调整参数的准确性和可靠性的技术效果,从而实现提高语音测试的准确性和可靠性,且提高语音测试的效率的技术效
果。
118.步骤2:根据调整参数,调整当前的音频处理参数。
119.值得说明地是,在本实施例中,通过结合测试需求信息确定调整参数,并基于调整参数调整当前的音频处理参数,可以使得调整后的音频处理参数尽可能地与测试需求信息贴近,从而提高对当前的音频处理参数的调整的准确性和可靠性的技术效果,且实现语音测试的效率的技术效果。
120.图5是根据本申请第四实施例的示意图,如图5所示,本申请实施例提供的基于仿真的语音测试装置101,包括:
121.第一获取模块1011,用于获取基于真实车辆采集的待测试音频,待测试音频中携带有语音信息,语音信息用于指示真实车辆执行与语音信息对应的业务操作。
122.处理模块1012,用于在仿真环境中,依据预设音频处理参数,对待测试音频进行处理,得到与音频处理参数对应的语音信息。
123.执行模块1013,用于在仿真环境的仿真车辆中,执行与音频处理参数对应的语音信息,得到语音测试结果。
124.在一些实施例中,音频处理参数的数量为多组;所述处理模块1012用于,依据多组音频处理参数,对待测试音频分别进行处理,得到与每一组音频处理参数对应的语音信息。
125.执行模块1013用于,在仿真环境的仿真车辆中,执行与每一组音频处理参数对应的语音信息,得到多组语音测试结果。
126.在一些实施例中,由所述处理模块和执行模块重复以下操作,直至得到最优的语音测试结果:
127.处理模块1012用于,依据当前的音频处理参数,对待测试音频进行处理,得到当前的语音信息。
128.如图6所示,执行模块包括:
129.执行子模块10131,用于在仿真环境的仿真车辆中执行当前的语音信息,得到当前的语音测试结果。
130.调整子模块10132,用于依据当前的语音测试结果调整当前的音频处理参数。
131.在一些实施例中,调整子模块10132用于,依据当前的语音测试结果和预设的测试需求信息,确定调整参数,并根据调整参数,调整当前的音频处理参数。
132.在一些实施例中,调整信息包括参数调整方向和参数调整幅度;调整子模块10132用于,确定当前的语音测试结果和预设的测试需求信息之间的差异信息,并根据所述差异信息确定所述参数调整方向和所述参数调整幅度。
133.在一些实施例中,测试需求包括:需求的语音唤醒率和需求的语音识别率;当前的语音测试结果包括:仿真的语音唤醒率和仿真的语音识别率;语音识别率表征语音信息的识别率,语音唤醒率表征是否成功执行语音信息所指示的业务操作;调整子模块10132用于,根据仿真的语音唤醒率和需求的语音唤醒率,确定语音唤醒差异信息,并根据仿真的语音识别率和需求的语音识别率,确定语音识别差异信息,并根据语音唤醒差异信息和语音识别差异信息,确定当前的语音测试结果和测试需求之间的差异信息。
134.结合图7可知,在一些实施例中,基于仿真的语音测试装置101还包括:
135.第二获取模块1014,用于获取基于真实车辆根据部署于真实车辆的音频处理参数
对待测试音频进行处理,得到的与部署于真实车辆的音频处理参数对应的语音测试结果。
136.调整模块1015,用于根据获取到的真实车辆对应的语音测试结果对部署于真实车辆的音频处理参数进行调整,并将调整后的音频处理参数作为部署于仿真环境中的预设音频处理参数。
137.在一些实施例中,处理模块1012用于,依据音频处理参数,对待测试音频进行噪音消除处理,得到与音频处理参数对应的语音信息。
138.结合图8可知,在一些实施例中,处理模块1012包括:
139.回音音频处理子模块10121,用于依据音频处理参数,去除待测试音频中的回音音频,得到去除了回音音频的待测试音频。
140.环境音频处理子模块10122,用于依据音频处理参数,消除去除了回音音频的待测试音频中的环境音频,得到与音频处理参数对应的语音信息。
141.根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
142.根据本公开的实施例,本公开还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
143.图9示出了可以用来实施本申请的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
144.如图9所示,电子设备900包括计算单元901,其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
145.设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
146.计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如基于仿真的语音测试方法。例如,在一些实施例中,基于仿真的语音测试方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的基于
仿真的语音测试方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于仿真的语音测试方法。
147.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
148.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
149.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
150.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
151.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。
152.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或
云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
153.根据本申请实施例的另一个方面,本申请实施例还提供了一种车辆,包括:音频采集器、处理器、以及控制器;其中,
154.音频采集器,用于对待处理音频进行采集,待处理音频中携带有语音信息,语音信息用于指示车辆执行与语音信息对应的业务操作。
155.示例性地,音频采集器可以为可以对音频进行采集的装置,例如,音频采集器可以为设置于车辆的麦克风。
156.其中,待处理音频可以包括语音信息、回音音频(如基于语音信息的参考信号)、以及环境音频(如环境中的噪音信号)。
157.处理器,用于基于预设的音频处理参数对待处理音频进行处理,得到与音频处理参数对应的音频信息,音频处理参数是基于上述实施例的基于仿真的语音测试方法得到的。
158.示例性地,结合上述示例,处理器可以基于音频处理参数对待处理音频进行回音音频消除处理,去除待处理音频中的回音音频,并对去除了回音音频的待处理音频进行消除环境音频处理,得到与音频处理参数对应的语音信息。
159.控制器,用于基于与音频处理参数对应的音频信息控制车辆执行相应的业务操作。
160.示例性地,若基于音频处理参数对应的音频信息为打开天窗,则控制器控制车辆执行打开天窗的操作。
161.值得说明地是,在本实施例中,通过在处理器上部署基于上述实施例的基于仿真的语音测试方法得到的音频处理参数,由于语音测试的可靠性和准确性,因此可以提高对车辆控制的准确性和可靠性的技术效果。
162.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
163.上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1