语音识别测试方法及装置制造方法

文档序号:2826307阅读:128来源:国知局
语音识别测试方法及装置制造方法
【专利摘要】本发明公开了一种语音识别测试方法及装置,属于计算机领域。所述方法包括:获取本地预先存储的语音样本文件;根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;接收所述语音识别服务器返回的识别结果;根据所述识别结果获得语音识别测试结果。本发明通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,并根据识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
【专利说明】语音识别测试方法及装置

【技术领域】
[0001]本发明涉及计算机领域,特别涉及一种语音识别测试方法及装置。

【背景技术】
[0002]随着语音识别技术的不断发展,语音识别服务也逐渐走进人们的日常生活。在一款语音识别系统正式投入应用之前,测试人员通常需要对该语音识别系统的各项指标进行测试。
[0003]以对语音识别系统的识别准确性进行测试为例,现有的语音识别测试方法,主要通过人工进行测试。具体的,测试人员在终端中打开语音识别客户端,并对着终端的语音采集单元说话以输入待测试的语音样本,语音识别客户端将语音采集单元采集到的语音样本转换为指定格式的文件发送给语音识别服务器;终端接收语音识别服务器对该语音样本进行识别后返回的识别结果并显示在终端的显示屏中,测试人员通过肉眼观察显示屏中显示的识别结果来判断语音识别系统的识别准确性。
[0004]在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
[0005]对语音识别系统进行测试时,通常需要测试多个不同的语音样本,并且对相同的语音样本也需要反复进行多次测试,这就需要测试人员多次人工输入语音样本,操作步骤繁琐、测试周期长且人工成本高。


【发明内容】

[0006]为了解决现有技术中需要测试人员多次人工输入语音样本,操作步骤繁琐、测试周期长且人工成本高的问题,本发明实施例提供了一种语音识别测试方法及装置。所述技术方案如下:
[0007]—方面,提供了一种语音识别测试方法,所述方法包括:
[0008]获取本地预先存储的语音样本文件;
[0009]根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
[0010]接收所述语音识别服务器返回的识别结果;
[0011]根据所述识别结果获得语音识别测试结果。
[0012]另一方面,提供了一种语音识别测试装置,所述装置包括:
[0013]文件获取模块,用于获取本地预先存储的语音样本文件;
[0014]请求发送模块,用于根据所述文件获取模块获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
[0015]识别结果接收模块,用于接收所述语音识别服务器返回的识别结果;
[0016]测试结果获得模块,用于根据所述识别结果获得语音识别测试结果。
[0017]本发明实施例提供的技术方案带来的有益效果是:
[0018]通过根据预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。

【专利附图】

【附图说明】
[0019]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本发明实施例一提供的语音识别测试方法的方法流程图;
[0021]图2是本发明实施例二提供的语音识别测试方法的方法流程图;
[0022]图3是本发明实施例三提供的语音识别测试装置的装置结构图;
[0023]图4是本发明实施例四提供的语音识别测试装置的装置结构图。

【具体实施方式】
[0024]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0025]实施例一
[0026]请参见图1,其示出了本发明实施例一提供的语音识别测试方法的方法流程图。该语音识别测试方法可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。该语音识别测试方法可以包括:
[0027]步骤102,获取本地预先存储的语音样本文件;
[0028]步骤104,根据该语音样本文件向语音识别服务器发送语音识别请求,该语音识别请求用于指示语音识别服务器对该语音样本文件对应的语音进行识别;
[0029]步骤106,接收语音识别服务器返回的识别结果;
[0030]步骤108,根据该识别结果获得语音识别测试结果。
[0031 ] 其中,该语音识别服务器可以是社交应用中的语音识别服务器。
[0032]综上所述,本发明实施例提供的语音识别测试方法,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以从本地获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
[0033]实施例二
[0034]为了对上述实施例一提供的语音识别测试方法做进一步的描述,请参见图2,其示出了本发明实施例二提供的语音识别测试方法的方法流程图。该语音识别测试方法可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。以对一语音识别系统的响应时间和识别准确性进行检测为例,该语音识别测试方法可以包括:
[0035]步骤202,语音识别测试装置获取本地预先存储的语音样本文件;
[0036]在获取语音样本文件之前,语音识别测试装置首先通过语音采集单元采集输入的语音,根据采集到的语音生成该语音样本文件,并本地存储生成的该语音样本文件。当语音识别测试装置需要对语音识别系统进行多次内容相同的测试时,可以直接从本地提取该语音样本文件进行测试,无需测试人员人工反复输入语音样本。
[0037]进一步的,在生成该语音样本文件后,语音识别测试装置还可以接收输入的,用于表征该语音的内容的文本,并将接收到的该文本与该语音样本文件对应存储,以便后续根据该文本检测语音识别系统的识别准确性。
[0038]其中,将接收到的文本与语音样本文件对应存储时,可以将接收到的文本与语音样本文件分别进行存储,并建立两者之间的映射关系;或者,也可以将接收到的文本与语音样本文件一并存储,比如,将接收到的文本存储为语音样本文件的文件名。
[0039]具体的,以将接收到的文本存储为语音样本文件的文件名为例,测试人员向语音识别测试装置或者包含有语音识别测试装置的设备输入待测试的语音,比如,测试人员可以对着语音采集单元,比如麦克风,人工输入语音“查询明天的天气”,语音采集单元采集到该语音后,根据采集到的语音生成MP3(Moving Picture Experts Group Aud1 Layer III,动态影像专家压缩标准音频层面3)文件“未命名.MP3”,测试人员在语音识别测试装置或者包含有语音识别测试装置的设备中选择修改文件名后,输入文本“查询明天的天气”,语音识别测试装置接收到该文本后,将该MP3文件名修改为“查询明天的天气.MP3”并存储在本地。需要说明的是,本发明实施例提供的方法仅以MP3格式为例加以说明,实际应用中,语音识别测试装置还可以根据语音采集单元采集到的语音生成其它格式的音频文件,比如WMA (Windows Media Aud1,视窗操作系统媒体音频)文件,对此,本发明实施例不做具体限定。
[0040]步骤204,语音识别测试装置根据该语音样本文件向语音识别服务器发送语音识别请求;
[0041 ] 其中,该语音识别服务器可以是社交应用中的语音识别服务器,该语音识别请求用于指示语音识别系统中的语音识别服务器对该语音样本文件对应的语音进行识别。语音识别测试装置可以通过接口模拟拼装该语音识别请求并发送给语音识别服务器。
[0042]此外,语音识别测试装置存储的语音样本文件的格式与语音识别服务器能够识别的文件格式可能不一致,因此,语音识别测试装置在根据该语音样本文件向语音识别服务器发送语音识别请求时,若该语音样本文件的格式为指定格式,则向该语音识别服务器发送包含有该语音样本文件的该语音识别请求,若该语音样本文件的格式为非指定格式,则将该语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向该语音识别服务器发送包含有该新的语音样本文件的该语音识别请求。其中,该指定格式为语音识别服务器能够识别的文件的格式。
[0043]具体的,若语音识别服务器能够识别的文件的格式为speex格式,语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件之后,将该语音样本文件的格式转换为speex格式,获得新的语音样本文件,将该新的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
[0044]或者,语音识别测试装置在存储语音样本文件时,也可以直接将语音样本文件存储为speex格式。语音识别测试装置获取语音样本文件后,可以直接将获取到的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
[0045]步骤206,语音识别测试装置接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果;
[0046]语音识别测试装置可以获取预先与该语音样本文件对应存储的文本,检测该识别结果与该文本是否匹配,获得检测结果,并将该检测结果获取为该语音识别测试结果。
[0047]具体比如,语音识别测试装置获取本地存储的文件名为“查询明天的天气.MP3”的语音样本文件时,还可以提取出该文件名中去除后缀的文本“查询明天的天气”。语音识别测试装置接收语音识别服务器返回的识别结果后,提取识别结果中携带的文本,并将从识别结果中提取出的文本与“查询明天的天气”相比对,若两者一致,则确定本次测试结果为语音识别准确,若两者不一致,则确定本次测试结果为语音识别不准确。
[0048]步骤208,语音识别测试装置采集第一时间点和第二时间点,并将该第一时间点和该第二时间点之间的差值添加入该语音识别测试结果。
[0049]其中,该第一时间点为向该语音识别服务器发送该语音识别请求的时间点,该第二时间点为该语音识别服务器返回该识别结果的时间点。
[0050]进一步的,语音识别测试装置采集第一时间点和第二时间点时,可以获取该语音识别请求对应的数据包的包头以及该识别结果对应的数据包的包头,该语音识别请求对应的数据包的包头以及该识别结果对应的数据包的包头中分别携带有时间信息;语音识别测试装置根据该语音识别请求对应的数据包的包头中携带的时间信息获取该第一时间点,并根据该识别结果对应的数据包的包头中携带有时间信息获取该第二时间点。
[0051]本发明实施例提供的方法,除了可以用于测试语音识别系统的识别准确性之外,还可以测试语音识别系统的响应时间,该响应时间具体可以表征为语音识别测试装置发送语音识别请求与语音识别服务器返回识别结果之间的时间间隔。
[0052]具体的,语音识别测试装置可以获取语音识别请求对应的数据包的包头,该语音识别请求对应的数据包的包头中包含有语音识别请求的生成时间点,语音识别测试装置将该语音识别请求的生成时间点获取为第一时间点;语音识别测试装置还可以获取语音识别服务器返回的识别结果对应的数据包的包头,该识别结果对应的数据包的包头中包含有该识别结果的生成时间点,语音识别测试装置将该识别结果的生成时间点获取为第二时间点;语音识别测试装置将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
[0053]或者,语音识别测试装置也可以直接记录发送语音识别请求的时间点为第一时间点,并记录接收到识别结果的时间点为第二时间点,将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
[0054]以对某款社交应用软件“QX桌面”中的XX语音识别服务的识别准确性和响应时间进行测试为例,测试人员小王预先通过运行有“QX桌面”的智能手机上的麦克风输入三个待测试的语音样本,各个语音样本的内容各不相同,智能手机将采集到的语音样本以MP3格式存储在本地,同时,小王还在智能手机中将各个MP3文件命名为各自对应的语音内容。当进行语音识别测试时,小王在智能手机的测试界面中选择三个MP3文件中的一个或者多个,并发出开始测试的指令。智能手机从本地提取小王选择的MP3文件,将提取的MP3文件转换为speex文件后发送给XX语音识别服务对应的语音识别服务器,并接收该语音识别服务器返回的识别结果,同时,智能手机还记录向语音识别服务器发送该speex文件的第一时间点以及接收到语音识别服务器返回数据包的第二时间点。智能手机将接收到的识别结果与小王选择的MP3文件的文件名进行匹配,并输出匹配结果;同时,智能手机还将第一时间点和第二时间点之间的时间间隔输出为语音识别服务的响应时间。此外,小王还可以在测试界面中设置测试次数,智能手机根据该测试次数对、选择的MP3文件进行反复测试。
[0055]通过本发明实施例提供的方法,当需要对同一语音样本进行多次重复测试时,无需测试人员对相同的语音样本反复进行人工输入,只需要预先在本地存储一个语音样本文件,测试时重复提取同一语音样本文件进行测试,能够简化操作步骤、缩短测试周期并且降低人工成本。本发明实施例提供的方法还可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本。
[0056]另外,现有技术中的语音识别测试方法,当人工输入内容相同的语音样本时,可能会因为测试人员的语速以及口音的变化而导致两次输入的语音样本存在一定的差异,影响测试准确性。而本发明实施例提供的语音识别测试方法,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,不存在两次测试的语音样本不一致的情形,相对于现有技术能够提高测试的准确性。
[0057]综上所述,本发明实施例提供的语音识别测试方法,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的;此外,本发明实施例提供的语音识别测试方法,可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本;最后,本发明实施例提供的语音识别测试方法,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,解决了现有技术中两次测试的语音样本不一致的情形,达到提高测试的准确性的目的。
[0058]实施例三
[0059]请参见图3,其示出了本发明实施例三提供的语音识别测试装置的装置结构图。该语音识别测试装置可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。该语音识别测试装置可以包括:
[0060]文件获取模块301,用于获取本地预先存储的语音样本文件;
[0061]请求发送模块302,用于根据所述文件获取模块301获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
[0062]识别结果接收模块303,用于接收所述语音识别服务器返回的识别结果;
[0063]测试结果获得模块304,用于根据所述识别结果获得语音识别测试结果。
[0064]综上所述,本发明实施例提供的语音识别测试装置,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
[0065]实施例四
[0066]为了对上述实施例三提供的语音识别测试装置做进一步的描述,请参见图4,其示出了本发明实施例四提供的语音识别测试装置的装置结构图。该语音识别测试装置可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。以对一语音识别系统的响应时间和识别准确性进行检测为例,该语音识别测试装置可以包括:
[0067]文件获取模块401,用于获取本地预先存储的语音样本文件;
[0068]请求发送模块402,用于根据所述文件获取模块401获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
[0069]所述语音识别服务器可以为社交应用中的语音识别服务器。
[0070]其中,请求发送模块402可以通过接口模拟拼装该语音识别请求并发送给语音识别服务器。
[0071]识别结果接收模块403,用于接收所述语音识别服务器返回的识别结果;
[0072]测试结果获得模块404,用于根据所述识别结果获得语音识别测试结果。
[0073]此外,所述装置还包括:
[0074]语音采集模块405,用于在所述文件获取模块401获取预先存储的语音样本文件之前,通过语音采集单元采集输入的所述语音;
[0075]文件生成模块406,用于根据所述语音采集模块405采集到的所述语音生成所述语音样本文件;
[0076]文件存储模块407,用于本地存储所述文件生成模块406生成的所述语音样本文件。
[0077]在文件获取模块401获取语音样本文件之前,语音采集模块405首先通过语音采集单元采集输入的语音,文件生成模块406根据采集到的语音生成该语音样本文件,文件存储模块407本地存储生成的该语音样本文件。当语音识别测试装置需要对语音识别系统进行多次内容相同的测试时,文件获取模块401可以直接提取该语音样本文件进行测试,无需测试人员人工反复输入语音样本。
[0078]所述请求发送模块402,包括:
[0079]第一发送子模块402a,用于若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求;
[0080]格式转换子模块402b,用于若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件;
[0081]第二发送子模块402c,用于向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
[0082]语音识别测试装置存储的语音样本文件的格式与语音识别服务器能够识别的文件格式可能不一致,因此,请求发送模块402在根据该语音样本文件向语音识别服务器发送语音识别请求时,若该语音样本文件的格式为指定格式,则向该语音识别服务器发送包含有该语音样本文件的该语音识别请求,若该语音样本文件的格式为非指定格式,则将该语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向该语音识别服务器发送包含有该新的语音样本文件的该语音识别请求。其中,该指定格式为语音识别服务器能够识别的文件的格式。
[0083]具体的,若语音识别服务器能够识别的文件的格式为speex格式,语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件之后,将该语音样本文件的格式转换为speex格式,获得新的语音样本文件,将该新的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
[0084]或者,语音识别测试装置在存储语音样本文件时,也可以直接将语音样本文件存储为speex格式。语音识别测试装置获取语音样本文件后,可以直接将获取到的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
[0085]所述测试结果获得模块404,包括:
[0086]文本获取子模块404a,用于获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容;
[0087]检测子模块404b,用于检测所述识别结果与所述文本获取子模块获取到的文本是否匹配,获得检测结果;
[0088]测试结果获取子模块404c,用于将所述检测结果获取为所述语音识别测试结果。
[0089]所述装置还包括:
[0090]文本接收模块408,用于在所述文本获取子模块404a获取预先存储的语音样本文件之前,接收输入的所述文本;
[0091]文本存储模块409,用于将所述文本接收模块408接收到的所述文本与所述语音样本文件对应存储。
[0092]进一步的,文本接收模块408还可以接收输入的,用于表征该语音的内容的文本,文本存储模块409将接收到的该文本与该语音样本文件对应存储,以便后续根据该文本检测语音识别系统的识别准确性。
[0093]其中,将接收到的文本与语音样本文件对应存储时,可以将接收到的文本与语音样本文件分别进行存储,并建立两者之间的映射关系;或者,也可以将接收到的文本与语音样本文件一并存储,比如,将接收到的文本存储为语音样本文件的文件名。
[0094]具体的,以将接收到的文本存储为语音样本文件的文件名为例,测试人员向语音识别测试装置或者包含有语音识别测试装置的设备输入待测试的语音,比如,测试人员可以对着语音采集单元,比如麦克风,人工输入语音“查询明天的天气”,语音采集单元采集到该语音后,根据采集到的语音生成MP3文件“未命名.MP3”,测试人员在语音识别测试装置或者包含有语音识别测试装置的设备中选择修改文件名后,输入文本“查询明天的天气”,语音识别测试装置接收到该文本后,将该MP3文件名修改为“查询明天的天气.MP3”并存储在本地。需要说明的是,本发明实施例提供的方法仅以MP3格式为例加以说明,实际应用中,语音识别测试装置还可以根据语音采集单元采集到的语音生成其它格式的音频文件,比如WMA文件,对此,本发明实施例不做具体限定。
[0095]语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件时,还可以提取出该文件名中去除后缀的文本“查询明天的天气”。语音识别测试装置接收语音识别服务器返回的识别结果后,提取识别结果中携带的文本,并将从识别结果中提取出的文本与“查询明天的天气”相比对,若两者一致,则确定本次测试结果为语音识别准确,若两者不一致,则确定本次测试结果为语音识别不准确。
[0096]所述装置还包括:
[0097]时间点采集模块410,用于采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间点;
[0098]测试结果添加模块411,用于将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
[0099]所述时间点采集模块410,包括:
[0100]包头获取子模块410a,用于获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息;
[0101]第一获取子模块410b,用于根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间点;
[0102]第二获取子模块410c,用于根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
[0103]本发明实施例提供的装置,除了可以用于测试语音识别系统的识别准确性之外,还可以测试语音识别系统的响应时间,该响应时间具体可以表征为语音识别测试装置发送语音识别请求与语音识别服务器返回识别结果之间的时间间隔。
[0104]具体的,包头获取子模块410a可以获取语音识别请求对应的数据包的包头,该语音识别请求对应的数据包的包头中包含有语音识别请求的生成时间点,第一获取子模块410b将该语音识别请求的生成时间点获取为第一时间点;包头获取子模块410a还可以获取语音识别服务器返回的识别结果对应的数据包的包头,该识别结果对应的数据包的包头中包含有该识别结果的生成时间点,第二获取子模块410c将该识别结果的生成时间点获取为第二时间点;测试结果添加模块411将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
[0105]通过本发明实施例提供的装置,当需要对同一语音样本进行多次重复测试时,无需测试人员对相同的语音样本反复进行人工输入,只需要在本地预先存储一个语音样本文件,测试时重复提取同一语音样本文件进行测试,能够简化操作步骤、缩短测试周期并且降低人工成本。本发明实施例提供的装置还可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本。
[0106]另外,在现有技术中,当人工输入内容相同的语音样本时,可能会因为测试人员的语速以及口音的变化而导致两次输入的语音样本存在一定的差异,影响测试准确性。而本发明实施例提供的语音识别测试装置,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,不存在两次测试的语音样本不一致的情形,相对于现有技术能够提高测试的准确性。
[0107]综上所述,本发明实施例提供的语音识别测试装置,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的;此外,本发明实施例提供的语音识别测试装置,可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本;最后,本发明实施例提供的语音识别测试装置,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,解决了现有技术中两次测试的语音样本不一致的情形,达到提高测试的准确性的目的。
[0108]需要说明的是:上述实施例提供的语音识别测试装置在对语音识别系统进行测试时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音识别测试装置与语音识别测试方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0109]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0110]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0111]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种语音识别测试方法,其特征在于,所述方法包括: 获取本地预先存储的语音样本文件; 根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别; 接收所述语音识别服务器返回的识别结果; 根据所述识别结果获得语音识别测试结果。
2.根据权利要求1所述的方法,其特征在于,所述获取本地预先存储的语音样本文件之前,所述方法还包括: 通过语音采集单元采集输入的所述语音; 根据采集到的所述语音生成所述语音样本文件; 本地存储生成的所述语音样本文件。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述语音样本文件向语音识别服务器发送语音识别请求,包括: 若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求; 若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
4.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果获得语音识别测试结果,包括: 获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容; 检测所述识别结果与所述文本是否匹配,获得检测结果; 将所述检测结果获取为所述语音识别测试结果。
5.根据权利要求4所述的方法,其特征在于,所述获取预先存储的语音样本文件之前,所述方法还包括: 接收输入的所述文本; 将接收到的所述文本与所述语音样本文件对应存储。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括: 采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间占.将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
7.根据权利要求6所述的方法,其特征在于,所述采集第一时间点和第二时间点,包括: 获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息; 根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间占. 根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
8.根据权利要求1所述的方法,其特征在于,所述语音识别服务器为社交应用中的语音识别服务器。
9.一种语音识别测试装置,其特征在于,所述装置包括: 文件获取模块,用于获取本地预先存储的语音样本文件; 请求发送模块,用于根据所述文件获取模块获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别; 识别结果接收模块,用于接收所述语音识别服务器返回的识别结果; 测试结果获得模块,用于根据所述识别结果获得语音识别测试结果。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括: 语音采集模块,用于在所述文件获取模块获取预先存储的语音样本文件之前,通过语音采集单元采集输入的所述语音; 文件生成模块,用于根据所述语音采集模块采集到的所述语音生成所述语音样本文件; 文件存储模块,用于本地存储所述文件生成模块生成的所述语音样本文件。
11.根据权利要求9或10所述的装置,其特征在于,所述请求发送模块,包括: 第一发送子模块,用于若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求; 格式转换子模块,用于若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件; 第二发送子模块,用于向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
12.根据权利要求9所述的装置,其特征在于,所述测试结果获得模块,包括: 文本获取子模块,用于获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容; 检测子模块,用于检测所述识别结果与所述文本获取子模块获取到的文本是否匹配,获得检测结果; 测试结果获取子模块,用于将所述检测结果获取为所述语音识别测试结果。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括: 文本接收模块,用于在所述文本获取子模块获取预先存储的语音样本文件之前,接收输入的所述文本; 文本存储模块,用于将所述文本接收模块接收到的所述文本与所述语音样本文件对应存储。
14.根据权利要求9所述的装置,其特征在于,所述装置还包括: 时间点采集模块,用于采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间点; 测试结果添加模块,用于将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
15.根据权利要求14所述的装置,其特征在于,所述时间点采集模块,包括: 包头获取子模块,用于获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息; 第一获取子模块,用于根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间点; 第二获取子模块,用于根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
16.根据权利要求9所述的装置,其特征在于,所述语音识别服务器为社交应用中的语音识别服务器。
【文档编号】G10L15/01GK104517606SQ201310465675
【公开日】2015年4月15日 申请日期:2013年9月30日 优先权日:2013年9月30日
【发明者】陈玫, 吴景, 魏巍 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1