本发明属于计算机技术领域,尤其涉及一种音频跟读评测方法及装置。
背景技术:
听和读在语言学习中很重要,特别在人们的英语学习中。通常情况下,人们在学习语言时是跟着听到的发音进行朗读,进而进行各种语言的学习,然而,很多情况下靠人们自己还是无法知道自身发音是否标准。因此,大多语言学习软件都会增加跟读测评的功能来告知用户跟读的发音是否标准。
目前进行用户的跟读评测的方法主要通过以下一系列步骤来实现:学习设备或机器先读一遍句子-->用户点击开始跟读-->开始录音-->用户跟读-->用户点击结束跟读-->语音评测。这些步骤对于用户来说较为繁琐,每次跟读一句就要点击“开始”和“结束”按钮。然而,当在较为嘈杂的环境下时用户还没开始跟读,学习设备的麦克风就已经开始录制了,而当用户已经跟读完毕时,麦克风可能还没关闭声音的录制,还在继续提交录制的声音数据,因此,杂音数据也会一并提交上去,从而会降低测评结果的准确性,同时延长测评的响应时间,降低了学习设备的用户体验。
技术实现要素:
本发明的目的在于提供一种音频跟读评测方法及装置,旨在解决由于现有技术无法提供一种有效的音频跟读评测方法,导致音频跟读评测结果准确性低、评测效率低下的问题。
一方面,本发明提供了一种音频跟读评测方法,所述方法包括下述步骤:
播放用户指定的音频学习文件;
当播放到所述音频学习文件中预设的声音录制标识时,采集预设范围内的声音;
当所述采集到的声音的分贝值超过第一阈值时,将所述采集到的声音与预先存储的用户声音进行匹配;
当所述采集到的声音与所述用户声音匹配时,对所述采集的声音进行录音;
当所述采集到的声音的分贝值低于第二阈值后,终止对所述采集的声音的录音;
根据所述录音得到的声音文件和所述播放的音频学习文件,对所述用户的跟读进行评测。
另一方面,本发明提供了一种音频跟读评测装置,所述装置包括:
文件播放单元,用于播放用户指定的音频学习文件;
声音采集单元,用于当播放到所述音频学习文件中预设的声音录制标识时,采集预设范围内的声音;
声音匹配单元,用于当所述采集到的声音的分贝值超过第一阈值时,将所述采集到的声音与预先存储的用户声音进行匹配;
录音单元,用于当所述采集到的声音与所述用户声音匹配时,对所述采集的声音进行录音;
录音终止单元,用于当所述采集到的声音的分贝值低于第二阈值后,终止对所述采集的声音的录音;以及
跟读评测单元,用于根据所述录音得到的声音文件和所述播放的音频学习文件,对所述用户的跟读进行评测。
在本发明实施例中,在对音频学习文件的用户跟读评测时,当播放到音频学习文件中预设的声音录制标识时,采集预设范围内的声音,当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配,当采集到的声音与用户声音匹配时,才对采集的声音进行录音,减少了无效录音和后续的无效评测,当采集到的声音的分贝值低于第二阈值后,及时终止对采集的声音的录音,最后根据录音得到的声音文件和播放的音频学习文件,完成对用户的跟读进行评测,从而提高音频跟读评测结果的准确性,这样用户可及时得到评测结果,提高了评测效率。
附图说明
图1是本发明实施例一提供的音频跟读评测方法的实现流程图;
图2是本发明实施例二提供的音频跟读评测方法的实现流程图;
图3是本发明实施例三提供的音频跟读评测装置的结构示意图;以及
图4是本发明实施例四提供的音频跟读评测装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的音频跟读评测方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,播放用户指定的音频学习文件。
本发明实施例适用于学习设备,作为示例地,学习设备可以为智能手机、平板电脑、学习机等智能便携式设备。其中,音频学习文件可以是任意的语言朗读、跟读训练音频文件,优选地,该音频学习文件为英语音频学习文件。
在步骤S102中,当播放到音频学习文件中预设的声音录制标识时,采集预设范围内的声音。
在本发明实施例中,音频学习文件中预先设置有声音录制标识,从而根据每次跟读的内容或语句对音频学习文件进行自动分段,从而得到精确分段的音频学习文件,实现了音频学习文件的自动播放和暂停。其中,声音录制标识可以是特定的标识符,也可以是音频学习文件制作时预设的无声时间间隙或静音时间间隙。
在步骤S103中,当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配。
在本发明实施例中,预先存储的用户声音是使用学习设备的用户声音。因此,优选地,应提前采集学习用户的声音,从采集的用户声音中提取用户声音特征信息(例如,用户音调、音色、音强等声音特征信息)并存储,以用于用户声音的匹配。在这里,第一阈值优选地是采集学习用户的声音时根据用户声音强度设置的,当然,第一阈值也可以是根据人声音的普通特征由学习设备进行预置。
在步骤S104中,当采集到的声音与用户声音匹配时,对采集的声音进行录音。
在本发明实施例中,在对采集到的声音进行声音匹配时,可采用模板匹配法、概率模型法以及人工神经网络等方式进行。在这里,只有当采集到的声音与用户声音匹配时,才对采集的声音进行录音,从而防止录制过多噪声和增加后续评测时系统或设备的工作量。
进一步优选地,当采集到的声音与用户声音匹配时,对采集的声音进行录音之前,输出即将进入声音录制的提示,以提示用户跟读已播放的音频文件或语句,以防止用户长时间等待,提高学习设备的智能化、人性化。具体地,可以通过语音或动画等方式进行提醒。
在步骤S105中,当采集到的声音的分贝值低于第二阈值后,终止对采集的声音的录音。
在本发明实施例中,当采集到的声音的分贝值低于第二阈值时,可认为用户已停止跟读,此时终止对采集的声音的录音,从而减少录制过多噪声,减少需存储录音文件,同时也可减少后续评测时系统或设备的工作量。优选地,可设置在一持续时间段内采集到的声音的分贝值都低于第二阈值时,才终止对采集的声音的录音,以提高声音录制的精确度。进一步优选地,持续时间段为一秒或两秒。
在步骤S106中,根据录音得到的声音文件和播放的音频学习文件,对用户的跟读进行评测。
在本发明实施例中,通过录音得到的声音文件和播放的音频学习文件的匹配或对比,对用户的跟读进行评测。具体地,可由学习设备在本地进行评测,当然,也可以将得到的声音文件发送到云端,通过云端服务器进行评测,以降低对学习设备的软、硬件要求。具体评测时,可通过将录音得到的声音文件与播放的音频段的声音特征进行匹配或对比,得到两者的相似度,进而得到最终的评测结果。
在本发明实施例中,在对音频学习文件的用户跟读评测时,当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配,当采集到的声音与用户声音匹配时,对采集的声音进行录音,减少了无效录音和后续的无效评测,当采集到的声音的分贝值低于第二阈值后,及时终止对采集的声音的录音,最后根据录音得到的声音文件和播放的音频学习文件,完成对用户的跟读进行评测,从而提高了音频跟读评测结果的准确性以及评测效率。
实施例二:
图2示出了本发明实施例二提供的音频跟读评测方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S201中,根据音频学习文件的播放规则,对音频学习文件进行分段,插入预设的声音录制标识。
本发明实施例适用于学习设备,作为示例地,学习设备可以为智能手机、平板电脑、学习机等智能便携式设备。
在本发明实施例中,为了实现音频学习文件的自动播放和暂停以进入用户跟读的声音录制,音频学习文件中预先设置有声音录制标识,从而根据音频学习文件的播放规则,例如,每次跟读的内容或语句的断句习惯,对音频学习文件进行自动分段,得到精确分段的音频学习文件。其中,声音录制标识可以是特定的标识符,也可以是预设的无声时间间隙或静音时间间隙或间隔。
在步骤S202中,播放用户指定的音频学习文件。
在步骤S203中,判断是否播放到音频学习文件中预设的声音录制标识,是则执行步骤S204,否则执行步骤S202。
在本发明实施例中,由学习设备通过检测是否播放到音频学习文件中预设的声音录制标识,是则执行步骤S204,否则执行步骤S202,以继续播放音频学习文件,从而无需用户手动点击音频学习文件,以停止或暂停音频文件的播放,提高了学习设备或系统的自动化和智能化程度。
在步骤S204中,当播放到音频学习文件中预设的声音录制标识时,采集预设范围内的声音。
在本发明实施例中,音频学习文件中预先设置有声音录制标识,从而根据每次跟读的内容或语句对音频学习文件进行自动分段,从而得到精确分段的音频学习文件,实现了音频学习文件的自动播放和暂停。
在步骤S205中,判断采集到的声音的分贝值是否超过第一阈值,是则执行步骤S206,否则执行步骤S204。
在本发明实施例中,判断采集到的声音的分贝值是否超过第一阈值,是则执行步骤S206,否则执行步骤S204,以继续检测学习设备周围的声音。
在步骤S206中,当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配。
在本发明实施例中,预先存储的用户声音是使用学习设备的用户声音。因此,优选地,应采集学习用户的声音,从采集的用户声音中提取声音特征信息(例如,用户音调、音色、音强等声音特征信息)并存储,以用于用户声音的匹配。在这里,第一阈值优选地是采集学习用户的声音时根据用户声音强度设置的,当然,第一阈值也可以是根据人声音的普通特征由学习设备预置。
在步骤S207中,判断采集到的声音是否与用户声音匹配,是则执行步骤S208,否则执行步骤S204。
在步骤S208中,当采集到的声音与用户声音匹配时,对采集的声音进行录音。
在本发明实施例中,在对采集到的声音进行声音匹配时,可采用模板匹配法、概率模型法以及人工神经网络等方式进行。在这里,只有当采集到的声音与用户声音匹配时,才对采集的声音进行录音,从而防止录制过多噪声和增加后续评测时系统或设备的工作量。
进一步优选地,当采集到的声音与用户声音匹配时,对采集的声音进行录音之前,输出即将进入声音录制的提示,以提示用户跟读已播放的音频文件或语句,以防止用户长时间等待,提高学习设备的智能化、人性化。
在步骤S209中,判断采集到的声音的分贝值是否低于第二阈值,是则执行步骤S210,否则执行步骤S208。
在步骤S210中,当采集到的声音的分贝值低于第二阈值后,终止对采集的声音的录音。
在步骤S211中,根据录音得到的声音文件和播放的音频学习文件,对用户的跟读进行评测。
在本发明实施例中,步骤S210和步骤S211可参考实施例一中S104和S105的描述,在此不再赘述。
在本发明实施例中,只有当采集到的声音与预先存储的用户声音进行匹配时,才对采集的声音进行录音,减少了无效录音和后续的无效评测,并在采集到的声音的分贝值低于第二阈值时及时终止对采集的声音的录音,从而实现了音频跟读录音的准确录制,提高了跟读评测的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例三:
图3示出了本发明实施例三提供的音频跟读评测装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
文件播放单元31,用于播放用户指定的音频学习文件;
声音采集单元32,用于当播放到音频学习文件中预设的声音录制标识时,采集预设范围内的声音;
声音匹配单元33,用于当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配;
录音单元34,用于当采集到的声音与所述用户声音匹配时,对采集的声音进行录音;
录音终止单元35,用于当采集到的声音的分贝值低于第二阈值后,终止对采集的声音的录音;以及
跟读评测单元36,用于根据录音得到的声音文件和播放的音频学习文件,对用户的跟读进行评测。
在本发明实施例中,音频跟读评测装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为学习设备的一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考实施例一中对应步骤的描述,在此不再赘述。
实施例四:
图4示出了本发明实施例四提供的音频跟读评测装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
标识插入单元41,用于根据音频学习文件的播放规则,对音频学习文件进行分段,插入预设的声音录制标识;
声音信息获取单元42,用于采集用户的声音,从采集的用户声音中提取声音特征信息并存储;
文件播放单元43,用于播放用户指定的音频学习文件;
录音提示单元44,用于输出即将进入声音录制的提示,以提示所述用户跟读已播放的音频文件。
声音采集单元45,用于当播放到音频学习文件中预设的声音录制标识时,采集预设范围内的声音;
声音匹配单元46,用于当采集到的声音的分贝值超过第一阈值时,将采集到的声音与预先存储的用户声音进行匹配;
录音单元47,用于当采集到的声音与所述用户声音匹配时,对采集的声音进行录音;
录音终止单元48,用于当采集到的声音的分贝值低于第二阈值后,终止对采集的声音的录音;以及
跟读评测单元49,用于根据录音得到的声音文件和播放的音频学习文件,对用户的跟读进行评测。
在本发明实施例中,音频跟读评测装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为学习设备的一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考实施例二中对应步骤的描述,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。