技术特征:
技术总结
本发明公开了一种语音采集方法、装置、计算机设备及存储介质,所述方法包括:在接收到用户通过通讯应用平台的应用账号发送的语料获取请求时,选取对应的初始语料,并获取用户的身份标识信息,在接收到开始录音的请求后,调用通讯应用平台的应用账号的录音功能进行录音,得到录音文件,并调用通讯应用平台的应用账号的离线语音识别功能,将该录音文件转化为目标文本,使用文本匹配算法,将该目标文本与初始语料进行匹配,得到文本相似度,若该文本相似度大于或等于预设的相似度阈值,则将录音文件、身份标识信息和它们之间的映射关系存入到数据库,从而实现了使用通讯应用平台的应用账号对语音数据进行快速采集,提高了语音数据的采集效率。
技术研发人员:黄锦伦
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2018.05.31
技术公布日:2018.11.16