一种用于数据库信息查询的语音查询系统的制作方法

文档序号:35972884发布日期:2023-11-09 14:31阅读:96来源:国知局
一种用于数据库信息查询的语音查询系统的制作方法

本发明涉及数据库信息,具体为一种用于数据库信息查询的语音查询系统。


背景技术:

1、数据库信息查询指通过利用一些背景知识和技术手段来帮助用户更快地找到所需要的信息,语音查询则是通过利用语音信号控制查询系统从而获取信息,其中关于语音分析主要是基于声波符号的匹配识别与检测识别,匹配识别技术主要是通过将语音声波进行适当的处理成为特征数据流,然后与系统中已有的特征模型比对,最终输出检测识别结果。

2、现有技术中数据库的语音查询系统虽具备基本的语音查找信息功能,但是针对秘密级别较高的信息查询时,普通的语音查询系统无法对特定请求者的身份进行识别,需要结合设置密码,数据库信息容易泄露,并且输入的语音指令数据库只能根据反馈相应的语音转文字的文本内容,分析和理解整体语音内容的能力不足,反馈信息过于死板。


技术实现思路

1、针对现有技术的不足,本发明提供了一种用于数据库信息查询的语音查询系统,解决了现有技术中语音查询数据库信息的安全性以及数据库反馈信息过于死板的问题。

2、为实现以上目的,本发明通过以下技术方案予以实现:一种用于数据库信息查询的语音查询系统,包括安全认证系统、语音处理系统和数据库查询处理系统,所述安全认证系统用于对语音查询请求人的身份权限进行认证,保护数据库信息安全,所述语音处理系统用于对语音信号进行优化处理,所述数据库查询处理系统用于储存、匹配和反馈信息。

3、优选的,所述安全认证系统包括声纹识别模块和指纹识别模块,所述指纹识别模块用于激活语音查询系统,所述声纹识别模块用于提取请求者声纹特征从而识别请求者身份。

4、优选的,所述声纹识别模块采用最大似然估计方法来估计模型参数的高斯混合模型,假设每个说话人的声音特征符合一个高斯混合模型,其中第i个高斯分量的概率密度函数为:

5、

6、其中,x表示声音信号的特征向量,θi={wij,μij,∑ij}表示第i个高斯分量的参数,wij表示第i个高斯分量中的第j个权重,μij表示第i个高斯分量中的第j个均值向量,∑ij表示第i个高斯分量中的第j个协方差矩阵,mi表示第i个高斯分量中的混合数;

7、给定一组训练数据{x1,x2,...,xn},目标是通过最大化对数似然函数来估计所有高斯分量的参数:

8、

9、通过em算法求解出对数似然函数的最大值点,从而得到所有高斯分量的参数,再使用这些参数来进行声纹识别。

10、优选的,所述语音处理系统包括语音信号前端处理模块、语音识别模块和自然语言理解模块,所述语音信号前端处理模块用于对语音信号进行数字信号处理,所述语音识别模块用于请求者语音转换为计算机可处理的文本或命令,所述自然语言理解模块用于分析并理解转换后文本语言背后的真实含义和意图。

11、优选的,所述语音信号前端处理模块包括以下处理步骤:

12、s1.语音信号预处理:对采集到的语音信号进行预处理,去除背景噪声、消除回声;

13、s2.语音信号分帧:将语音信号划分为若干个时间段,每个时间段称为一帧,通常这些帧之间有一定的重叠部分,以保证时间上的连续性;

14、s3.预加重滤波:在分帧之后,对每一帧的语音信号应用预加重滤波器,以增强高频信号的相对贡献,减少低频信号的相对贡献;

15、s4.窗函数处理:对每一帧的语音信号应用窗函数,以限制每一帧之间的边界效应,同时减小谱泄露问题;

16、s5.傅里叶变换:对于经过窗函数处理的每一帧,应用傅里叶变换,将时域信号转换为频域信号;

17、s6.梅尔频率倒谱系数特征提取:对于每一帧的频域信号,对其进行梅尔滤波器组处理、取对数、然后再通过离散余弦变换得到梅尔频率倒谱系数,作为识别模型的输入特征。

18、6.优选的,所述自然语言理解模块基于深度循环神经网络模型的计算公式为:

19、输入层:将输入文本转换为向量表示

20、x_t=e(w_t)

21、其中w_t为第t个词汇,e为嵌入矩阵,用于将每个词汇映射到低纬空间向量x;

22、隐藏层:根据输入向量计算隐藏状态

23、h_t=f(wx_t+uh_{t-1})

24、其中,f为激活函数,w和u分别为输入权重矩阵和上一时刻状态权重矩阵;

25、输出层:根据当前时刻的隐藏状态,预测下一个词汇

26、y_t=g(vh_t)其中,g为输出激活函数,v为输出权重矩阵;

27、损失函数:衡量预测结果与真实结果之间的差距

28、l=-\sum_t\sum_i_y_{t,i}log(p_{t,i})

29、其中y_t为真实结果one-hot编码表示,p_t为预测结果对应的概率分布。

30、优选的,所述数据库查询处理系统包括信息接收模块、缓存管理模块和用户交互模块,所述信息接收模块用于接收并匹配查询信息,所述缓存管理模块用于将查询结果缓存在内存中,加快重复查询的速度,所述用户交互模块用于和用户之间信息交流对接。

31、优选的,所述用户交互模块设置有显示屏与扬声器,所述显示屏用于显示查询结果的文本信息、日志记录以及数据统计报表,所述扬声器用于相关查询信息的语音播报。

32、本发明提供了一种用于数据库信息查询的语音查询系统。具备以下有益效果:

33、1、本发明通过指纹识别与声纹识别相结合对请求者身份进行确认,提高数据库信息的安全性,并且通过使用多个高斯分布来描述语音信号中的特征分布,可以更准确地模拟真实语音信号的变化情况,即使在噪声环境下,gmm也能够保持较高的识别精度,鲁棒性好,同时通过增加高斯分量数量和调整各分量参数,可以根据不同声纹库和应用场景的需要灵活地调整模型复杂度和表达能力。

34、2、本发明通过自然语言理解模块通过深度循环神经网络建立模型,能够适用于不定长的序列数据,能够接受任意长度的输入序列,便于处理各种长度的文本数据并且能够捕捉到序列中的上下文关系和依赖性,能够更加智能快速地查找数据库相关信息,响应速度更快。



技术特征:

1.一种用于数据库信息查询的语音查询系统,包括安全认证系统、语音处理系统和数据库查询处理系统,其特征在于:所述安全认证系统用于对语音查询请求人的身份权限进行认证,保护数据库信息安全,所述语音处理系统用于对语音信号进行优化处理,所述数据库查询处理系统用于储存、匹配和反馈信息。

2.根据权利要求1所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述安全认证系统包括声纹识别模块和指纹识别模块,所述指纹识别模块用于激活语音查询系统,所述声纹识别模块用于提取请求者声纹特征从而识别请求者身份。

3.根据权利要求2所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述声纹识别模块采用最大似然估计方法来估计模型参数的高斯混合模型,假设每个说话人的声音特征符合一个高斯混合模型,其中第i个高斯分量的概率密度函数为:

4.根据权利要求1所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述语音处理系统包括语音信号前端处理模块、语音识别模块和自然语言理解模块,所述语音信号前端处理模块用于对语音信号进行数字信号处理,所述语音识别模块用于请求者语音转换为计算机可处理的文本或命令,所述自然语言理解模块用于分析并理解转换后文本语言背后的真实含义和意图。

5.根据权利要求4所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述语音信号前端处理模块包括以下处理步骤:

6.根据权利要求4所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述自然语言理解模块基于深度循环神经网络模型的计算公式为:

7.根据权利要求1所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述数据库查询处理系统包括信息接收模块、缓存管理模块和用户交互模块,所述信息接收模块用于接收并匹配查询信息,所述缓存管理模块用于将查询结果缓存在内存中,加快重复查询的速度,所述用户交互模块用于和用户之间信息交流对接。

8.根据权利要求1所述的一种用于数据库信息查询的语音查询系统,其特征在于:所述用户交互模块设置有显示屏与扬声器,所述显示屏用于显示查询结果的文本信息、日志记录以及数据统计报表,所述扬声器用于相关查询信息的语音播报。


技术总结
本发明提供一种用于数据库信息查询的语音查询系统,涉及数据库信息技术领域。该数据库信息查询的语音查询系统,包括安全认证系统、语音处理系统和数据库查询处理系统,所述安全认证系统用于对语音查询请求人的身份权限进行认证,保护数据库信息安全,所述语音处理系统用于对语音信号进行优化处理,所述数据库查询处理系统用于储存、匹配和反馈信息。通过自然语言理解模块通过深度循环神经网络建立模型,能够适用于不定长的序列数据,能够接受任意长度的输入序列,便于处理各种长度的文本数据并且能够捕捉到序列中的上下文关系和依赖性,能够更加智能快速地查找数据库相关信息,响应速度更快。

技术研发人员:杨博文,陈培镇
受保护的技术使用者:北京自然常数计算机系统有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1