本技术涉及智能语音管理领域,且更为具体的涉及一种病区医护对讲管理系统及其方法。
背景技术:
1、病区医护对讲管理系统是一种用于医疗机构病区内医护人员之间进行通讯和协作的系统。该系统的目的是提高病区内医护人员之间的沟通效率,加强工作协调,提升患者护理质量。医护人员可以通过系统进行实时语音通话或发送文字消息。他们可以直接呼叫特定的个人或组,或者在需要时广播消息给整个病区。然而,在医疗机构的病区环境中,可能存在各种环境音,如患者的呼吸声、设备的嘈杂声、人员的交谈声等。这些环境音可能对医护人员之间的通讯造成一定的干扰和困扰。
2、因此,期待一种优化的病区医护对讲管理方案。
技术实现思路
1、为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种病区医护对讲管理系统及其方法,其使用基于深度神经网络模型的人工智能技术来智能地对医护人员之间的语音信号进行特征编码与提取,以此来更为精准的解码语音信号。这样,构建病区医护对讲管理方案,来获取医护人员之间的语音信号,提高了在病区环境的下的通讯质量和用户体验,使医护人员能够更好地进行沟通和协作。
2、根据本技术的一个方面,提供了一种病区医护对讲管理系统,其包括:
3、信号采集模块,用于获取对讲机的第一音频接收器的第一声音信号和第二音频接收器的第二声音信号;
4、第一时频图转换模块,用于计算所述第一声音信号的第一时域增强图、第一sift变换时频图和第一s变换时频图;
5、第一通道聚合模块,用于将所述第一时域增强图、所述第一sift变换时频图和所述第一s变换时频图沿通道维度进行聚合以得到第一多通道时频图;
6、第一时频特征提取模块,用于将所述第一多通道时频图通过作为特征提取器的第一卷积神经网络模型以得到第一声音特征矩阵;
7、第二时频图转换模块,用于计算所述第二声音信号的第二时域增强图、第二sift变换时频图和第二s变换时频图;
8、第二通道聚合模块,用于将所述第二时域增强图、所述第二sift变换时频图和所述第二s变换时频图沿通道维度进行聚合以得到第二多通道时频图;
9、第二时频特征提取模块,用于将所述第二多通道时频图通过作为特征提取器的第二卷积神经网络模型以得到第二声音特征矩阵;
10、融合模块,用于融合所述第一声音特征矩阵和所述第二声音特征矩阵以得到解码特征矩阵;
11、优化模块,用于对所述解码特征矩阵进行基于局部特征分布的密度域概率化以得到优化解码特征矩阵;
12、结果生成模块,用于将所述优化解码特征矩阵通过生成器以得到解码语音信号。
13、在上述的病区医护对讲管理系统中,所述第一时频特征提取模块,用于:
14、使用所述作为特征提取器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行以下操作:
15、对输入数据进行卷积处理以得到卷积特征图;
16、对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图;
17、对所述池化特征图进行非线性激活以得到激活特征图;
18、其中,所述作为特征提取器的第一卷积神经网络模型的最后一层的输出为所述第一声音特征矩阵,所述作为特征提取器的第一卷积神经网络的第一层的输入为所述第一多通道时频图。
19、在上述的病区医护对讲管理系统中,所述第二时频特征提取模块,用于:
20、使用所述作为特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行以下操作:
21、对输入数据进行卷积处理以得到卷积特征图;
22、对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图;
23、对所述池化特征图进行非线性激活以得到激活特征图;
24、其中,所述作为特征提取器的第二卷积神经网络模型的最后一层的输出为所述第二声音特征矩阵,所述作为特征提取器的第二卷积神经网络的第一层的输入为所述第二多通道时频图。
25、在上述的病区医护对讲管理系统中,所述融合模块,用于:
26、以如下融合公式来融合所述第一声音特征矩阵和所述第二声音特征矩阵以得到解码特征矩阵,
27、其中,所述融合公式为:
28、;
29、其中,为所述解码特征矩阵,为所述第一声音特征矩阵,为所述第二声音特征矩阵,“”表示所述第一声音特征矩阵和所述第二声音特征矩阵相对应位置处的元素相加,为用于控制所述第一声音特征矩阵和所述第二声音特征矩阵之间的平衡的加权参数。
30、在上述的病区医护对讲管理系统中,所述优化模块,包括:
31、块状切分单元,用于对所述解码特征矩阵进行块状切分以得到多个解码子块特征矩阵;
32、均值池化单元,用于对所述多个解码子块特征矩阵分别进行均值池化以得到多个解码子块全局语义特征向量;
33、按位均值单元,用于计算所述多个解码子块全局语义特征向量的全局按位置均值向量以得到解码全局语义枢轴特征向量;
34、相对密度单元,用于计算所述多个解码子块全局语义特征向量中各个解码子块全局语义特征向量与所述解码全局语义枢轴特征向量之间的交叉熵以得到由多个交叉熵值组成的局部特征分布相对密度语义特征向量;
35、激活单元,用于将所述局部特征分布相对密度语义特征向量输入softmax激活函数以得到局部特征分布相对密度概率化特征向量;
36、加权单元,用于以所述局部特征分布相对密度概率化特征向量中各个位置的特征值对所述各个解码子块特征矩阵进行加权以得到多个加权后解码子块特征矩阵;
37、拼接单元,用于将所述多个加权后解码子块特征矩阵进行拼接以得到所述优化解码特征矩阵。
38、根据本技术的另一方面,还提供了一种病区医护对讲管理方法,其包括:
39、获取对讲机的第一音频接收器的第一声音信号和第二音频接收器的第二声音信号;
40、计算所述第一声音信号的第一时域增强图、第一sift变换时频图和第一s变换时频图;
41、将所述第一时域增强图、所述第一sift变换时频图和所述第一s变换时频图沿通道维度进行聚合以得到第一多通道时频图;
42、将所述第一多通道时频图通过作为特征提取器的第一卷积神经网络模型以得到第一声音特征矩阵;
43、计算所述第二声音信号的第二时域增强图、第二sift变换时频图和第二s变换时频图;
44、将所述第二时域增强图、所述第二sift变换时频图和所述第二s变换时频图沿通道维度进行聚合以得到第二多通道时频图;
45、将所述第二多通道时频图通过作为特征提取器的第二卷积神经网络模型以得到第二声音特征矩阵;
46、融合所述第一声音特征矩阵和所述第二声音特征矩阵以得到解码特征矩阵;
47、对所述解码特征矩阵进行基于局部特征分布的密度域概率化以得到优化解码特征矩阵;
48、将所述优化解码特征矩阵通过生成器以得到解码语音信号。
49、与现有技术相比,本技术提供的病区医护对讲管理系统及其方法,其使用基于深度神经网络模型的人工智能技术来智能地对医护人员之间的语音信号进行特征编码与提取,以此来更为精准的解码语音信号。这样,构建病区医护对讲管理方案,来获取医护人员之间的语音信号,提高了在病区环境的下的通讯质量和用户体验,使医护人员能够更好地进行沟通和协作。