一种基于图注意网络的中医证型识别方法

文档序号:27252840发布日期:2021-11-03 21:57阅读:112来源:国知局
一种基于图注意网络的中医证型识别方法

1.本发明涉及中医证型识别系统领域,一种基于图注意网络的中医证型识别方法。


背景技术:

2.中医药有超过3000年的历史,为中华人民的医疗健康提供了重要保障。中医诊疗可以划分为3个过程:辨证、立法和组方,其中辨证是医生根据四诊信息综合判断患者目前的状态,得到证型的过程,是决定整个中医诊疗的关键步骤。传统的中医辨证识别方法首先提前预设好每个症状对于每个证型的决定权重,然后计算各个证型的得分,取较高分数的证型作为系统的输出。例如早期的帕金森病中医证型识别系统,其中的证型识别模块通过临床症状来识别早期帕金森病患者的中医证型,该方法将获得的症状对应赋值分别代入四个中医辨证分型判别函数中计算以得到四个对应得分,得分最高对应的中医辨证分型识别为早期帕金森病患者的目标中医辨证分型,但是该方法所得结果准确度不高。


技术实现要素:

3.针对现有技术中的上述不足,本发明提供的一种基于图注意网络的中医证型识别方法解决了传统方法证型识别结果精确度不高的问题。
4.为了达到上述发明目的,本发明采用的技术方案为:
5.提供一种基于图注意网络的中医证型识别方法,其包括以下步骤:
6.s1、将多个医案数据进行标准化,并构建训练集,用属于训练集的医案数据建立用于模型训练的语料库数据;
7.s2、将语料库中的所有不重复的症状建立成一个症状集合,将语料库中的所有不重复的证型建立成一个证型集合,并完成初始化;
8.s3、将属于训练集的每个医案数据中的症状各自两两相连作为节点,计算症状集合中两个症状间的点互信息,并利用图注意网络对节点进行信息更新;
9.s4、结合点互信息,利用注意力机制加权更新后的节点,得到症状的特征向量;
10.s5、将特征向量输入一个线性层进行证型分类,得到每个证型的概率;其中概率最高的证型即为证型识别结果;
11.s6、结合每个证型的概率与训练集中真实的情况,计算损失函数;
12.s7、根据损失函数进行反向传播,完成模型迭代;
13.s8、将待识别的症状信息输入训练后的模型得到证型识别结果。
14.进一步地,步骤s2初始化时,每个症状随机初始化为100维向量,训练批处理大小设置为32,学习率设置为0.001,迭代轮次设置为20。
15.进一步地,步骤s3的具体方法为:
16.根据公式:
17.[0018][0019]
score
j
=cos(h
j
,h
i
)
[0020][0021]
获取更新后的节点信息h

i
;其中h

i
为更新后的节点信息,即更新后的症状s
i
的特征向量,h
i
为更新前的节点信息,即更新前的症状s
i
的特征向量,h
j
为症状s
i
的相邻症状s
j
的特征向量,α为权重调节系数,|n
i
|为症状s
i
的相邻症状集合n
i
的大小,β
j
为症状s
i
与相邻症状s
j
的相似度,e为自然对数,score
j
为症状s
i
与相邻症状s
j
的余弦分数,cos(
·
)为余弦函数,为症状s
i
和症状s
j
的点互信息,p(s
i
,s
j
)为症状s
i
和症状s
j
出现在同一个医案数据中的概率,p(s
i
)为症状s
i
出现的概率,p(s
j
)为症状s
j
出现的概率,log[
·
]为对数函数,|
·
|为取模。
[0022]
进一步地,步骤s4的具体方法为:
[0023]
根据公式:
[0024][0025][0026][0027]
获取症状的特征向量h;其中γ
i
为经过softmax归一化的症状s
i
的权重,|x|为一个医案数据中症状的个数,attention
i
为中间参数,为节点特征向量h

i
的加权参数,且在训练开始时获得随机初始化,*为点积。
[0028]
进一步地,步骤s6的具体方法为:
[0029]
根据公式:
[0030][0031]
获取损失函数l;c
i
为线性层的输出,即第i个证型的概率,y
i
为输出的概率与真实情况的比较结果,若输出的概率与真实情况相等则y
i
=1,否则y
i
=0,|t|为输出证型的类别数,log为对数函数。
[0032]
本发明的有益效果为:在大规模语料库上进行训练,利用图注意网络的节点信息更新过程融合了症状间的点互信息,能够更好地建立症状间的联系,更好地表示症状特征;在图信息导出时,利用注意力机制对各个症状节点信息分配权重,能够有效提升证型识别结果的准确度。
附图说明
[0033]
图1为本发明的流程图。
具体实施方式
[0034]
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0035]
如图1所示,该基于图注意网络的中医证型识别方法包括以下步骤:
[0036]
s1、将多个医案数据进行标准化,并构建训练集,用属于训练集的医案数据建立用于模型训练的语料库数据;
[0037]
s2、将语料库中的所有不重复的症状建立成一个症状集合,将语料库中的所有不重复的证型建立成一个证型集合,并完成初始化;
[0038]
s3、将属于训练集的每个医案数据中的症状各自两两相连作为节点,计算症状集合中两个症状间的点互信息,并利用图注意网络对节点进行信息更新;
[0039]
s4、结合点互信息,利用注意力机制加权更新后的节点,得到症状的特征向量;
[0040]
s5、将特征向量输入一个线性层进行证型分类,得到每个证型的概率;其中概率最高的证型即为证型识别结果;
[0041]
s6、结合每个证型的概率与训练集中真实的情况,计算损失函数;
[0042]
s7、根据损失函数进行反向传播,完成模型迭代;
[0043]
s8、将待识别的症状信息输入训练后的模型得到证型识别结果。
[0044]
步骤s2初始化时,每个症状随机初始化为100维向量,训练批处理大小设置为32,学习率设置为0.001,迭代轮次设置为20。
[0045]
步骤s3的具体方法为:
[0046]
根据公式:
[0047][0048][0049]
score
j
=cos(h
j
,h
i
)
[0050][0051]
获取更新后的节点信息h

i
;其中h

i
为更新后的节点信息,即更新后的症状s
i
的特征向量,h
i
为更新前的节点信息,即更新前的症状s
i
的特征向量,h
j
为症状s
i
的相邻症状s
j
的特征向量,α为权重调节系数,|n
i
|为症状s
i
的相邻症状集合n
i
的大小,β
j
为症状s
i
与相邻症状s
j
的相似度,e为自然对数,score
j
为症状s
i
与相邻症状s
j
的余弦分数,cos(
·
)为余弦函
数,为症状s
i
和症状s
j
的点互信息,p(s
i
,s
j
)为症状s
i
和症状s
j
出现在同一个医案数据中的概率,p(s
i
)为症状s
i
出现的概率,p(s
j
)为症状s
j
出现的概率,log[
·
]为对数函数,|
·
|为取模。
[0052]
步骤s4的具体方法为:
[0053]
根据公式:
[0054][0055][0056][0057]
获取症状的特征向量h;其中γ
i
为经过softmax归一化的症状s
i
的权重,|x|为一个医案数据中症状的个数,attention
i
为中间参数,为节点特征向量h

i
的加权参数,且在训练开始时获得随机初始化,*为点积。
[0058]
步骤s6的具体方法为:
[0059]
根据公式:
[0060][0061]
获取损失函数l;c
i
为线性层的输出,即第i个证型的概率,y
i
为输出的概率与真实情况的比较结果,若输出的概率与真实情况相等则y
i
=1,否则y
i
=0,|t|为输出证型的类别数,log为对数函数。
[0062]
训练集中的每个医案数据的症状都可表示为向量,该向量来自于症状嵌入矩阵,训练开始时,该矩阵进行一次随机初始化,并利用多个医案数据构建训练集和测试集,训练结束后,利用测试集对训练结果进行测试,以检测训练结果是否准确。
[0063]
本发明在大规模语料库上进行训练,利用图注意网络的节点信息更新过程融合了症状间的点互信息,能够更好地建立症状间的联系,更好地表示症状特征;在图信息导出时,利用注意力机制对各个症状节点信息分配权重,能够有效提升证型识别结果的准确度。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1