一种基于双边模糊集的三支决策疾病分类方法及装置

文档序号:30510634发布日期:2022-06-25 01:47阅读:163来源:国知局
一种基于双边模糊集的三支决策疾病分类方法及装置

1.本发明属于疾病的分类和诊断领域,具体涉及一种基于双边模糊集的三支决策疾病分类方法及装置。


背景技术:

2.随着医疗大数据时代的来临,利用计算机辅助医疗已经成为临床医学和科学研究的重要方面。针对如何根据病人的疾病信息使用计算机进行辅助诊断和治疗,提出了多种方法。其中,姚一豫教授提出了三支决策理论,这是一种符合人类实际认知能力的决策模型,是传统二支决策的拓展,将延迟决策作为信息不足以绝对接受或拒绝时的第三种决策行为。其核心思想是将一个统一集划分为三个互不相交的成对区域,并对每个区域制定相应的决策策略。在实际应用场景中,医疗诊断是较为严谨的,在不具备足够信息判断患者是否患病时,医生往往会建议患者进一步检查,故三支决策“三分而治”的思想相较于二支决策更符合医疗诊断的思维模式,即分类结果为患病、进一步检查、未患病。
3.模糊集是zadeh教授提出的一种有效的处理不确定和不精确问题的方法,它将数学的应用领域从精确现象领域扩大到了模糊现象领域。在医疗诊断中,患者描述个人信息及症状为“中年,男性,经常头痛,偶尔失眠”,其中除了“男性”是精确信息,其他信息均为模糊信息,如果要用计算机精确处理这些信息,那么就需要对这些模糊信息进行刻画,而模糊集则是一种可以刻画模糊信息的方法。
4.在实际医疗诊断中,针对某一疾病进行诊断时,医生除了能诊断出该患者是否患此病,还可以通过检查指标诊断出患者患其他类型疾病的可能性。然而,现有的二分类模型,均只能判断出患者是否患目标概念所代表的疾病,无法通过现有指标判断患者是否有可能患有其他疾病,与实际医疗场景的应用有偏差。因此,如何在二分类情况下,通过检查指标对患者进行除目标疾病外的诊断就成了一个具有价值的问题。


技术实现要素:

5.本发明提出了一种基于双边模糊集的三支决策疾病分类方法和装置。通过科学有效的方法对具有模糊性和不确定性的疾病信息进行分析和处理,尽可能保留疾病信息本身的语义信息含量,从而得到一个双向语义的三支决策的划分结果,并基于此划分结果为医生或患者提供科学有力的辅助诊断依据。
6.在第一方面,本发明提供了一种基于双边模糊集的三支决策疾病分类方法,包括:
7.s1.获取与诊断对象的疾病诊疗信息相关的数据集,对数据集进行预处理后形成一个近似空间;
8.s2.基于近似空间计算数据集的背离度,得到双边模糊集;
9.s3.根据得到的双边模糊集构建三支决策模型;
10.s4.基于置信区间理论构建目标优化函数,求解目标优化函数得到最优置信水平,根据最优置信水平计算三支决策模型中的决策阈值;
11.s5.使用s4步骤得到的决策阈值对步骤s2计算得到的背离度进行划分,得到待诊断对象的诊断结果及对应决策。
12.进一步的,近似空间为s且s=(u,r),u={x1,x2,

,x
10
}是待诊断对象的集合,r={r}是与疾病诊疗信息相关的数据集,a为u上的一个双边模糊集,ωa为u上的一个映射,映射ωa为a的背离函数,且该映射满足条件:
13.ωa:u

[-1,1];
[0014][0015]
其中,ωa(x)为x对a的背离程度,简称背离度。
[0016]
进一步的,计算背离度的背离函数表示为:
[0017][0018]
其中,r(xi)表示对象xi在属性r上的属性值,rm表示属性的正常值,ωa(xi)表示对象xi的属性值的背离度,r
max
表示最大属性值,r
min
表示最小属性值。
[0019]
进一步的,在三支决策模型中,设置β2、α2、α1和β1四个阈值,且阈值之间满足-1<β2<α2<0<α1<β1<1,通过四个阈值将待诊断对象的集合分为正区域、边界区域和负区域,分别表示为:
[0020]
pos(ωa)={x∈u|α2≤ωa(x)≤α1};
[0021]
bnd(ωa)={x∈u|β2<ωa(x)<α2∨α1<ωa(x)<β1};
[0022]
neg(ωa)={x∈u|ωa(x)≤β2∨ωa(x)≥β1};
[0023]
其中,pos(ωa)表示正区域,bnd(ωa)表示边界区域,neg(ωa)表示负区域。
[0024]
进一步的,阈值计算公式表示为:
[0025][0026][0027]
其中,表示背离度的平均值,σ表示背离度的标准差,n为待诊断对象的个数,z1、z2、z3和z4是根据所选择的置信水平设置的参数。
[0028]
进一步的,根据背离度将三支决策模型分为左区域和右区域两部分,将正区域、边界区域和负区域进一步划分为三支决策模型的左区域内的正区域、边界区域和负区域和右区域内的正区域、边界区域和负区域,分别表示为:
[0029]
pos
l
(ωa)={x∈u|α2≤ωa(x)<0};
[0030]
posr(ωa)={x∈u|0≤ωa(x)≤α1};
[0031]
bnd
l
(ωa)={x∈u|β2<ωa(x)<α2};
[0032]
bndr(ωa)={x∈u|α1<ωa(x)<β1};
[0033]
neg
l
(ωa)={x∈u|ωa(x)≤β2};
[0034]
negr(ωa)={x∈u|ωa(x)≥β1};
[0035]
其中,pos
l
(ωa)、bnd
l
(ωa)和neg
l
(ωa)分别表示左区域内的正区域、边界区域和负区域,posr(ωa)、bndr(ωa)和negr(ωa)分别表示右区域内的正区域、边界区域和负区域。
[0036]
进一步的,基于置信区间理论构建的左区域与右区域的目标优化函数,分别表示为:
[0037][0038][0039]
其中,和分别表示三支决策模型的左区域内的正区域、边界区域和负区域的对象方差,代表左区域的三个区域的对象均值之间的方差,和分别表示三支决策模型的右区域内的正区域、边界区域和负区域的对象方差,代表右区域的三个区域的对象均值之间的方差。
[0040]
在第二方面,基于第一方面提出一种基于双边模糊集的三支决策疾病分类装置,包括:
[0041]
待诊断数据收集模块,用于收集待诊断对象的疾病诊疗信息相关属性的数据集;
[0042]
预处理模块,用于对待诊断数据收集模块收集的数据进行预处理,得到该数据集的近似空间;
[0043]
背离度模块,用于根据预处理模块生成的近似空间计算该数据集的背离度,得到双边模糊集;
[0044]
模型初步构建模块,用于根据双边模糊集构建初始三支决策模型;
[0045]
目标函数构建模块,用于根据置信区间理论和初始三支决策模型构建优化目标函数,求解目标函数得到最优置信水平;
[0046]
阈值计算模块,用于根据最优置信水平计算初始三支决策模型中的阈值,得到最终的三支决策模型;
[0047]
分类模块,用于根据最终的三支决策模型对背离度模块计算的背离度进行划分,得到待诊断对象的诊断结果;
[0048]
决策模块,用于根据诊断结果输出对应决策办法。
[0049]
本发明的有益效果:
[0050]
本发明提出了一种基于双边模糊集的三支决策疾病分类方法及装置,与传统的基于模糊集的三支决策模型相比,传统方法对于二分类问题只能判断出被诊断对象是否患病,而无法通过现有指标判断被诊断对象是否有患有其他疾病的可能性,与实际医疗场景的应用有偏差;而本发明将模糊集拓展为双边模糊集,并基于双边模糊集构建三支决策模型,在二分类情况下,充分保留疾病信息所包含的语义,通过疾病信息得到除目标疾病外的相关诊断结果。
[0051]
本发明提出了最优化置信水平的阈值自动计算方法,现有的三支决策模型阈值的计算方法,其计算公式中的所需参数大都人为设置,具有较大的主观性,而本发明通过构建
最优化目标模型,从数据本身出发计算决策阈值,使得阈值计算更客观,也减少了人为对阈值计算的影响。
[0052]
本发明提出的三支决策模型辅助医务人员判断待诊断对象是否未患病,以及在此诊断指标下患病的不同可能性。
附图说明
[0053]
图1为本发明的基于双边模糊集的三支决策疾病分类流程图;
[0054]
图2为本发明一实施例的空腹血糖值的隶属度和背离度对比图;
[0055]
图3为本发明的基于双边模糊集的三支决策模型;
[0056]
图4为本发明一实施例的三支划分结果。
具体实施方式
[0057]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058]
本发明将传统的模糊集拓展为双边模糊集,提出一种基于双边模糊集的三支决策疾病分类方法及装置,以保留疾病信息本身的语义信息含量。
[0059]
在一实施例中,本发明提出的一种基于双边模糊集的三支决策疾病分类方法,如图1所示,包括:
[0060]
s1.获取与诊断对象的疾病诊疗信息相关的数据集,对数据集进行预处理后形成一个近似空间;
[0061]
具体地,在实际医疗诊断中,疾病类型众多,且医生进行疾病诊断通常从疾病本身的病因、待诊断对象的症状、以及检测指标等多角度多方面着手,以糖尿病为例,与其相关的诊断指标有:空腹血糖值、血压、bmi指数、糖尿病谱系功能等,每一个诊断指标为一种属性可以进行相关疾病的诊断,本实施例依托医疗数据平台,获取与疾病诊断信息相关的属性,形成数据集,并对数据集的数据进行预处理,形成一个近似空间。
[0062]
s2.基于近似空间计算数据集的背离度,得到双边模糊集;
[0063]
具体地,步骤s1形成的近似空间中包括与疾病诊疗信息相关的属性集,根据近似空间中疾病信息的属性,计算出不同疾病属性下对象的背离度,从而形成双边模糊集。
[0064]
s3.根据得到的双边模糊集构建三支决策模型;用于对待诊断对象进行三支决策划分;
[0065]
s4.基于置信区间理论构建目标优化函数,求解目标优化函数得到最优置信水平,根据最优置信水平计算三支决策模型中的决策阈值;
[0066]
s5.获取待诊断对象的数据的背离度,将其输入步骤s4得到的三支决策模型中,得到诊断结果及对应决策。
[0067]
在一实施例中,采用对糖尿病中的空腹血糖值对基于双边模糊集的三支决策疾病分类方法进行说明。设定近似空间为s且s=(u,r),u={x1,x2,

,x
10
}是待诊断对象的集合,r={r}是与疾病诊疗信息相关的数据集,本实施例中r为空腹血糖值,该数据集如表1所
示:
[0068]
表1空腹血糖值
[0069][0070]
根据空腹血糖值将待诊断对象分为正常和患病,并对其做出相应的决策建议。将每个对象的血糖值映射到传统模糊集的[0,1]隶属度范围,隶属度越接近1,则表明血糖值越正常;隶属度越接近0,则表明血糖值越不正常。在医学上,空腹血糖值的正常范围是[3.9,6.1]。因此,在本发明中,假设空腹血糖值的正常值为rm=5.2,表1的空腹血糖值通过线性隶属函数转化为相应的隶属度如表2所示:
[0071]
表2空腹血糖值转化为隶属度
[0072][0073]
由于空腹血糖值的正常范围在所有属性值的中间,当空腹血糖值的正常值的隶属度为1时,空腹血糖值高于或低于正常值的隶属度均接近0。在本实施例中,可以发现具有相同隶属度的两个对象的语义可能不同。
[0074]
具体地,对象x3和对象x4的隶属度均为0.4,但实际上x3的空腹血糖值低于正常值,而x4的空腹血糖值高于正常值。如果论域u被划分为三个区域,具有相同隶属度的对象被划分为同一区域,则血糖偏低的x3和血糖偏高的x4将被划分到同一区域,并提出相同的决策建议。然而,在现实生活中,医生对血糖偏高和偏低对象的决策应该是不同的,甚至是矛盾的。因此,本发明提出背离度和双边模糊集的概念来刻画属性值不同但隶属度相同的对象。
[0075]
具体地,根据近似空间s=(u,r),ωa为u上的一个映射,若该映射满足条件:
[0076]
ωa:u

[-1,1];
[0077][0078]
则a为u上的一个双边模糊集,其中,映射ωa为a的背离函数,ωa(x)为x对a的背离程度,简称背离度。当ωa(x)∈[-1,0)时,称其为左背离度ω
al
(x);当ωa(x)∈[0,1]时,称其为右背离度ω
ar
(x)。
[0079]
在一实施例中,提出线性背离函数的计算公式,给定一个近似空间s=(u,r),u={x1,x2,

,x
10
}是一个非空有限论域,r是一个属性集合,r是r上的唯一属性,a是u上的一个双边模糊集,计算背离度的背离函数表示为:
[0080][0081]
其中,r(xi)表示对象xi在属性r上的属性值,rm表示属性的正常值,ωa(xi)表示对象xi的属性值的背离度,表示最大属性值,表示最小属性
值。
[0082]
根据上述线性背离函数公式,计算表1空腹血糖值的背离度如表3所示:
[0083]
表3空腹血糖值转化为背离度
[0084][0085]
根据隶属度和背离度画图显示两者的差别,如图2所示,隶属度的范围在[0,1]之间,而背离度的范围扩展到了[-1,1],其优点在于可以通过左右背离度的正负来区分属性值大于或小于正常值的对象。具体地,对象x3的空腹血糖值低于正常值rm,x4的空腹血糖值高于正常值rm,但是两者的隶属度均为0.4。因此,当根据隶属度做出决策并实施相应策略时,对x3和x4的决策应该是相同的。但是在现实生活中,空腹血糖值高于或低于正常值的患者的疾病类型不同,不应该接受相同的治疗建议。相较之下,如果使用背离度来度量,x3的背离度为-0.6,x4的背离度为0.6,两者的背离度不同,可根据背离度对空腹血糖值偏高和偏低的对象进行区分,并进一步给出不同的决策意见和策略。
[0086]
在一实施例中,构建基于双边模糊集的三支决策模型,如图3所示,设置β2、α2、α1和β1四个阈值,且阈值之间满足-1<β2<α2<0<α1<β1<1,通过四个阈值将待诊断对象的集合分为正区域、边界区域和负区域,分别表示为:
[0087]
pos(ωa)={x∈u|α2≤ωa(x)≤α1};
[0088]
bnd(ωa)={x∈u|β2<ωa(x)<α2∨α1<ωa(x)<β1};
[0089]
neg(ωa)={x∈u|ωa(x)≤β2∨ωa(x)≥β1};
[0090]
其中,pos(ωa)表示正区域,bnd(ωa)表示边界区域,neg(ωa)表示负区域。
[0091]
由于存在空腹血糖值高于或低于正常值,但隶属度相同的情况,故本实施例根据背离度将三支决策模型分为右区域和左区域,并进一步细化三支决策模型的区域分布,将正区域、边界区域和负区域进一步划分为三支决策模型的左区域内的正区域、边界区域和负区域和右区域内的正区域、边界区域和负区域,分别表示为:
[0092]
pos
l
(ωa)={x∈u|α2≤ωa(x)<0};
[0093]
posr(ωa)={x∈u|0≤ωa(x)≤α1};
[0094]
bnd
l
(ωa)={x∈u|β2<ωa(x)<α2};
[0095]
bndr(ωa)={x∈u|α1<ωa(x)<β1};
[0096]
neg
l
(ωa)={x∈u|ωa(x)≤β2};
[0097]
negr(ωa)={x∈u|ωa(x)≥β1};
[0098]
其中,pos
l
(ωa)、bnd
l
(ωa)和neg
l
(ωa)分别表示左区域内的正区域、边界区域和负区域,posr(ωa)、bndr(ωa)和negr(ωa)分别表示右区域内的正区域、边界区域和负区域。
[0099]
具体地,阈值计算公式表示为:
[0100][0101]
[0102]
其中,表示背离度的平均值,σ表示背离度的标准差,n为待诊断对象的个数,z1、z2、z3和z4是根据所选择的置信水平设置的参数,可通过查询标准正态分布表获得。例如,最常用的置信水平为95%和99%,其相应的z值分别为1.96和2.58。
[0103]
在本实施例中并不直接指定置信水平,为了更客观、更符合对象自身的属性分布,提出一种新的基于置信区间的决策阈值计算方法,构造一个目标优化函数,使得各区域内更稳定,区域之间的差别更大,即使用方差度量待诊断对象之间的距离,使得区域内的距离更小,区域间的距离更远。以左区域为例,目标优化函数定义如下:
[0104][0105]
其中,和分别表示三支决策模型的左区域内的正区域、边界区域和负区域的对象方差,越小越好,意味着各区域越稳定;代表左区域的三个区域的对象均值之间的方差,越大越好,意味着区域间差异越大。右区域的目标优化函数与左区域同理。通过目标优化函数,可以得到最合适的置信水平,将置信水平对应的z1、z2、z3和z4带入阈值计算公式,便可以计算出三支划分的决策阈值。
[0106]
具体地,基于表3中各待诊断对象的背离度,使用梯度下降算法最优化上述提出的目标函数,得出z1=3.42、z2=0.74、z3=0.41、z4=3.43,将其代入阈值计算公式,得到:
[0107][0108][0109][0110][0111]
根据上述结果得到最终的三支划分结果,如图4所示,由于在本实施例中正区域代表血糖正常的对象,因此不区分正区域的左右,仅对边界区域和负区域进行了左右部分的详细划分。根据三支决策模型可以得到诊断对象的诊断结果,基于诊断结果可以给出不同的决策,具体地,x5、x6和x
10
的血糖正常,无需进行治疗;x1和x3相较于正常血糖值偏低,可建议食用含糖量较高的食物;x2、x4和x9相较于正常血糖值偏高,可建议在日常生活中控制摄入的葡萄糖量;x7是高血糖,后续治疗建议应为服用降血糖药物,使血糖趋于正常;而x8是低血糖,应建议其口服葡萄糖以补充大量葡萄糖,使血糖趋于正常。
[0112]
在本发明中,借助模糊集的概念,对模糊的疾病信息进行刻画,再使用三支决策的思想,对具有疾病信息的对象进行划分,从而得出患病、进一步检查和未患病的诊断结果。在此基础上,为了解决在二分类的三支决策中的其他疾病的诊断问题,将模糊集扩展为双边模糊集,在刻画疾病信息时,充分保留疾病信息的语义,使后续决策更严谨。
[0113]
本发明提供了一种基于双边模糊集的三支决策疾病分类装置,包括:
[0114]
待诊断数据收集模块,用于收集待诊断对象的疾病诊疗信息相关属性的数据集;
[0115]
预处理模块,用于对待诊断数据收集模块收集的数据进行预处理,得到该数据集
的近似空间;
[0116]
背离度模块,用于根据预处理模块生成的近似空间计算该数据集的背离度,得到双边模糊集;
[0117]
模型初步构建模块,用于根据双边模糊集构建初始三支决策模型;
[0118]
目标函数构建模块,用于根据置信区间理论和初始三支决策模型构建优化目标函数,求解目标函数得到最优置信水平;
[0119]
阈值计算模块,用于根据最优置信水平计算初始三支决策模型中的阈值,得到最终的三支决策模型;
[0120]
分类模块,用于根据最终的三支决策模型对背离度模块计算的背离度进行划分,得到待诊断对象的诊断结果;
[0121]
决策模块,用于根据诊断结果输出对应决策办法。
[0122]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1