1.本发明涉及医疗保健信息学技术领域,即专门用于处置或处理医疗或健康数据的信息技术领域,特别是涉及基于属性导出模糊对象语言概念格的疾病诊断预测系统。
背景技术:2.本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
3.随着半个多世纪的发展,人工智能已经慢慢地融入到了我们生活的方方面面,并且正在改变着我们的生活。作为人工智能所涉及的最早的一个领域——医疗领域,更是在过去几年中有了“质”的飞跃。早在几十年前就已经有人将人工智能与医疗诊断相结合,帮助医生做出诊断。世界上第一个计算机临床决策支持系统在1972年由提姆
·
德-多姆巴尔和苏珊
·
克莱普于英国研制成功。那时候因为计算机软硬件的条件受到限制,人工智能与医疗诊断的技术结合无法得到普及。在过去几十年,医学的发展离不开人工智能的贡献。采用人工智能中的知识推理技术和知识表示技术,用来模拟医学专家对患者的医疗诊断和病情观察,以及治疗等思维过程。它可以通过“学习”医疗专家的临床经验、病理理论等专业医学知识,辅助医生在更短的时间内做出准确率更高的医疗诊断,甚至可以帮助医生解决复杂的医学问题。因此,人工智能的应用既提升人们生活质量的同时,也带动着社会的快速发展。
4.随着网络时代的发展,各种信息数量呈现爆发式增长,面对复杂而庞大的数据信息,如何有效合理的进行处理是人们急需解决的问题。形式概念分析(formal concept analysis, fca)是 wille 于 1982 年提出的一种基于形式背景构造概念格的方法。在对象集与属性集间通过一对伽罗瓦连接获得形式概念,概念之间的泛化和特化关系可视为一种偏序关系,所有概念的集合构成一个完备格,称为概念格。经典形式背景中,我们使用 0 或者 1 作为对象与属性的二元关系值,来表示对象是否具有某种属性。与这种十分明确的表示方法不同的是,我们生活中大多数的信息是具有模糊性的。尤其是自然语言作为人类现实生活中常用的评估表达方式,能够更直接的表示决策中具有不确定性信息的特点。zadeh提出了模糊集和语言变量,作为一种处理模糊信息的理论工具,被广泛地应用于不确定性推理、评价、决策等领域中。在决策分析中,具有语言值的格能够更准确的帮助人们分析对象是否具有该属性,避免了数值难以刻画造成误判的情况。例如:在问诊时,通常用“很少咳嗽”、“很少流鼻涕”、“偶尔流鼻涕”这样的语言描述症状。因此我们研究在运用语言术语集的模糊对象语言决策形式背景上进行知识表示和知识获取,具有重要的研究意义。
5.在二支决策模型中,往往只考虑接受与拒绝两种选择,但在日常生活中并非如此。yao在传统二支决策模型的基础上,进一步扩展出更加符合人类普遍认知的三支决策模型,增加了第三种选择:不承诺。通过某种标准划分给定的集合成为三个不相交的子集——正域、负域和边界域,并且从这三个域中得到接受规则、拒绝规则和不承诺规则。qi等在形式概念分析理论中引入三支决策,提出了三支概念分析理论并且给出了三支概念格的构造方法。在获取规则时,基于属性导出的三支概念格下的规则包含决策背景的所有规则,并且对
于决策背景的某些规则,可以用更少的条件获得同样的决策结果。近些年,许多国内外学者开始关注这一新的理论,同时广泛应用于计算机科学、图像识别、金融风险分析、社会科学等诸多领域。
6.现有医疗诊断所采用的方式主要包括:对话式询问患者症状、医学影像检查等。现有医疗诊断所采用的主要方式,存在的技术缺陷是:在患者描述症状及症状的轻重程度时,通常是使用自然语言来描述,而计算机不能直接对模糊语言进行处理。
技术实现要素:7.为了解决现有技术的不足,本发明提供了基于属性导出模糊对象语言概念格的疾病诊断预测系统;基于属性导出模糊对象语言概念格的疾病诊断预测系统,包括:数据采集模块,其被配置为:获取已知疾病诊断结果的患者的症状语言表述;通过模糊对象语言形式背景,确定属性导出模糊对象语言概念集合;规则提取模块,其被配置为:从属性导出模糊对象语言概念集合中,提取属性导出模糊对象语言三支决策规则,进而得到属性导出模糊对象语言三支决策规则集合;疾病诊断模块,其被配置为:获取待预测患者的症状语言表述,根据属性导出模糊对象语言三支决策规则集合,确定待预测患者的疾病诊断结果。
8.与现有技术相比,本发明的有益效果是:本发明将三支概念分析理论运用到具有模糊对象语言概念的形式背景中,给出属性导出模糊对象语言三支概念,生成属性导出模糊对象语言三支概念格,提出属性导出模糊对象语言三支概念格上的语言决策规则,构造属性导出模糊对象语言概念格的决策形式背景上的规则提取算法,解决了属性导出模糊对象语言三支概念格上的决策问题。该方法通过判断条件属性是描述病人症状的语言值和决策属性是可能患得疾病的语言值,这两种属性导出模糊对象语言概念三支格间的细于关系,提取决策规则,进而诊断最具可能性的疾病类型。本发明能够有效地处理决策分析中的语言信息问题,提供智能化的医疗诊断结果。
附图说明
9.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
10.图1为本发明实施例一的系统功能模块图。
具体实施方式
11.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
12.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设
备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
13.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
14.本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
15.现有技术中,经常使用自然语言描述患病的表现症状来判断出可能会患有的疾病,为了实现智能化医疗诊断,我们将描述病人表现症状的语言值作为条件属性,并且将可能患得疾病的语言值作为决策属性,进一步构造出这两种属性分别导出的模糊对象语言三支概念格,通过判断两种概念格之间的细于关系,提取出决策规则,构建智能化的医疗诊断系统。
16.实施例一本实施例提供了基于属性导出模糊对象语言概念格的疾病诊断预测系统;如图1所示,基于属性导出模糊对象语言概念格的疾病诊断预测系统,包括:数据采集模块,其被配置为:获取已知疾病诊断结果的患者的症状语言表述;通过模糊对象语言形式背景,确定属性导出模糊对象语言概念集合;规则提取模块,其被配置为:从属性导出模糊对象语言概念集合中,提取属性导出模糊对象语言三支决策规则,进而得到属性导出模糊对象语言三支决策规则集合;疾病诊断模块,其被配置为:获取待预测患者的症状语言表述,根据属性导出模糊对象语言三支决策规则集合,确定待预测患者的疾病诊断结果。
17.进一步地,所述获取已知疾病诊断结果的患者的症状语言表述;具体包括:使用爬虫工具获取相关的数据集,并存入在形式背景中;其中,为非空有限对象患者数据集,表示第个患者,收集的属性集记为,为非空有限语言概念集,表示患者用语言表述的症状集合;,为对象与语言概念间的信任度水平,为到的模糊二元关系,即。
18.进一步地,所述通过模糊对象语言形式背景,确定属性导出模糊对象语言概念集合;具体包括:(11):设为模糊对象语言形式背景,给定一个信任度水平的阈值,对于,,定义一对模糊对象语言负算子;设为模糊对象语言形式背景,,,定义一对模糊对
象语言形式背景的三支算子;(12):设模糊对象语言决策形式背景、模糊对象语言形式背景和,有同一个论域;(13):根据(11)和(12)分别生成条件属性导出模糊对象语言三支概念格和决策属性导出模糊对象语言三支概念格。
19.进一步地,所述设为模糊对象语言形式背景,给定一个信任度水平的阈值,对于,,定义一对模糊对象语言负算子;具体包括:;;其中,表示中所有对象不能满足阈值的信任度水平的语言概念组成的集合,表示中所有不满足阈值的信任度水平的语言概念来描述的对象。
20.进一步地,所述设为模糊对象语言形式背景,,,定义一对模糊对象语言形式背景的三支算子;具体包括:,。
21.若且,则称为属性导出模糊对象语言概念,简称模糊对象语言属性导出概念,为模糊对象语言属性导出概念的外延,为模糊对象语言属性导出概念的内涵。
22.进一步地,设模糊对象语言决策形式背景、模糊对象语言形式背景和,有同一个论域;其中,为条件属性语言概念集,为决策属性语言概念集,为可能患有的疾病集合,表示对象对决策属性的信任度水平用语言概念来描述。
23.其中,是患者的总体,是患者的表现症状,是患者表现出某一症状的数值表示,是为0-1 的数值;表示症状程度低于某一阈值的症状的集合;表示症状程度低于某一阈值的患者集合;表示可能患有的疾病,是患者患有某种疾病的数值表示。
24.进一步地,所述从属性导出模糊对象语言概念集合中,提取属性导出模糊对象语言三支决策规则,进而得到属性导出模糊对象语言三支决策规则集合;具体包括:
(21):判断决策形式背景的协调性及概念格间的细于关系;(22):在属性导出三支协调的模糊对象语言决策形式背景中,若,有,,且,则称是一个属性导出的模糊对象语言三支决策规则,记为。表示所有属性导出的模糊对象语言三支决策规则集合。
25.进一步地,所述判断决策形式背景的协调性及概念格间的细于关系,具体包括:若,,使得,,则称细于,记作:,此时的模糊对象语言决策形式背景是属性导出三支协调的(记为属性导出协调)。
26.为患者集合的子集,为表现症状集合的子集,表示可能患有疾病集合的子集。
27.进一步地,所述系统的规则提取模块与疾病诊断模块之间,还设有规则清洗模块;所述规则清洗模块,其被配置为:对所获取的规则,剔除冗余规则,得到清洗后的规则。
28.进一步地,所述对所获取的规则,剔除冗余规则,得到清洗后的规则;具体包括:在得到的规则集中,与是两个属性导出的模糊对象语言决策规则,若,便称规则蕴含规则,并将视为冗余规则,剔除冗余规则,得到非冗余规则集。
29.,,使得,。,所以是ae-协调的。
30.若,有,,,则称是一个属性导出的模糊对象语言三支决策规则,记为if a, then b。有某些表现症状的患者集合包含于可能患有某些疾病的患者集合,就可以得到“如果患者有某种程度的表现症状那么他们患有某些疾病的程度”这样的诊断。
31.得到所有属性导出的模糊对象语言三支决策规则集合,包括规则:{,,,,,,,,,,,,,,,,,,,,,,
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,}在得到的规则集中,与是两个属性导出的模糊对象语言决策规则,若,便称规则蕴含规则,并将视为冗余规则,剔除冗余规则,得到非冗余规则集,包括规则:{,,,,,,,,,,,,,,,}通过上述步骤可以得到关于医疗诊断的相关规则。规则表示患者很少会流鼻涕的程度为0.8,那么他有很小可能性会感冒的程度是0.8;患者很少流鼻涕的程度为0.6,那么他有很小可能性会感冒的程度是0.6,说明患者和不太可能患有感冒,应深入检查是否患有其他病症。
32.模糊对象语言决策形式背景,取信任度水平阈值为。由两个模糊对象语言形式背景和共同组成,其中对象集表示五位病人,为病人表现出的两种症状,其中为咳嗽,为流鼻涕。表示病人有可能患上的疾病,其中为感冒,为肺炎。语言术语集:
为描述两种症状程度的语言值,表示与的关系;语言术语集表示病人患有某种疾病的可能程度,体现与的关系,其描述如下:患者对于属性、、、、、、、、、、、的信任度水平值分别是患者对于属性、、、、、、、、、、、的信任度水平值分别是;患者对于属性、、、、、、、、、、、的信任度水平值分别是;患者对于属性、、、、、、、、、、、的信任度水平值分别是;患者对于属性、、、、、、、、、、的信任度水平值分别是。
33.本发明公开了一种基于属性导出模糊对象语言概念格的决策形式背景规则提取方法,将三支概念分析理论运用到具有模糊对象语言概念的形式背景中,给出属性导出模糊对象语言三支概念,生成属性导出模糊对象语言三支概念格,提出属性导出模糊对象语言三支概念格上的语言决策规则,构造属性导出模糊对象语言概念格的决策形式背景上的规则提取算法,解决了属性导出模糊对象语言三支概念格上的决策问题。该方法通过判断条件属性是描述病人症状的语言值和决策属性是可能患得疾病的语言值,这两种属性导出模糊对象语言概念三支格间的细于关系,提取决策规则,进而诊断最具可能性的疾病类型。有效地处理决策分析中的语言信息问题,提供智能化的医疗诊断方法。
34.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。