关联规则算法在血液变与中风关系中的应用方法及装置的制造方法

文档序号:10577354阅读:287来源:国知局
关联规则算法在血液变与中风关系中的应用方法及装置的制造方法
【专利摘要】本发明提供一种关联规则算法在血液变与中风关系中的应用方法,包括:步骤S1、获取若干中风病人的血流变数据,并提取血流变数据中的血流因素;步骤S2、标准化处理血流因素;步骤S3、利用关联规则算法对经标准化处理后的血流因素进行处理,以获取血流变数据与中风疾病的关联规则。本发明提供的方法应用于中风患者的血流变数据中,对中风患者血流变的临床特征进行科学分类以及提取隐藏的更有价值的医疗信息,并在以往的常规评价模式“支持度?置信度”基础上采用有效度和兴趣度有效的评价标准对所得到的关联规则进行评价,使中风预防更加具有针对性,从而提高临床疾病的预防和早期治疗的效果。
【专利说明】
关联规则算法在血液变与中风关系中的应用方法及装置
技术领域
[0001] 本发明涉及分布式计算与数据挖掘领域,尤其涉及关联规则算法在血液变与中风 关系中的应用方法及装置。
【背景技术】
[0002] 中风又称脑卒中,是急性脑循环损害迅速导致局限性或弥漫性脑功能缺损的临床 事件。根据病因、病理可以将中风分为缺血性中风与出血性中风两大类。前者主要包括局限 性脑梗死(脑血栓、脑栓塞),后者主要包括脑出血和蛛网膜下腔出血。脑卒中是多种脑血管 疾病的严重表现形式,是中老年人的一种常见病,是一种高发病率、高致残率的疾病,给社 会及家庭带来沉重的经济负担和精神负担。因此,中风的预防具有重要的社会意义。资料表 明,血流变指标的变化是脑血管疾病的主要发病因素之一,血流变的改变最终引发组织功 能、结构的变化,从而导致微循环障碍。例如,微循环障碍同时伴有全血和血浆粘度的增高 常见于脑中风等疾病,血液粘度的测定在缺血性和出血性脑中风的鉴别诊断、疗效观察等 过程有重要意义。因此进一步研究血流变与中风疾病的关系对临床治疗、预防各种脑血管 病具有非常重要的临床意义。
[0003] 随着计算机技术的发展,医院数据库信息容量快速积累,如何挖掘这些医学宝贵 信息中隐含的更有意义的资源,对于疾病的诊断、治疗和医学研究都是非常有价值的。因 此,提供一种利用计算机快速、准确的分析中风疾病与血流变数据的关系的方法,成为目前 亟待解决的问题。

【发明内容】

[0004] 鉴于上述问题,本申请记载了一种关联规则算法在血液变与中风关系中的应用方 法,所述方法包括:
[0005] 步骤Sl、获取若干中风病人的血流变数据,并提取所述血流变数据中的血流因素;
[0006] 步骤S2、标准化处理所述血流因素;
[0007] 步骤S3、利用所述关联规则算法对经标准化处理后的所述血流因素进行处理,以 获取所述血流变数据与中风疾病的关联规则。
[0008] 较佳的,所述血流因素包括血粘度信息和/或红细胞压积信息和/或血浆浓度信息 和/或血沉信息和/或体外血栓长度信息。
[0009] 较佳的,所述步骤S3包括:
[0010]步骤S31、结合因子分析法和逐步聚类分析法分析经标准化处理的所述血流因素 并获取分析结果;
[0011] 步骤S32、根据所述关联规则算法以及所述分析结果挖掘所述血流变数据与中风 疾病相关的关联规则。
[0012] 较佳的,所述关联规则算法为Apriori算法。
[0013]较佳的,步骤S32包括:
[0014] 步骤S321、找出所述分析结果中所有满足最小支持度的所有频繁项集;
[0015] 步骤S322、根据所述频繁项集计算出满足最小置信度的所有的关联规则;
[0016] 步骤S323、对所有计算出的关联规则进行评价,以获取最优的关联规则。
[0017] 较佳的,对所述关联规则的评价方法包括基于有效度评价和基于兴趣度评价。
[0018] 本发明还提供了一种关联规则算法在血液变与中风关系中的应用装置,所述装置 包括:
[0019] 获取模块,用以获取若干中风病人的血流变数据,并提取所述血流变数据中的血 流因素;
[0020] 标准化模块,与获取模块相连,用以标准化处理所述血流因素;
[0021] 关联模块,与标准化模块相连,用以利用所述关联规则算法对经标准化处理后的 所述血流因素进行处理,以获取所述血流变数据与中风疾病的关联规则。
[0022]较佳的,所述关联模块包括:
[0023] 分析单元,与所述标准化模块相连,用以结合因子分析法和逐步聚类分析法分析 经标准化处理的所述血流因素并获取分析结果;
[0024] 挖掘单元,与所述分析单元相连,用以根据所述关联规则算法以及所述分析结果 挖掘所述血流变数据与中风疾病相关的所述关联规则。
[0025]较佳的,所述挖掘单元包括:
[0026] 频繁项集获取子单元,与所述分析单元相连,用以找出所述分析结果中所有满足 最小支持度的所有频繁项集;
[0027] 关联规则获取子单元,与所述频繁项集获取子单元相连,用以根据所述频繁项集 计算出满足最小置信度的所有的关联规则。
[0028]较佳的,所述挖掘单元还包括:
[0029] 评价子单元,与所述关联规则获取子单元相连,用以对所有计算出的关联规则进 行评价,以获取最优的关联规则。
[0030] 上述技术方案具有如下优点或有益效果:本发明提供的方法应用于中风患者的血 流变数据中,对中风患者血流变的临床特征进行科学分类以及提取隐藏的更有价值的医疗 信息,并在以往的常规评价模式"支持度-置信度"基础上采用有效度和兴趣度有效的评价 标准对所得到的关联规则进行评价,使中风预防更加具有针对性,从而提高临床疾病的预 防和早期治疗的效果。
【附图说明】
[0031] 参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和 阐述,并不构成对本发明范围的限制。
[0032] 图1为本发明一种关联规则算法在血液变与中风关系中的应用方法的流程示意图 ,
[0033] 图2为本发明一种关联规则算法在血液变与中风关系中的应用方法的流程示意图 -* *
[0034] 图3为本发明一种关联规则算法在血液变与中风关系中的应用方法的流程示意图 -* · -·,
[0035] 图4为本发明一种关联规则算法在血液变与中风关系中的应用装置的结构示意图 ,
[0036] 图5为本发明一种关联规则算法在血液变与中风关系中的应用装置的结构示意图 --〇
[0037] 图6为本发明一种关联规则算法在血液变与中风关系中的应用装置的结构示意图 _-〇
【具体实施方式】
[0038] 下面结合附图和具体实施例对本发明关联规则在血液变与中风疾病关系中的应 用方法及装置进行详细说明。
[0039] 实施例一
[0040] 如图1所示,一种关联规则在血液变与中风疾病关系中的应用方法,该方法包括步 骤:
[0041] S1、采集多个中风病人的血流变数据,提取血流变中的血流因素;
[0042] S2、将血粘度信息、红细胞压积信息、血浆浓度信息、血沉信息以及体外血栓长度 信息等血流因素进行标准化处理;
[0043] S3、利用关联规则对经标准化处理的血流变数据进行处理,以获取血流变数据与 中风疾病的关系。
[0044]具体来说,在本实施例提出的关联规则在血液变与中风疾病关系中的应用方法 中,首先需要采集若干个中风病人的血流变数据,在实际应用中,采集到的血流变数据越 多,后续进行分析的准确性也会越高。之后,提取血流变数据中的一个或多个血流因素,并 将这些血流因素进行标准化处理。值得指出的是,血流因素包括血粘度信息和/或红细胞压 积信息和/或血浆浓度信息和/或血沉信息和/或体外血栓长度信息。
[0045]在实际应用中,收集了安徽省淮北矿工总医院2003年至2009年期间,首次发作且 按临床标准和CT扫描结果诊断为中风住院病人的552个血流变数据,如表1:
[0046]表1原始数据
[0048] 进一步来讲,如图2所示,在步骤S3中,具体包括步骤:
[0049] S31:结合因子分析法和逐步聚类分析法分析经标准化处理后的血流因素并获取 分析结果;
[0050] S32:根据关联规则算法以及分析结果挖掘血流变与中风疾病相关的规则。
[0051] 具体来说,在本实施例提出的方法中,在对血流因素进行标准化处理后,要结合因 子分析法和逐步聚类分析法,将该血流因素进行分析处理并获取分析结果。之后,利用关联 规则算法,根据分析结果挖掘血流变与中风疾病相关的关联规则。
[0052 ]进一步来讲,关联规则算法为Apr i or i算法。
[0053]下面对因子分析法、逐步聚类法以及Apriori算法进行详细说明:
[0054] 1)因子分析法
[0055]因子分析主要用于从中风疾病与血流变错综复杂的关系问题中找出少数几个主 要因子,每个因子代表原始变量间相互依赖的一种作用。这些彼此不相关的因子代替原来 较多高度相关的原始随机变量,同时这些主要因子尽可能多的反映中风患者血流变数据原 始变量的信息。
[0056] 2)逐步聚类法
[0057]逐步聚类法,它是以样本组内的离差平方和达到最小为标准,通过反复调整每个 样本组中的个体数,从而达到样本组内具有最大同质性,而样本组间具有最大异质性这一 优化目标。此法,是先将样本进行一次粗略的分类,即初始分类,然后根据最优原则进行反 复不断的修改,直到分类合理为止。
[0058] 3 )Apriori 算法
[0059] Apriori算法利用频繁项集性质的先验知识,使用一种称作逐层搜索的迭代方法, 该算法将关联规则的发现分为两步:第一步是识别所有的频繁项目集,即不低于最低支持 度(min_ SUp)的项目集;第二步是从频繁项目集中产生关联规则,在频繁项目集中找出满足 用户最低可信度(min_conf)的规则。
[0060]其中,支持度:表示频繁项目集中A和B同时发生的概率,是对关联规则重要性的衡 量。
[0061 ] sup port(AU Β) Π Ρ(Α] Β)
[0062] 信任度:表示频繁项目集中包含A的同时也包含B的概率,可信度是对关联规则准 确度的衡量。
[0063] canftdeme(A[] B)QF(B/4)
[0064] 进一步来讲,如图3所示,步骤S32中,根据关联规则算法以及分析结果挖掘血流变 与中风疾病关系的关联规则中,包括步骤:
[0065] S321:找出分析结果中所有满足最小支持度的所有频繁项集;
[0066] S322:根据频繁项集计算出满足最小置信度的关联规则;
[0067] S323:对关联规则进行评价,以获取最优的关联规则。
[0068] 进一步来讲,在运用关联规则算法挖掘关联规则前,需要将原始数据中的各变量 的取值转化为一系列的整数或代码,映射为事务的项。按照年龄对数据进行划分,将血流变 数据转化为布尔型数据,把所有属性映射为成项的索引表,如表2所示:
[0069]表2血流变数据与赋值
[0072]利用数据转换算法将表1中的数据逐条扫描数据库记录,通过查询项目映射表获 取相应的项编号,并将其填充到事务表中的相应位置,完成了关系数据库到事务表的转换, 事务数据如表3:
[0073]表3中风事务数据库
[0075] 具体来讲,在利用关联规则算法挖掘关联规则的过程中,首先要找出分析结果中 所有满足最小支持度的所有频繁项集,然后根据该频繁项集计算出满足最小置信度的关联 规则。但是,并不是所有计算出的关联规则都是有意义的,此时就需要对计算出的关联规则 进行评价,以保留其中一条或几条有用的关联规则,即获取最终结果。
[0076] 进一步来讲,在对有效关联规则评价的评价方法有两种:基于有效度评价和基于 兴趣度评价。
[0077] 本实施例提供的方法主要应用于中风患者的血流变数据中,对中风患者血流变的 临床特征进行科学分类以及提取隐藏的更有价值的医疗信息,并在以往的常规评价模式 "支持度-置信度"基础上采用有效度和兴趣度有效的评价标准对所得到的关联规则进行评 价,使中风预防更加具有针对性从而提高临床疾病的预防和早期治疗的效果。实施例二
[0078] 根据上述实施例提出的一种关联规则算法在血液变与中风关系中的应用方法,本 实施例提出了一种关联规则算法在血液变与中风关系中的应用装置。
[0079] 如图4所示,一种关联规则算法在血液变与中风关系中的应用装置,包括:
[0080] 获取模块1,用以获取若干中风病人的血流变数据,并提取血流变数据中的血流因 素;
[0081 ]标准化模块2,与获取模块1相连,用以标准化处理血流因素;
[0082]关联模块3,与标准化模块2相连,用以利用关联规则算法对经标准化处理后的血 流因素进行处理,以获取血流变数据与中风疾病的关联规则。
[0083] 具体来说,本实施例提出的装置中,首先利用获取模块1获取若干中风病人的血流 变数据,并提取血流变数据中的血流因素,然后由标准化模块2将血流因素标准化处理,最 后由关联模块3利用关联规则算法对经标准化处理后的血流因素进行处理,以获取血流变 数据与中风疾病的关系。其中,血流因素包括血粘度信息和/或红细胞压积信息和/或血浆 浓度信息和/或血沉信息和/或体外血栓长度信息等。
[0084] 进一步来讲,如图5所示,关联模块3包括:
[0085] 分析单元31,与标准化模块2相连,用以结合因子分析法和逐步聚类分析法分析经 标准化处理的血流因素并获取分析结果;
[0086] 挖掘单元32,与分析单元31相连,用以根据关联规则算法以及分析结果挖掘血流 变数据与中风疾病相关的关联规则。
[0087] 值得指出的是,并不是直接利用挖掘单元32挖掘关联规则,而是需要先利用分析 单元31结合因子分析法和逐步聚类分析法分析经标准化处理的血流因素,获取分析结果之 后,由挖掘单元32利用关联规则算法挖掘血流变与中风疾病相关的关联规则。
[0088I 进一步来讲,如图6所示,挖掘单元32包括:
[0089] 频繁项集获取子单元321,与分析单元31相连,用以找出分析结果中所有满足最小 支持度的所有频繁项集;
[0090] 关联规则获取子单元322,与频繁项集获取子单元321相连,用以根据频繁项集计 算出满足最小置信度的所有的关联规则;
[0091 ]评价子单元323,与关联规则获取子单元322相连,用以对所有计算出的关联规则 进行评价,以获取最优的关联规则。
[0092]值得指出的是,在挖掘单元32挖掘有用的关联规则时,首先要利用频繁项集获取 子单元321分析结果中所有满足最小支持度的所有频繁项集,再由关联规则获取子单元322 根据频繁项集计算出满足最小置信度的所有的关联规则。但是,获取的关联规则并不是全 部有用的,此时需要评价子单元323对获取的所有关联规则进行评价,以获取最优的关联规 则。
[0093]进一步来讲,对关联规则的评价方法包括基于有效度评价和基于兴趣度评价两种 方式。
[0094]对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。 因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权 利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。
【主权项】
1. 一种关联规则算法在血液变与中风关系中的应用方法,其特征在于,所述方法包括: 步骤S1、获取若干中风病人的血流变数据,并提取所述血流变数据中的血流因素; 步骤S2、标准化处理所述血流因素; 步骤S3、利用所述关联规则算法对经标准化处理后的所述血流因素进行处理,以获取 所述血流变数据与中风疾病的关联规则。2. 根据权利要求1所述的关联规则算法在血液变与中风关系中的应用方法,其特征在 于,所述血流因素包括血粘度信息和/或红细胞压积信息和/或血浆浓度信息和/或血沉信 息和/或体外血栓长度信息。3. 根据权利要求2所述的关联规则算法在血液变与中风关系中的应用方法,其特征在 于,所述步骤S3包括: 步骤S31、结合因子分析法和逐步聚类分析法分析经标准化处理的所述血流因素并获 取分析结果; 步骤S32、根据所述关联规则算法以及所述分析结果挖掘所述血流变数据与中风疾病 相关的关联规则。4. 根据权利要求3所述的关联规则算法在血液变与中风关系中的应用方法,其特征在 于,所述关联规则算法为Apriori算法。5. 根据权利要求3所述的关联规则算法在血液变与中风关系中的应用方法,其特征在 于,步骤S32包括: 步骤S321、找出所述分析结果中所有满足最小支持度的所有频繁项集; 步骤S322、根据所述频繁项集计算出满足最小置信度的所有的关联规则; 步骤S323、对所有计算出的关联规则进行评价,以获取最优的关联规则。6. 根据权利要求5所述的关联规则算法在血液变与中风关系中的应用方法,其特征在 于,对所述关联规则的评价方法包括基于有效度评价和基于兴趣度评价。7. -种关联规则算法在血液变与中风关系中的应用装置,其特征在于,所述装置包括: 获取模块,用以获取若干中风病人的血流变数据,并提取所述血流变数据中的血流因 素; 标准化模块,与获取模块相连,用以标准化处理所述血流因素; 关联模块,与标准化模块相连,用以利用所述关联规则算法对经标准化处理后的所述 血流因素进行处理,以获取所述血流变数据与中风疾病的关联规则。8. 根据权利要求7所述的关联规则算法在血液变与中风关系中的应用装置,其特征在 于,所述关联模块包括: 分析单元,与所述标准化模块相连,用以结合因子分析法和逐步聚类分析法分析经标 准化处理的所述血流因素并获取分析结果; 挖掘单元,与所述分析单元相连,用以根据所述关联规则算法以及所述分析结果挖掘 所述血流变数据与中风疾病相关的所述关联规则。9. 根据权利要求8所述的关联规则算法在血液变与中风关系中的应用装置,其特征在 于,所述挖掘单元包括: 频繁项集获取子单元,与所述分析单元相连,用以找出所述分析结果中所有满足最小 支持度的所有频繁项集; 关联规则获取子单元,与所述频繁项集获取子单元相连,用以根据所述频繁项集计算 出满足最小置信度的所有的关联规则。10.根据权利要求9所述的关联规则算法在血液变与中风关系中的应用装置,其特征在 于,所述挖掘单元还包括: 评价子单元,与所述关联规则获取子单元相连,用以对所有计算出的关联规则进行评 价,以获取最优的关联规则。
【文档编号】G06F19/00GK105938516SQ201610227357
【公开日】2016年9月14日
【申请日】2016年4月12日
【发明人】田思, 张维朋, 李永平, 王勇
【申请人】宁波大红鹰学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1