一种医院数据的自动分析方法及自动分析系统的制作方法

文档序号:9506423阅读:794来源:国知局
一种医院数据的自动分析方法及自动分析系统的制作方法
【技术领域】
[0001] 本发明涉及数据处理技术领域,具体涉及一种医院数据的自动分析方法及自动分 析系统。
【背景技术】
[0002] 现有技术是在数据库中将患者信息导出,经过对数据的手工整理和分析,得出结 论。由于数据量较大,且成因复杂。此技术既费时费力,又缺乏针对性和灵活性,不能准确 反应临床医疗管理工作中不断变化的情况。

【发明内容】

[0003] 本发明所要解决的技术问题是提供一种医院数据的自动分析方法及分析系统,自 动完成对病人住院时间超过预定时间产生成因的聚类和分类分析,在提高工作效率的同 时,让临床医疗管理工作能更灵活的,更有针对性的支持临床优质服务的实现。
[0004] 本发明解决上述技术问题的技术方案如下:
[0005] 基于一个方面,本发明提供了一种医院数据的自动分析方法,所述方法包括:
[0006] S1、采集一段时间内住院时间超过第一预定时间的病人相关信息,以形成分析样 本数据;
[0007] S2、对采集的所述分析样本数据运用模糊数学和聚类分析方法进行原因分类,得 到聚类分析结果;
[0008] S3、根据所述聚类分析结果,运用分类分析方法对实际样本数据进行原因归类,并 输出各原因类别对应的样本数据量;
[0009] S4、运用帕累托分析方法分析得到所述样本数据的主因。
[0010] 基于另一个方面,本发明提供了一种医院数据的自动分析系统,所述系统包括:
[0011] 数据采集单元,用于从原始数据中采集一段时间内住院时间超过第一预定时间的 病人相关信息,以形成分析样本数据;
[0012] 聚类分析单元,用于对采集的所述分析样本数据运用模糊数学和聚类分析方法进 行原因分类,得到聚类分析结果;
[0013] 原因归类单元,用于根据所述聚类分析结果,运用分类分析方法对实际样本数据 进行原因归类,并输出各原因类别对应的样本数据量;
[0014] 主因分析单元,用于运用帕累托分析方法分析得到所述样本数据的主因。
[0015] 本发明提供的一种医院数据的自动分析方法及分析系统系统,采集住院时间超过 预定时间的病人相关信息作为分析样本数据,并运用模糊数学和聚类分析方法对分析样本 数据进行原因分类,得到聚类分析结果,并运用分类分析方法对实际的样本数据进行原因 归类,并找出主因,为相关医疗管理部门提供决策依据,相比现有的需要手工分析和整理数 据,节约了时间,提高了效率。
【附图说明】
[0016] 图1为本发明实施例1的一种医院数据的自动分析方法流程图;
[0017] 图2为聚类分析所需采集的样本特征值(每位患者相关信息列表项)示意图;
[0018] 图3为数据采集后的数据二维表格(行为病人,列为特征值)示意图;
[0019] 图4为实施例1中运用帕累托分析方法分析得到所述样本数据的主因的数据图 样;
[0020] 图5为实施例1采用表格输出各科室每个月的主因对应的样本数据量表格示意 图;
[0021] 图6为本发明实施例2的一种医院数据的自动分析系统示意图。
【具体实施方式】
[0022] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并 非用于限定本发明的范围。
[0023] 实施例1、一种医院数据的自动分析方法。以下结合图1-图5对本实施例提供的 分析方法进行详细说明。
[0024] 参见图1,S1、采集一段时间内住院时间超过第一预定时间的病人相关信息,以形 成分析样本数据。
[0025] 具体的,可从原始数据中提取一段时间内,比如最近一年内的住院时间超过一定 时间的病人的相关信息,可参见图2,本实施例采取从原始数据中提取住院时间超过30天 的病人相关信息,其中,病人相关信息包括病人的基本信息、入院时间、出院时间、检查时 间、检查结果反馈时间、检查项目数量、手术申请时间、手术开始时间、手术结束时间、手术 延期记录、并发症记录、术前转科记录、术后转科记录、特殊疾病的诊断、并发症记录和医嘱 时间。通过采集一年内住院时间超过30天的病人相关信息,尤其是这些病人住院时间超过 30天的具体原因进行采集,形成分析样本数据,并将采集的分析样本数据以表格的形式存 储于数据库中,可参见图3。
[0026] S2、对采集的所述分析样本数据运用模糊数学和聚类分析方法进行原因分类,得 到聚类分析结果。
[0027] 具体的,在现实的临床工作中住院超过30天病人的产生原因可能同时归属于若 干个不同分类,这说明原因分类伴随着模糊性。在许多情况下某个病人住院超过30天是否 由某一原因造成,并不是泾渭分明的,在不同的原因间都有一个从属的程度。因此运用模糊 数学+聚类分析方法来描述住院病人超过30天的原因会更为合理和准确。具体进行原因 分析时,由于分析样本数据的量纲各不相同,有的是时间,有的是数字,有的是疾病诊断,因 此需要对采集的分析样本数据进行标准化转换,将分析样本数据压缩到区间(〇,1)上,建 立二维原始数据矩阵。然后,借用传统聚类分析的相似系数法标出衡量被分类的分析样本 数据之间相似程度的统计量 Γι]建立模糊形似矩阵,其中,i,j为正整数,i,j的取值均为 1、2…n,n为分析样本数据量,且I^j= R(x ;,xj,其中,表示X ;和X 的相似程度,X ;和X 为分析样本数据中第i个和第j个样本数据值。最后,采用直接聚类算法和F检验方法对 建立的所述模糊相似矩阵进行分析,得到聚类分析结果。
[0028] 其中,采用直接聚类算法和F检验方法对建立的模糊相似矩阵进行分析具体 包括:采用直接聚类算法,在建立的模糊相似矩阵基础上,取某一实数λ e [0,ι],依次 将λ值从1变小至〇,对论域内的所有元素构建相类似的矩阵,得到在不同λ水平下 对所述分析样本数据的原因分类划分。采用F检验法确定不同分类之间是否存在显著 差异:设论域有η个分析样本数据,每个分析样本数据有m个特征值,对应λ值的原因 分类数为s,原因分类结果中第j类的样本数据量为η,,其中的样本数据值为x n]]。每个 特征值对应样本数据平均值为故第j类样本中第k个特征的样本数据平均值为?
F统计量服从自由 度为s-1,n-s的F分布,分母表示类内样本间的距离,分子表示类与类之间的距离,F值越 大,说明类别之间差异越大,分类效果越好,可以看出当F值最大时,能够得到最佳的聚类 分析结果,再根据分类后的样本进行归纳,即可得到原因的分类结果。目前得到的聚类分析 结果如下:
[0029] (1)手术科室
[0030] 1. 1等待检查结果(包括确诊困难、检查多等)(需填天数);
[0031] 1. 2术前转入(从其他科转入)(填从哪里转来);
[0032] 1.3手术延期(填原因);
[0033] 1. 4并发症(并发症不需要手术治疗的)(请填并发症);
[0034] 1. 5二次手术(并发症引发手术的归于此类)(填原因或并发症);
[0035] 1. 6术后转出(填转入科室)。
[0036] (2)非手术科室
[0037] 2. 1诊断时间长、疑难杂症;
[0038] 2. 2治疗时间长(包括放化疗、慢性病);
[0039] 2. 3转科(需填从哪里转来);
[0040] 2. 4各种操作引起的严重并发症。
[0041] ⑶通用
[0042] 3.1挂床(医保问题);
[0043] 3. 2纠纷(包括拒绝出院、不能出院等);
[0044] 3. 3特殊疾病(如移植、透析等)。
[0045] (4)其他
[0046] S3、根据所述聚类分析结果,运用分类分析方法对实际样本数据进行原因归类,并 输出各原因类别对应的样本数据量。
[0047] 具体的,可以根据具体需求,比如,需要对最近一个月的样本数据进行原因分析, 也可以具体对某段时间某科室的样本数据进行原因分析,因此,对样本数据进行多维度筛 选,以形成各维度的样本数据;根据各维度样本数据的样本特征(每个病人的基本数据)和 聚类分析结果,将各维度样本数据归类到各原因类别(一个病人样本可能包含在多个原因 分类中)中,得到每个原因类别对应的样本数据量,例如,可参见图4,最终输出某段时间内 某科室或者全部科室,各原因分类包含的样本数据量。S4、运用帕累托分析方法分析得到所 述样本数据的主因。
[0048] 具体的,根据每个原因类别对应的样本数据量,计算各原因类别对应的样本数据 量占总样本数据量比例,可参见图5,将样本数据量占总数量比例超过阈值的原因类别作为 整个样本数据的主因。比如,得到造成某段时间内某科室住院病人超过30天的主要原因。
[0049] 需要说明的是,通过本实施例提供的方法对病人住院时间超过预定时间产生原因 的动态分析,原因会根据数据样本的变化而改变。医疗管理部门通过对动态原因的分析,不 断完善存在的问题,实现对住院管理水平的持续改进。
[0050] 实施例2、一种医院数据的自动分析系统。以下结合图6对本实施例提供的系统进 行详细描述。
[0051] 参见图6,本实施例提供的分析系统包括数据采集单元61、聚类分析单元62、数据 筛选单元63、原因归类单元64和主因分析单元65,其中,聚类分析单元62包括标准化转换 模块621和模糊相似矩阵建立模块622。
[0052] 其中,数据采集单元61,用于采集一段时间内住院时间
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1