一种基于电子病历分析的隐含规则挖掘方法及系统

文档序号:29799234发布日期:2022-04-23 19:40阅读:来源:国知局

技术特征:
1.一种基于电子病历分析的隐含规则挖掘方法,其特征在于,包括:将从电子病历数据集中提取的特征分为左项集和右项集;所述左项集为手术前的特征;所述右项集为手术后的特征;根据左项集中的所有非空子集,遍历电子病历数据集,确定每个非空左项子集的支持度;并将支持度大于或等于支持度阈值的非空左项子集进行保存,确定第一集合;将所述右项集的所有非空子集进行保存,确定第二集合;对所述第一集合和所述第二集合做直积,得到左项子集和右项子集的所有组合,确定第三集合;遍历电子病历数据集,确定所述第三集合每个组合的支持度;并将支持度大于或等于支持度阈值的组合确定为频繁项集;确定每个频繁项集的置信度;并根据置信度大于或等于置信度阈值的频繁项集确定强关联规则;所述确定每个频繁项集的置信度;并根据置信度大于或等于置信度阈值的频繁项集确定强关联规则,之后还包括:根据强关联规则确定提升度;判断所述提升度是否小于1;若所述提升度小于1,则所述强关联规则无效;若所述提升度大于或等于1,则所述强关联规则有效。2.根据权利要求1所述的一种基于电子病历分析的隐含规则挖掘方法,其特征在于,所述将从电子病历数据集中提取的特征分为左项集和右项集,之前还包括:获取电子病历数据集;对所述电子病历数据集进行预处理;所述预处理包括:数据提取、归一化处理、特征取值以及缺失值处理。3.一种基于电子病历分析的隐含规则挖掘系统,其特征在于,包括:特征划分模块,用于将从电子病历数据集中提取的特征分为左项集和右项集;所述左项集为手术前的特征;所述右项集为手术后的特征;第一集合确定模块,用于根据左项集中的所有非空子集,遍历电子病历数据集,确定每个非空左项子集的支持度;并将支持度大于或等于支持度阈值的非空左项子集进行保存,确定第一集合;第二集合确定模块,用于将所述右项集的所有非空子集进行保存,确定第二集合;第三集合确定模块,用于对所述第一集合和所述第二集合做直积,得到左项子集和右项子集的所有组合,确定第三集合;频繁项集确定模块,用于遍历电子病历数据集,确定所述第三集合每个组合的支持度;并将支持度大于或等于支持度阈值的组合确定为频繁项集;强关联规则确定模块,用于确定每个频繁项集的置信度;并根据置信度大于或等于置信度阈值的频繁项集确定强关联规则;提升度确定模块,用于根据强关联规则确定提升度;第一判断模块,用于判断所述提升度是否小于1;判断结果第一确定模块,用于若所述提升度小于1,则所述强关联规则无效;
判断结果第二确定模块,用于若所述提升度大于或等于1,则所述强关联规则有效。4.根据权利要求3所述的一种基于电子病历分析的隐含规则挖掘系统,其特征在于,还包括:电子病历数据集获取模块,用于获取电子病历数据集;预处理模块,用于对所述电子病历数据集进行预处理;所述预处理包括:数据提取、归一化处理、特征取值以及缺失值处理。

技术总结
本发明涉及一种基于电子病历分析的隐含规则挖掘方法及系统。该方法包括:将从电子病历数据集中提取的特征分为左项集和右项集;根据左项集中的所有非空子集,遍历电子病历数据集,确定每个非空左项子集的支持度;并将支持度大于等于支持度阈值的非空左项子集进行保存,确定第一集合;将右项集的所有非空子集进行保存,确定第二集合;对第一集合和第二集合做直积,得到左项子集和右项子集的所有组合,确定第三集合;遍历电子病历数据集,确定第三集合每个组合的支持度;并将支持度大于等于支持度阈值的组合确定为频繁项集;确定每个频繁项集的置信度;并根据置信度大于等于置信度阈值的频繁项集确定强关联规则。本发明能够提高关联规则的有效率。关联规则的有效率。关联规则的有效率。


技术研发人员:肖格磊 伍诗萌 王宇昌 李芳芳
受保护的技术使用者:中南大学湘雅医院
技术研发日:2022.01.21
技术公布日:2022/4/22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1