本发明属于医疗行为分析,具体是基于标准医疗数据标注建模的医疗业务行为翻译方法。涉及医疗行为建模和健康数据片段标注技术,结合计算机程序自动标注技术和模型拟合技术将每个病例的医疗数据进行精准标注和行为模型拟合,并将其结果存储到数据库中,用于对医疗行为精确画像分析及应用提供支持。
背景技术:
1、数据标注是数据分析的基础工作,数据标注质量主要是颗粒度和精准度,直接影响数据分析结果。百度easydl等数据标注技术在互联网内容、商品、消费者偏好等标注及分析方面广泛使用。互联网和电商领域的业务流程及复杂度相对医疗业务领域要更为简单、也不需要借助复杂的标注建模工具即可实现,因此市面上的数据标注技术可满足需求。
2、现有技术存在的问题:
3、(1)传统技术未对行为进行对象模型进行对象建模、不能精准提取数据中的信息。
4、(2)传统技术不能动态创建事件行为模型并利用该模型规则进行数据计算,难以快速有效找到问题的数据证据。
技术实现思路
1、本发明的目的如下:1、构建新的医疗数据分析模型,通过对医疗业务数据精准建模来透视医疗业务行为过程。2、通过医疗数据使用医疗服务过程,为精细化医疗服务管理提供技术支持。
2、本发明解决现有技术不足提供一种基于标准医疗数据标注建模的医疗业务行为翻译方法,包括如下步骤:
3、步骤一、准备训练数据,创建医疗行为的对象,按照emr、ehr模型,将表、字段映射成对象;
4、步骤二、数据处理,对于提取出来的原始数据,按照行为事件构建行为主题模型,对单个的模型进行垂直加工,加工完成的数据检索一条或者多条数据放入到json数组形成对象,进行重复训练;
5、步骤三、引入k-means聚类算法对海量数据模型训练,通过对原始采样数据的迭代,将数据集划分为k个不重叠的簇,输出聚类后的坐标q(x,y);
6、步骤四:线性拟合得出特征曲线,对于两个变量x和y,使用一元线性回归来拟合它们之间的关系;一元线性回归使用一个参数a和一个参数b来描述x和y之间的关系,即y =ax + b线性函数;通过最小化预测值与实际观测值之间的平方误差总和,来找到数据的最佳拟合直线或曲线,结合x的值按照顺序进行运算,得到曲线最佳拐点;
7、步骤五、在得到曲线最佳拐点,可以使用该拐点来预测新的观测数据,也可以用它来分析两个变量之间的关系,进而判断模型的成功与否。
8、步骤六、在模型训练完成后,需要使用一些评估指标来评估模型的性能,通过到拐点的数据,计算出理想斜率和实际斜率,最终得到百分比最优模型;
9、第六步、选择通过第五步得出最优模型、读取从全量emr、ehr数据分批取出,将其作为翻译算法的入参传入,执行翻译程序,得到医疗行为翻译结果。
10、所述医疗行为的对象为医生、患者、药品、b超检查单、电针疗法、ct检查。
11、所述主题模型为预约挂号、x光检查、b超检查。
12、发明有益效果为:
13、1.医疗行为事件模版计算技术可以实现一些异常的医疗行为探查,比如:一个在门诊病就诊的病人在就医过程中拿到了ct检查单、但没有交费就结束了此次就诊。如果通过统计分析发现这样的医疗行为存在的比例较大,医院管理人员就可以依据这些异常行为进一步去分析对比是不是本院的ct检查服务是否有哪些问题(例如:收费高于其他医院、ct的质量比其他医院要低等),为持续改善医疗服务质量和医院运营管理方法做支撑。
14、2.比较精细化的医疗行为对象建模技术可以更加细化医疗管理的颗粒度和数据分析探究的维度,为医院高质量医疗发展可提供全面的技术支撑。
1.基于标准医疗数据标注建模的医疗业务行为翻译方法,其特征在于包括如下步骤:
2.根据权利要求1所述的基于标准医疗数据标注建模的医疗业务行为翻译方法,其特征在于所述医疗行为的对象为医生、患者、药品、b超检查单、电针疗法、ct检查。
3.根据权利要求1所述的基于标准医疗数据标注建模的医疗业务行为翻译方法,其特征在于所述主题模型为预约挂号、x光检查、b超检查。