本发明涉及医学数据,具体为一种医疗大数据标准化多中心数据库建设方法。
背景技术:
1、随着it技术的发展和时代的进步,大数据技术的普及和使用,在医疗领域中,基于大数据技术对患者实行更多元化、更详细的数据分析,便于患者的治疗和康复也成为了现代医疗中极为重要的一个部分,医疗大数据的数据维度得到了进一步扩充从原有的业务系统数据进一步扩展到了气象数据、随访数据、医保数据等多来源数据。
2、然而医疗大数据的应用存在以下痛点:
3、1.数据汇聚难,主要存在系统各异、缺乏集成、元数据不统一、标准不统一等问题;2.数据治理难,医疗相关数据(如his,lis等医疗业务系统数据、环境检测数据等)普遍存在准确性、完整性、一致性、可靠性、安全性等问题;3.数据共享难,医疗行业数据涉及大量患者隐私,需要受到保护,如何在满足国家相关法律法规的前提下方便使用十分重要。而医疗相关研究常常需要汇聚多个医疗机构数据进行合并使用,增加其科研成果的外推性,进一步凸显了这一问题。
4、所以,为了解决上述提到的数据汇集难、数据治理难和数据共享难,我们提出了一种医疗大数据标准化多中心数据库建设方法。
技术实现思路
1、针对现有技术的不足,本发明提供了一种医疗大数据标准化多中心数据库建设方法,解决了上述背景技术中提出的问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种医疗大数据标准化多中心数据库建设方法,包括以下步骤:
3、s1.确定统一的分布式数据库格式:根据收集的医疗数据的不同,对不同数据的储存格式进行同一定义和格式调整。
4、s2.数据提取模块:通过该工具实时收集和提取来自医疗信息化系统、电子数据采集系统、医保系统等多来源的多模态,可通过数据离线上传或者api接口进行数据更新,并上传至原始数据池;s3.数据去隐私化和标准化模块:对所有数据进行去隐私化处理,并确定统一的数据标准、数据结构、数据字典对数据进行数据标准化,完成去隐私化和标准化的数据统一进入科研数据池;数据的处理方式会根据数据特点进行自动推荐并完成;
5、非结构化数据:本地化部署chatgpt模块,提取信息,数据入库;
6、影像数据:去除dicom或者jpg等图像格式中固有的患者隐私信息后进行入库;
7、语音数据:去除患者声纹信息后进行入库;
8、视频数据:去除患者人脸信息,替换为ai脸后进行入库;
9、s4.数据统计模块:各类型数据的统计结果数据通过隐私计算上传到统一网站,进行实时更新同步;
10、s5.数据远程分析模块:构建可以兼容常规python,r,matlab分析软件的平台,可以远程发送接受代码;
11、s6.多中心联合研究:通过隐私计算同步上传分析代码到各中心部署的分析平台,输出结果通过隐私计算发送到整合终端并进行整合。
12、在本发明中进一步的,所述s1包括以下部分组成:
13、s11、数据库搭建:将需要进行入库保存的数据进行整合,并通过将其设定为数据库形式进行保存,并根据其搭建对应数据库的模块;
14、s12、数据库内容扩充:在进行日常治疗、诊断的时候按照患者的意愿和授权,将患者治疗过程中的信息以及其他来源收集到的信息录入到数据库中,从而对数据库内容进行补充的模块;
15、s13、数据库内容整理分类:根据所录入的文件的种类、信息不同对文件进行整理,并根据所呈现的内容和媒介不同进行数据分类的模块。
16、3.根据权利要求2所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述数据库内容收集包括以下部分组成:
17、s121、医疗业务系统端数据录入:在治疗过程中根据治疗情况产生的检查信息、治疗过程中的身体信息、用药量信息和用药后的身体情况变化信息进行录入的模块;
18、s122、患者数据采集端数据录入:经患者同意,将患者在治疗过程中的量表数据、主观感受、用药后药效时间段内的主观感受、在病发时间段内患者的体感以及痛感信息录入的模块;
19、s123、其他来源端数据录入:对患者的医保数据、环境气象数据进行信息录入的模块。
20、s124:随访信息数据录入:经患者同意,以数据调查员在患者入院期间和出院后的多模态随访数据(结构化数据、语音、视频、影像)录入到数据库中的模块。
21、在本发明中进一步的,s121、医疗业务系统端数据录入包括心电图信息、血压信息、血检信息、ct信息、造影信息、用药信息、体温信息和输血量信息。
22、在本发明中进一步的,所述s122、患者数据采集端数据录入包括患者睡眠信息、患者进食信息、患者患病体感信息和患者服药信息。
23、在本发明中进一步的,所述s5中登录数据库的用户均需要进行身份验证即可访问,所述身份验证方法包括面部确认、指纹确认、密码确认和验证码确认。
24、在本发明中进一步的,所述身份验证中选取所述面部确认、指纹确认、密码确认和验证码确认的两个组合进行身份确认。
25、在本发明中进一步的,所述s2中患者隐私信息包括姓名、年龄、面部、语音。
26、在本发明中进一步的,所述存储数据池包括原始数据池和科研数据池;原始数据库存储原始数据,原始数据会存储备份在数据库底层,使用者只能看到经过去隐私化和标准化处理后的数据;
27、不同类型的数据根据其格式不同分类存储在对应存储区域。
28、本发明提供了一种医疗大数据标准化多中心数据库建设方法,具备以下
29、有益效果:
30、1、该医疗大数据标准化多中心数据库建设方法,通过采用统一数据标准、数据结构及分布式存储数据,并通过隐私计算上传到统一网站,进行实时更新同步,从而构建一个可以兼容多种分析软件的平台。
1.一种医疗大数据标准化多中心数据库建设方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述s1包括以下部分组成:
3.根据权利要求2所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述数据库内容收集包括以下部分组成:
4.根据权利要求3所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:s121、医疗业务系统端数据录入包括心电图信息、血压信息、血检信息、ct信息、造影信息、用药信息、体温信息和输血量信息。
5.根据权利要求1所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述s122、患者数据采集端数据录入包括患者睡眠信息、患者进食信息、患者患病体感信息和患者服药信息。
6.根据权利要求1所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述s5中登录数据库的用户均需要进行身份验证即可访问,所述身份验证方法包括面部确认、指纹确认、密码确认和验证码确认。
7.根据权利要求6所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述身份验证中选取所述面部确认、指纹确认、密码确认和验证码确认的两个组合进行身份确认。
8.根据权利要求1所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述s2中患者隐私信息包括姓名、年龄、面部、语音。
9.根据权利要求1所述的一种医疗大数据标准化多中心数据库建设方法,其特征在于:所述存储数据池包括原始数据池和科研数据池;原始数据库存储原始数据,原始数据会存储备份在数据库底层,使用者只能看到经过去隐私化和标准化处理后的数据;