专利名称:在采集患者数据中产生匿名的方法和系统的制作方法
技术领域:
本发明总体上涉及用于在患者数据采集中产生匿名的方法,特别涉及在患者医疗数据采集中产生匿名,用于公共数据提炼的方法。
背景技术:
典型地,医院利用计算机系统管理医院中的各个部门,并且通过多个计算机系统采集关于每个患者的数据。例如,一个患者可能被允许进一家医院做胸廓回声(TTE)。关于该患者的信息(如,人口统计和保险)可由该医院信息系统(HIS)获得,并存储在患者记录上。然后该信息可送到心脏科系统(通常称为心血管信息系统,或CVIS)。典型地,CVIS是一个公司的产品,而HIS是另一个公司的产品。结果,两者之间数据库会不同。另外,它们会在数据中获取/保留和发送不同等级的粒度。一旦患者的信息被CVIS接收,则该患者可被安排时间在回声实验室做TTE。然后,由声谱记录仪进行TTE,得到图像和测量结果并将它们送到CVIS服务器。读片医生(如,超声波心动描记员)坐在检查站取出该患者的TTE结果。然后该超声波心动描记员开始检查图像和测量结果,并根据该结果产生一个完全的医疗报告。当该超声波心动描记员完成该医疗报告后,该报告被送到CVIS服务器。该报告存储在该服务器,并通过患者识别数据和该患者联系起来。该完成的医疗报告就是那种可送到用于公共数据提炼的数据库的报告的一个例子。
今天,医疗设备制造商和医药公司在采集关于它们的产品的现实使用的临床数据时面临着日益增长的挑战。因为患者医疗报告都变得计算机化,获得现实使用数据变得更容易了。另外,该数据更易于组合和分析(如,提炼),得到更多有用的信息。能够分析有关某个特定患者的所有医疗报告,将会有助于精确地获得某一特定药品的效果或在患者身上的治疗效果。可是,只要患者的姓名和医疗报告联系在一起的话,联邦法律就保护患者医疗报告不被访问。因此,包含在公共数据库中的数据必须不能显示那些医疗信息包含在数据库中的患者的个人身份。因为这些需要,在将该报告加入用于公共数据提炼的数据库之前,任何包含在医疗报告或记录中可以帮助通过该报告追溯某个特定个人的数据必须从该报告中去除。将可用来追溯某个特定个人的数据去除,使得组合和分析有关某一特定个人的所有医疗报告成为可能。
发明概述本发明的一个方面是用于在患者数据采集中产生匿名的方法。该方法包含接收包括患者识别数据在内的患者医疗报告。检索患者记录,以获得对应该患者的匿名患者标识符(APID)。如检索到APID时,就返回APID,如没有搜索到,就返回空值。如搜索返回空值,就生成一个对应该患者的APID。将该APID加入医疗报告,而将患者的识别数据从该医疗报告中去除。去除了患者识别数据后,将医疗报告送到数据库。
本发明的另一个方面是用于在患者数据采集中产生匿名的方法。该方法包含接收包括患者识别数据在内的患者医疗报告。检索患者记录,以获得对应该患者的APID。如检索到APID时,就返回APID,如没有搜索到,就返回空值。如搜索返回空值,就生成一个对应该患者的APID。该生成过程包含接收媒体访问控制(MAC)地址,并对MAC地址应用第一线性变换矩阵,得到一个变换的MAC地址。该生成过程还包括接收日期/时间,并对日期/时间应用第二线性变换矩阵,得到变换的日期/时间。另外,该生成过程包括接收一个匿名附加码,并对该附加码应用第三线性变换矩阵,得到一个变换的匿名附加码。该变换的MAC地址,变换的日期/时间,变换的匿名附加码连起来的到APID。最后,生成过程包括加密该APID,并将该加密的APID存储在该患者记录中。该用于在患者数据采集中产生匿名的方法还包括将该APID加到该医疗报告,并将该患者识别数据从该医疗报告中去除。去除了患者识别数据后,将医疗报告送到数据库。
本发明的另一个方面在于用以在患者数据采集中产生匿名的系统。该系统包含一个网络和与该网络通讯的主机系统。该主机系统包括执行包含接收包括患者识别数据在内的患者医疗报告的方法的软件。检索患者记录,以获得对应该患者的APID。如检索到APID时,就返回APID,如没有搜索到,就返回空值。如搜索返回空值,就生成一个对应该患者的APID。将该APID加入医疗报告,而将患者的识别数据从该医疗报告中去除。去除了患者识别数据后,将医疗报告送到数据库。
本发明的另一个方面在于用以在患者数据采集中产生匿名的计算机程序产品。该计算机程序产品包含可由处理电路读取的存储媒体和由该处理电路执行的存储指令,用以接收包括患者识别数据在内的患者医疗报告。检索患者记录,以获得对应该患者的APID。如检索到APID时,就返回APID,如没有搜索到,就返回空值。如搜索返回空值,就生成一个相应该患者的APID。将该APID加入医疗报告,而将患者的识别数据从该医疗报告中去除。去除了患者识别数据后,将医疗报告送到数据库。
本发明的另一个方面在于用于在患者数据采集中产生匿名的编码格式。该格式包含唯一的系统标识符和患者标识符,其中包括日期/时间部分和一个附加部分,以确保在系统中的唯一性。该APID以加密的形式存储在患者记录上,而以未加密的形式存储在医疗报告上。
在这里还公开了本发明的其它方面。从以下详细描述和附图中,那些本领域的技术人员将认识和理解本发明以上所讨论的和其它的特点和优点。
附图简述参考例图,其中在几个图中相似的单元用相似的数字编号
图1是一个用于在患者数据采集中产生匿名的典型过程的流程图;图2是一个用于产生匿名患者标识符的典型过程的流程图;和图3描述了数据流变换到典型的编码匿名患者标识符的过程。
发明详述本发明的一个实施例提供了一种采集患者病历的匿名方法,该病历由医疗现场产生,如医院,用于公共数据提炼。本发明的一个实施例可有利于利用医疗成果和诊断并加强患者照顾。该信息的采集包含通过匿名患者标识符(APID)的产生和使用将患者档案分组。例如,如果John Doe在一次和多次看病时有十份档案,那么所有John Doe的档案将会分组在一个APID下。该APID结构被设计成避免和在同一或其它地点使用同样程序产生的其它APID重复。这是通过产生一个分配给每个患者的唯一代用标识符,APID,实现的。当在部门的系统中产生一个患者(手动地或从另一个系统中接收),就产生该患者的唯一的APID。该APID自动加密并和患者数据一起存储在数据库的患者记录部分。每次为了采集数据复制一个患者的档案时,去除该患者的识别项目(如,患者姓名和患者ID),而用APID代替。
图1是一个用于在患者数据采集中产生匿名的典型过程。在步骤102,选择送到用于公共数据提炼的数据库的报告。当报告完成时可触发报告选择,或者可选地,可以定时检索报告数据库,并且根据预选检索标准选择用来作数据库的数据库报告。检索标准可包括,如选择所有那些先前没有送到数据库的报告,或只选择与特定医疗问题或治疗有关的报告。在步骤104,进行检查以决定报告中与该指定患者有关的患者记录是否已经包括可与被选报告链接的加密APID。如患者记录包括加密APID,程序继续步骤112。否则必须产生加密APID以对应报告中的患者。在步骤106,为该患者生成一个APID。以下讨论的图2描述了一种用于产生APID的程序的示范实施例。在步骤108,使用任何本领域熟知的加密软件(如,PGP公司的PGP和RSA的BSAFE)加密该APID。在步骤110,将加密APID存储在患者记录上。
接下来,在步骤112,使用那些与步骤108中使用的加密软件相对应的解密软件,对和被选择用于数据库采集的报告中的患者有关的加密APID进行解密。在一个示范实施例中,假如患者记录不包括加密APID,可使用步骤106中产生的未加密的APID,步骤112可跳过。在步骤114,从该报告中去除患者识别数据。患者识别数据包括可用于识别一个特定个人的任何信息和信息组合,可包括姓名社会保障号,保险号和地址。在步骤116,将未加密APID加入报告,并且在步骤118,该报告被送到用于公共数据提炼的数据库。
图2是产生用于本发明实施例中的APID218的示范实施例的流程图。在数据库的所有医院和数据源中,对于每个患者产生一个唯一的APID218,这一点是非常重要的。在本发明的示范实施例中,APID包括三个组成部分媒体访问控制(MAC)地址;日期/时间和匿名附加码。如图2所描述的,MAC地址202被输入第一线性变换矩阵204。MAC地址202是烧进以太网或令牌网适配器的唯一号码,该号码可以将它同所有其它网卡区分开。MAC地址202的使用可以确保其在用来采集数据库数据的互斥系统,或医院中的唯一性。线性变换矩阵可以是任何非奇异线性矩阵。在一个示范实施例中,非奇异线性矩阵是一个3×3矩阵,而在另一个示范实施例中,它是一个1×3矩阵。使用一个3×3矩阵作为例子,该定义的线性变换为LR3->R3×L(X)=AX将该线性变换矩阵的输出应用于MAC地址202,在图2中该变换的MAC地址被表示为M’。
APID 218的第二部分是日期/时间206,它表示患者记录在系统中产生的时间。在一个示范实施例中,日期/时间206部分包括三个子部分以“mmddyy”形式的日期,以“hhmmss”形式的时间,和一个常数。使用日期/时间206部分是为了在该患者治疗的医院中提供唯一性。日期/时间206部分也要经过第二线性变换矩阵208变换,以防止通过一个给定的日期和时间推测出所有的患者。该第二线性变换矩阵208可以和应用于MAC地址202的第一线性变换矩阵204相同或不同。在示范实施例中,第二线性变换矩阵208可以是任何非奇异线性变换矩阵,如3×3矩阵或4×4矩阵。使用一个3×3矩阵作为例子,该定义的线性变换为LR3->R3×L(X)=AX在图2中,该线性变换208的输出,变换的日期/时间被表示为D’。M’和D’都被输入连接函数210,以便将两者连接起来,得到的输出被表示为M’D’。
APID 218的第三部分是匿名附加码212部分。该匿名附加码212部分包括三个子部分一个1到1000之间的随机数,一个20到40之间的循环数,和一个常数。每次匿名附加码产生时,循环数子部分增加1,一旦到40就回到20。使用匿名附加码212部分是为了防止被那些试图识别报告中提到的个别患者的个人预测到。这也可用于区分两个患者同时被同一家医院收治的情况。该匿名附加码212部分也要经过第三线性变换矩阵214变换。该第三线性变换矩阵214可以和应用于APID 218的MAC地址202及日期/时间206部分的线性变换矩阵204 208相同或不同。在示范实施例中,第三线性变换矩阵214可以是任何非奇异线性变换矩阵,如3×3矩阵或4×4矩阵。使用一个3×3矩阵作为例子,该定义的线性变换为LR3->R3×L(X)=AX在图2中,该线性变换214的输出,变换的匿名附加码被表示为S’。M’D’和S’都被输入连接函数216,以便将两者连接起来,得到的输出被表示为M’D’S’,这就是APID 218。
然后该APID 218被送经加密程序220,产生一个加密APID 222,接着该加密APID 222存储在患者记录224上。当要求在报告中加一个APID 218时,使用对应于加密程序220的解密程序226将加密APID 222变换成未加密APID 218。然后将该未加密APID 218存储在或者连接到送到用于公共数据提炼的数据库去的报告上。上述线性变换矩阵可以因医院而异,但是为了变换方便一般是固定的。在示范实施例中,用于MAC地址202的第一线性变换矩阵204对于所有的应用是相同的,而其它线性变换矩阵208 214因医院而异,通过产品升级改变。
图3描述了一个数据流变换成典型的编码APID 218的过程。在框302内的数据是一个样本MAC地址202,样本第一线性变换矩阵204,“LT”,和变换的MAC地址M’。框304中包括一个样本日期/时间206,样本第二线性变换矩阵208,“LT”,和变换的日期/时间D’。框306中包括一个样本匿名附加码212,样本第三线性变换矩阵214,“LT”,和变换的匿名附加码S’。框308中包含通过将三个数值M’,D’和S’连接在一起得到的APID 218。框310中包含一个样本加密APID 222。图3中描述的数值和形式可作为例子说明利用本发明产生APID的一种方法,每种应用会包括不同的线性变换矩阵,并且可能包括日期/时间206和匿名附加码212的不同数据格式。另外,该MAC地址用来唯一地识别一种计算机系统,能够唯一识别一种计算机系统的任何标识符都可以用来代替MAC地址。另外,任何本领域所熟知的加密软件都可在本发明的实施例中使用。
本发明的实施例允许产生一个唯一的匿名的患者标识符,该标识符加在医疗报告上,用于在不暴露患者身份的前提下将关于单个患者的报告分组。这提供了一种将匿名患者医疗数据聚集在一起以用于公共数据提炼的安全机制。通过在APID 218中包括MAC地址,该地址是分配给每个系统的唯一存在的数字字母数值,可以使用不同的互斥系统提供匿名患者医疗数据,而系统之间不会产生重复的APID 218。日期/时间206和匿名附加码的使用可帮助确保在一个系统中APID 218不重复。能够产生唯一APID 218,就可提供更有意义的数据提炼,因为和一个患者有关的报告可以作为一组进行评估和分析。而防止一个公共数据检索者通过报告追溯到个人的能力对于保护患者隐私是很重要的。在将医疗报告送到数据库之前,通过用一个APID 218代替患者数据来处理该医疗报告,并且产生一个不能追溯到患者个人的APID218,这样就可以做到了。提供对按照各个患者分组的数据报告的公共数据检索访问,可以提供更好的信息供医药公司和医院使用,以改进医疗程序和产品。
如上所述,本发明的实施例可以表现为计算机执行过程和实施该过程的装置的形式。本发明的实施例也可表现为计算机程序代码的形式,这些程序代码包含在有形媒体,如软盘,光盘,硬盘或任何其它计算机可读存储媒体内的指令,其中,当计算机程序代码由计算机载入并执行时,该计算机就变成实施该发明的装置。本发明的实施例也可表现为计算机程序代码的形式,例如,无论存储在存储媒体中,由计算机载入和/或执行,还是通过一些传输媒体传输,如通过电线或电缆,通过光纤,或通过电磁辐射,其中当计算机代码由计算机载入并执行时,该计算机就变成实施该发明的装置。当在通用微型计算机上执行时,计算机程序代码段设定该微型计算机,以生成专用逻辑电路。
尽管上面参考示范实施例阐述了本发明,那些本领域的技术人员应当理解可以在不超出本发明的范围的条件下,对其中的元素进行各种变化及替换等效物。另外,在不超出其主要范围的条件下可以进行很多变化,以使得特定的情况和原料和本发明的教义相适应。因此,这意味着本发明不限于特定的实施例,该实施例作为实施该发明预期最好的模式而公开,但是本发明包括落在所附权利要求范围内的所有实施例。而且,术语第一,第二等等的使用不表示任何次序或重要性,而只是用来将一个元素和另一个区分开。
权利要求
1.用于在患者数据采集中产生匿名的方法,该方法包含接收包括患者识别数据在内的患者医疗报告;检索患者记录(224),以获得对应于所述患者的匿名患者标识符(218),其中当检索到所述匿名患者标识符(218),则检索返回所述匿名患者标识符(218),如没有检索到所述匿名患者标识符(218),则所述检索返回空值;假如所述检索返回空值,则产生对应于所述患者的所述匿名患者标识符(218);将所述匿名患者标识符(218)加入所述医疗报告;将所述患者识别数据从所述医疗报告中去除;和将经过所述去除的所述医疗报告传送到数据库。
2.根据权利要求1所述的方法,其中所述匿名患者标识符(218)包括媒体访问控制地址(202)部分,日期/时间(206)部分,和匿名附加码(212)部分的线性变换。
3.根据权利要求2所述的方法,其中所述日期/时间(206)部分包括月,日,年,时,分,秒,对应于所述患者第一次进入的时间。
4.根据权利要求2所述的方法,其中所述匿名附加码(212)部分包括一个循环数,每次产生一个新的所述附加码(212)时,该循环数递增。
5.根据权利要求2所述的方法,其中所述线性变换包括非奇异矩阵。
6.根据权利要求5所述的方法,其中所述矩阵是一个n×n矩阵。
7.根据权利要求1所述的方法,其中所述产生匿名患者标识符(218)包括接收媒体访问控制地址(202);对所述媒体访问控制地址(202)应用第一线性变换矩阵(204),得到变换的媒体访问控制地址;接收日期/时间(206);对所述日期/时间(206)应用第二线性变换矩阵(208),得到变换的日期/时间;接收匿名附加码(212);对所述匿名附加码(212)应用第三线性变换矩阵(214),得到变换的匿名附加码;连接所述变换的媒体访问控制地址,所述变换的日期/时间和所述变换的匿名附加码,得到所述匿名患者标识符(218);对所述匿名患者标识符(218)进行加密,得到加密的匿名患者标识符(222);和将所述加密的匿名患者标识符(222)存储在所述患者记录(224)中。
8.用于在患者数据采集中产生匿名的方法,该方法包含接收包括患者识别数据在内的患者医疗报告;检索患者记录(224),以获得对应于所述患者的匿名患者标识符(218),其中当检索到所述匿名患者标识符(218)时,则检索返回所述匿名患者标识符(218),如没有检索到所述匿名患者标识符(218),则所述检索返回空值;假如所述检索返回空值,则产生对应于所述患者的所述匿名患者标识符(218),其中所述产生包括接收媒体访问控制地址(202);对所述媒体访问控制地址(202)应用第一线性变换矩阵(204),得到变换的媒体访问控制地址;接收日期/时间(206);对所述日期/时间(206)应用第二线性变换矩阵(208),得到变换的日期/时间;接收匿名附加码(212);对所述匿名附加码(212)应用第三线性变换矩阵(214),得到变换的匿名附加码;连接所述变换的媒体访问控制地址,所述变换的日期/时间和所述变换的匿名附加码,得到所述匿名患者标识符(218);对所述匿名患者标识符(218)进行加密,得到加密的匿名患者标识符(222);和将所述加密的匿名患者标识符(222)存储在所述患者记录(224)中;将所述匿名患者标识符(218)加入所述医疗报告;将所述患者识别数据从所述医疗报告中去除;和将经过所述去除的所述医疗报告传送到数据库。
9.用于在患者数据采集中产生匿名的系统,该系统包含网络;和与所述网络通讯的主机系统,所述主机系统包括执行以下方法的软件,所述方法包括通过所述网络,接收包括患者识别数据在内的患者医疗报告;检索患者记录(224),以获得对应于所述患者的匿名患者标识符(218),其中当检索到所述匿名患者标识符(218)时,则检索返回所述匿名患者标识符(218),如没有检索到所述匿名患者标识符(218),则所述检索返回空值;假如所述检索返回空值,则产生对应于所述患者的所述匿名患者标识符(218);将所述匿名患者标识符(218)加入所述医疗报告;将所述患者识别数据从所述医疗报告中去除;和通过所述网络,将经过所述去除的所述医疗报告传送到数据库。
10.根据权利要求9所述的系统,其中所述网络是因特网。
全文摘要
用于在患者数据采集中产生匿名的方法。该方法包含接收包括患者识别数据在内的患者医疗报告。检索患者记录(224),以获得对应于该患者的匿名患者标识符(218)(APID),其中当检索到APID(218),则检索返回该APID(218),如没有检索到APID(218),则检索返回空值。假如检索返回空值,则产生对应于该患者的APID(218)。将该APID(218)加入医疗报告,并且将患者识别数据从该医疗报告中去除。将经过所述去除的该医疗报告传送到数据库。
文档编号G06F19/00GK1497488SQ200310102478
公开日2004年5月19日 申请日期2003年10月22日 优先权日2003年10月22日
发明者C·布拉克特, V·J·阿南德, C 布拉克特, 阿南德 申请人:Ge医疗系统信息技术公司