基于相似性的患者主索引数据合并方法及装置与流程

文档序号：22550759发布日期：2020-10-17 02:26阅读：来源：国知局

技术特征：

1.一种基于相似性的患者主索引数据合并方法，其特征在于，包括：

获取医院信息系统服务器上传的用户信息数据；其中，所述用户信息数据至少包括姓名、性别、出生日期、证件类型、证件号码、联系电话、地址；

根据预先设置的第一字段值提取策略获取所述用户信息数据中对应的当前第一字段值，以当前第一字段值为检索条件获取对应的初次筛选后数据集合；其中，所述初次筛选后数据集合中包括若干条初次筛选后数据，每一初次筛选后数据中至少包括姓名、性别、出生日期、证件类型、证件号码、联系电话、地址；

将所述用户信息数据按照预设的数据调整策略进行数据调整得到调整用户信息数据，获取所述调整用户信息数据与所述初次筛选后数据集合中各条初次筛选后数据的相似度，以获取对应的相似度集合；其中，所述数据调整策略用于对用户信息数据中的姓名、性别、出生日期、证件类型、证件号码、联系电话进行字符调整和矫正；

获取所述相似度集合中的最大相似度以作为目标相似度，获取所述目标相似度对应的目标筛选数据；

判断所述目标相似度是否大于预先设置的第一相似度阈值；以及

若所述目标相似度大于所述第一相似度阈值，将所述用户信息数据对应的交叉索引与所述目标筛选数据对应的主索引进行关联。

2.根据权利要求1所述的基于相似性的患者主索引数据合并方法，其特征在于，所述判断所述目标相似度是否大于预先设置的第一相似度阈值之后，还包括：

若所述目标相似度小于或等于所述第一相似度阈值，判断所述目标相似度是否大于预先设置的第二相似度阈值；其中，所述第二相似度阈值小于所述第一相似度阈值；

若所述目标相似度小于或等于所述第一相似度阈值且所述目标相似度大于所述第二相似度阈值，将所述用户信息数据发送至人工处理数据存储区域；

若所述目标相似度小于或等于所述第二相似度阈值，将所述用户信息数据存储至对应新建存储区域。

3.根据权利要求1所述的基于相似性的患者主索引数据合并方法，其特征在于，所述将所述用户信息数据按照预设的数据调整策略进行数据调整得到调整用户信息数据，获取所述调整用户信息数据与所述初次筛选后数据集合中各条初次筛选后数据的相似度，以获取对应的相似度集合，包括：

获取所述用户信息数据根据数据调整策略调整后的姓名与所述初次筛选后数据中的姓名之间对应的第一相似度结果；其中，所述初次筛选后数据为所述初次筛选后数据集合其中一条数据；

获取所述用户信息数据根据数据调整策略调整后的性别与所述初次筛选后数据中的性别之间对应的第二相似度结果；

获取所述用户信息数据根据数据调整策略调整后的出生日期与所述初次筛选后数据中的出生日期之间对应的第三相似度结果；

获取所述用户信息数据根据数据调整策略调整后的证件类型与所述初次筛选后数据中的证件类型之间对应的第四相似度结果；

获取所述用户信息数据根据数据调整策略调整后的证件号码与所述初次筛选后数据中的证件号码之间对应的第五相似度结果；

获取所述用户信息数据根据数据调整策略调整后的联系号码与所述初次筛选后数据中的联系号码之间对应的第六相似度结果；

获取所述用户信息数据根据数据调整策略调整后的地址与所述初次筛选后数据中的地址之间对应的第七相似度结果；

获取第一相似度结果对应的第一权重值、获取第二相似度结果对应的第二权重值、获取第三相似度结果对应的第三权重值、获取第四相似度结果对应的第四权重值、获取第五相似度结果对应的第五权重值、获取第六相似度结果对应的第六权重值、获取第七相似度结果对应的第七权重值，根据综合相似度＝第一相似度结果中取值*第一权重值+第二相似度结果中取值*第二权重值+第三相似度结果中取值*第三权重值+第四相似度结果中取值*第四权重值+第五相似度结果中取值*第五权重值+第六相似度结果中取值*第六权重值+第七相似度结果中取值*第七权重值，获取所述用户信息数据与所述初次筛选后数据对应的综合相似度。

4.根据权利要求3所述的基于相似性的患者主索引数据合并方法，其特征在于，所述获取所述用户信息数据根据数据调整策略调整后的姓名与所述初次筛选后数据中的姓名之间对应的第一相似度结果，包括：

判断所述用户信息数据中的姓名是否为中文字符串；

若所述用户信息数据中的姓名为中文字符串，将所述用户信息数据中的姓名转化为第一大写中文拼音字符串，将所述初次筛选后数据中的姓名转化为第二大写中文拼音字符串；

通过字符串编辑距离获取所述第一大写中文拼音字符串与所述第二大写中文拼音字符串之间的相似度，以作为第一相似度结果。

5.根据权利要求4所述的基于相似性的患者主索引数据合并方法，其特征在于，所述判断所述用户信息数据中的姓名是否为中文字符串之后，还包括：

若所述用户信息数据中的姓名为英文字符串，将所述用户信息数据中的姓名转化为第一大写英文字符串，将所述初次筛选后数据中的姓名转化为第二大写英文字符串；

通过字符串编辑距离获取第一大写英文字符串与所述第二大写英文字符串之间的相似度，以作为第一相似度结果。

6.根据权利要求3所述的基于相似性的患者主索引数据合并方法，其特征在于，所述获取所述用户信息数据根据数据调整策略调整后的出生日期与所述初次筛选后数据中的出生日期之间对应的第三相似度结果，包括：

调用预先存储的标准出生日期格式，将所述用户信息数据中的出生日期调整为第一调整后出生日期；

判断所述第一调整后出生日期中是否有预设的敏感英文字符；其中，所述预设的英文字符包括i、l、o、o、b；

若所述第一调整后出生日期中有所述敏感英文字符，将所述第一调整后出生日期中的敏感英文字符调整为对应的矫正数字，得到第二调整后出生日期；

将所述第二调整后出生日期中的间隔符移除，以得到对应的第三调整后出生日期；

将所述初次筛选后数据中的出生日期中的间隔符移除，以得到对应的目标调整后出生日期；

获取所述第三调整后出生日期与所述目标调整后出生日期之间的相似度，以作为第三相似度结果。

7.根据权利要求3所述的基于相似性的患者主索引数据合并方法，其特征在于，所述获取所述用户信息数据根据数据调整策略调整后的证件号码与所述初次筛选后数据中的证件号码之间对应的第五相似度结果，包括：

判断所述用户信息数据中的证件号码中是否包括英文字符；

若所述用户信息数据中的证件号码中包括英文字符，判断所述用户信息数据中的证件号码中所包括的英文字符是否在末位；

若所述用户信息数据中的证件号码中所包括的英文字符未在末位，将该英文字符移动至证件号码的末位，得到矫正后证件号码；

获取所述矫正后证件号码与所述初次筛选后数据中的证件号码之间的相似度，以作为第五相似度结果。

8.一种基于相似性的患者主索引数据合并装置，其特征在于，包括：

用户信息数据获取单元，用于获取医院信息系统服务器上传的用户信息数据；其中，所述用户信息数据至少包括姓名、性别、出生日期、证件类型、证件号码、联系电话、地址；

初次筛选单元，用于根据预先设置的第一字段值提取策略获取所述用户信息数据中对应的当前第一字段值，以当前第一字段值为检索条件获取对应的初次筛选后数据集合；其中，所述初次筛选后数据集合中包括若干条初次筛选后数据，每一初次筛选后数据中至少包括姓名、性别、出生日期、证件类型、证件号码、联系电话、地址；

相似度集合获取单元，用于将所述用户信息数据按照预设的数据调整策略进行数据调整得到调整用户信息数据，获取所述调整用户信息数据与所述初次筛选后数据集合中各条初次筛选后数据的相似度，以获取对应的相似度集合；其中，所述数据调整策略用于对用户信息数据中的姓名、性别、出生日期、证件类型、证件号码、联系电话进行字符调整和矫正；

目标筛选数据获取单元，用于获取所述相似度集合中的最大相似度以作为目标相似度，获取所述目标相似度对应的目标筛选数据；

第一相似度阈值判断单元，用于判断所述目标相似度是否大于预先设置的第一相似度阈值；以及

主索引关联单元，用于若所述目标相似度大于所述第一相似度阈值，将所述用户信息数据对应的交叉索引与所述目标筛选数据对应的主索引进行关联。

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于相似性的患者主索引数据合并方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于相似性的患者主索引数据合并方法。

技术总结
本发明公开了基于相似性的患者主索引数据合并方法、装置、计算机设备及存储介质，涉及大数据的数据处理和智慧医疗，包括根据第一字段值提取策略获取用户信息数据对应的当前第一字段值，以其为检索条件获取对应的初次筛选后数据集合；将用户信息数据进行数据调整后获取与各条初次筛选后数据的相似度，以获取对应的相似度集合；获取相似度集合中的最大相似度以作为目标相似度，获取目标相似度对应的目标筛选数据；判断目标相似度是否大于第一相似度阈值；若大于则将用户信息数据对应的交叉索引与目标筛选数据对应的主索引进行关联。该方法实现了对用户信息数据的自动矫正后与历史相似数据合并索引，提高了数据处理效率，而且降低了人工成本。

技术研发人员：郭国斌;曾书勤
受保护的技术使用者：平安国际智慧城市科技股份有限公司
技术研发日：2020.06.30
技术公布日：2020.10.16

完整全部详细技术资料下载

当前第2页1 2