本发明涉及人工智能,尤其涉及一种基于协同过滤的数据推送方法和装置。
背景技术:
1、随着人工智能技术的发展,国内外人工智能领域的企业和高等院所在深度学习、知识图谱、表示学习、图计算等领域不断有新的算法模型被提出和开源,为医学场景的智能化应用也提供了技术支撑。医疗领域中,医院也开始了高速的信息化建设。医院将医疗大数据,人工智能(ai)等先进的技术应用到临床和科研领域中,推动人工智能治疗新技术,新方法,建立快速精准的智能医疗体系,探索智能医院建设。
2、目前,针对临床决策辅助系统多是将已有的知识库、规则库,使用规则推理机,实现疾病决策。这种决策方式,主要依赖于初始专家库的建立,并且需要数据的归一化,否则会面临没有结果输出或者偏离的问题。然而,以上系统数据需要人工导入,依赖于his系统中的数据,无法共享真实世界中的病案信息,同时上述系统也无法考虑医生的经验,无法实现推送内容个性化。
技术实现思路
1、本发明提供了一种基于协同过滤的数据推送方法和装置,以实现系统推送方案实现个性化推送的技术效果。
2、为了解决上述技术问题,本发明提供了一种基于协同过滤的数据推送方法,包括以下步骤:
3、获得用户输入的医疗检测数据,并调取预设的文本解析模型对所述医疗检测数据进行数据预处理,获得第一医疗数据;
4、基于预设的文本分类算法和关系抽取算法依次对所述第一医疗数据进行文本分类和临床诊断关系确定,获得所述第一医疗数据中临床数据与诊断数据之间的相似系数,并根据所述相似系数对所述第一医疗数据进行筛选获得诊断候选集;
5、基于预设的医学知识库对所述第一医疗数据进行推荐画像,获得相应推荐画像,并基于协同过滤算法根据所述推荐画像对诊断候选集进行筛选排序,获得并推送相应推荐结果。
6、本发明提供的数据推送方法在获得了用户输入的医疗监测数据即医生主诉以及病人的既往史、现病史和检查监测等数据后,首先通过系统中预设的文本解析模型对上述数据进行数据预处理,便于后续系统对处理后获得的第一医疗数据进行文本分类和关系抽取。同时,在对数据进行正式处理之前对其首先进行数据预处理时,系统还将在执行数据预处理步骤时对数据进行一轮筛查,以此确定其中是否存在错误数据,提高输出的推送数据的准确性,同时也降低了过量的错误数据导致后续系统对其进行数据处理时发生故障的概率。
7、获得了第一医疗数据后,系统将基于文本分类算法和关系抽取算法对第一医疗数据进行文本分类和临床诊断关系确定,获得对应临床数据和诊断数据之间的相似系数,进而根据相似系数对第一医疗数据筛选获得诊断候选集。系统通过上述两种方法中的文本分类算法将第一医疗数据中的各类文本按照一定的分类方式划分成各类数据集,包括临床数据集和诊断数据集,继而通过关系抽取算法将以上两类数据集中各项数据之间的关联关系进一步确定,再根据确定相似系数对第一医疗数据进行筛选,进一步提高了输出的推荐结果的准确性以及个性化程度,以使输出的推荐结果与用户输入的病例情况符合度更高。
8、同时,系统在筛选获得了诊断候选集之后,还将基于医学知识库中的各项历史医疗数据对第一医疗数据中的各项病例内容进行推荐画像,进而获得各类不同的推荐画像,再通过各类推荐画像对各类相应的诊断候选集进行进一步筛选排序,提高了输出的推荐结果的权威性和实用性,使得推荐结果更符合用户输入病例的真实情况,同时也提高了推荐结果的个性化程度,使得其更符合病例的真实需求。
9、作为优选例子,所述调取预设的文本解析模型对所述医疗检测数据进行数据预处理,获得第一医疗数据,具体为:
10、基于所述医学知识库,通过分词模型和命名实体识别模型依次对所述医疗检测数据进行分词处理和关键词识别处理,获得对应的医疗检测知识信息;
11、基于医学规则库对所述医疗检测知识信息进行关系识别和确定,获得所述医疗检测知识信息中各项实体与实体之间的关联关系,并根据确定的关联关系对所述医疗检测知识信息进行整合获得所述第一医疗数据。
12、为了进一步提高系统推送的推荐结果的准确性,本发明提供的数据推送方法在对医疗数据进行正式处理之前还将对医疗数据进行数据预处理,而对数据进行预处理则包括对数据进行分词处理和关键词识别处理,以此将医疗数据中的大量繁杂文本文档内容简化,提取获得其中的重要信息包括症状、体征等医学知识信息,即医疗检测知识。
13、同时,系统还将通过医学规则库对提取获得的医疗检测知识进行关系识别和确定,即对医疗检测知识中提取出来的各类实体之间的关系进行识别确定,以医学数据库中预设的各类医学诊断规则作为基础对实体关系进行识别确定,并将识别确定的关系以及实体整合生成相应第一医疗数据提供给系统后续数据处理。
14、作为优选例子,所述基于预设的文本分类算法和关系抽取算法以此对所述第一医疗数据进行文本分类和临床诊断关系确定,获得所述第一医疗数据中临床数据与诊断数据之间的相似系数,具体包括:
15、调取所述文本分类算法根据所述医学知识库对所述第一医疗数据进行知识特征归一和多标签类型识别,确定所述第一医疗数据中各项病例的所属疾病类别;
16、同时,通过所述关系抽取算法对所述第一医疗数据中病例的诊断数据和临床数据之间的关系进行识别确定并对识别确定的关系进行频率统计,获得关系频率数据,进而根据预设的诊断推荐相关性矩阵计算获得所述相似系数。
17、在输出了第一医疗数据后,系统则将针对第一医疗数据进行正式数据处理,首先针对第一医疗数据通过文本分类算法对数据进行知识特征归一和多标签类型识别,即确定医疗数据中各项病例的所属疾病类型,包括内科、外科或者儿科等疾病类型。
18、然后,系统还将通过关系抽取算法对医疗数据中的诊断数据和临床数据进行关系识别确定以及频率统计确定,通过频率统计数据确定诊断数据与临床表现之间的关系,以此确定临床表现与诊断结果的对应关系,提高了后续相似系数的准确性。
19、作为优选例子,所述基于预设的医学知识库对所述第一医疗数据进行推荐画像,获得相应推荐画像,具体包括:
20、从所述医学知识库中调取历史病例数据,并根据所述历史病例数据对所述第一医疗数据中的用户病例数据进行病例画像,获得病例推荐画像;
21、从所述医学知识库中调取历史检验数据,并根据所述历史检验数据对所述第一医疗数据中的检测检验数据进行检验画像,获得检验推荐画像;
22、从所述医学知识库中调取历史处方数据,并根据所述历史处方数据对所述第一医疗数据中的处方用药数据和辅助治疗数据进行推荐画像,获得处方推荐数据和辅助推荐数据。
23、为了进一步提高系统推送的推荐方法的符合度和准确性,本发明提供的数据推送方法在计算确定了相似系数后,还将基于系统内预设的医学知识库对第一医疗数据中各类数据进行推荐画像,为筛选输出推荐结果提供参考数据。
24、系统将第一医疗数据中的各类数据划分为用户病例数据、检测检验数据、处方用药数据和辅助治疗数据,并按照上述分类方式从医学知识库中调取对应的历史医疗数据进行推荐画像,通过医学知识库中的专家诊断病例提高推荐画像的权威性和专家诊断经验,同时医学知识库中还包括当前季节流行病的概率统计结果以及季节性特征以及当前社会发病特征,通过上述特征内容对第一医疗数据中的各类数据进行推荐画像,还提高了输出的推荐画像与用户输入病例真实情况的相符性,使得输出的推荐结果更贴合病例的真实情况。
25、作为优选例子,在所述获得用户输入的医疗检测数据之前,还包括:
26、采集并获取待处理医学知识,通过分词算法、词性标注算法和依存句法分析算法对所述待处理医学知识进行文本预处理获得第一关键词,同时调取预设的深度学习模型对所述待处理医学知识进行命名实体识别,获得第一知识点;
27、调取词向量相似度算法对所述第一关键词和所述第一知识点进行归一化和标准化处理,输出并将相应标准知识实体作为特征实体在所述待处理医学知识中进行主题词抽取获得相应第一主题词;
28、对所述第一知识点中的实体进行关系识别标注,获得第一实体关系,进而基于预训练模型,根据所述第一主题词、所述第一实体关系和所述标准知识实体构建所述医学知识库。
29、为了更进一步提高系统输出的推荐结果的准确性和实用性,本发明所提供的数据推送方法还提供了一种医学知识库的构建方法。通过采集获得待处理医学知识,再通过分词算法、词性标注算法和依存句法分析算法对待处理医学知识进行文本预处理获得第一关键词,包括各类疾病名称、检查名称,治疗方案,症状,体征等临床表现,提高了第一关键词的准确性和具体性。同时还将通过深度学习模型对待处理医学知识进行命名实体识别,输出第一知识点,通过深度学习模型的强大学习能力提高针对医学知识的识别能力,提高识别出的知识点内容与医学知识数据之间的匹配程度。
30、然后,系统调取词向量相似度算法对第一关键词和第一知识点进行归一化和标准化处理,降低了输出的标准知识实体中同类词不同表达的概率,便于系统后续的识别处理和关系标注。同时,系统还将根据标准知识实体对待处理医学知识进行主题词抽取,进一步对待处理医学知识中的关键性词语进行筛选识别,避免出现重要词语丢失导致构建的医学知识库出现错误知识的情况,进而降低了系统基于医学知识库推送推荐结果出现差异性过大的可能性。
31、抽取获得第一主题词后,系统则调取预训练模型对关系标注获得的第一实体关系、第一主题词以及标准知识实体进行训练,通过训练模型中多层注意力机制强大的语言表征学习能力和特征提取能力对上述零散的知识进行整合提取和参数学习,实现了知识的领域化。同时,通过上述预训练模型构建的医学知识库也实现了知识的迁移和自动更新。
32、作为优选例子,在所述获得用户输入的医疗检测数据之前,还包括:
33、采集获取待处理医学规则,通过正则表达式对所述待处理医学规则进行结构化分析,构建输出相应医学规则库;
34、同时,采集获取待处理诊断病例和待处理检验报告,并根据所述待处理诊断病例和所述待处理检验报告进行矩阵相关性分析,输出相应诊断推荐相关性矩阵。
35、为了进一步提高系统输出推荐结果的实用性和准确性,本发明还提供了一种医学规则库构建方法和相关性矩阵构建方法,通过构建的医学规则库诊断推荐相关性矩阵提高了系统对医疗数据进行数据处理的精准性和效率,进而提高了系统输出推荐结果的效率。
36、相应的,本发明还提供了一种基于协同过滤的数据推送装置,所述数据推送装置包括数据预处理模块、数据筛选模块和协同过滤模块;
37、其中,所述数据预处理模块用于获得用户输入的医疗检测数据,并调取预设的文本解析模型对所述医疗检测数据进行数据预处理,获得第一医疗数据;
38、所述数据筛选模块用于基于预设的文本分类算法和关系抽取算法依次对所述第一医疗数据进行文本分类和临床诊断关系确定,获得所述第一医疗数据中临床数据与诊断数据之间的相似系数,并根据所述相似系数对所述第一医疗数据进行筛选获得诊断候选集;
39、所述协同过滤模块用于基于预设的医学知识库对所述第一医疗数据进行推荐画像,获得相应推荐画像,并基于协同过滤算法根据所述推荐画像对诊断候选集进行筛选排序,获得并推送相应推荐结果。
40、作为优选例子,所述数据推送装置还包括知识库构建模块;
41、其中,所述知识库构建模块用于采集并获取待处理医学知识,通过分词算法、词性标注算法和依存句法分析算法对所述待处理医学知识进行文本预处理获得第一关键词,同时调取预设的深度学习模型对所述待处理医学知识进行命名实体识别,获得第一知识点;
42、调取词向量相似度算法对所述第一关键词和所述第一知识点进行归一化和标准化处理,输出并将相应标准知识实体作为特征实体在所述待处理医学知识中进行主题词抽取获得相应第一主题词;
43、对所述第一知识点中的实体进行关系识别标注,获得第一实体关系,进而基于预训练模型,根据所述第一主题词、所述第一实体关系和所述标准知识实体构建所述医学知识库。
44、作为优选例子,所述数据推送装置还包括规则库构建模块和矩阵构建模块;
45、其中,所述规则库构建模块用于采集获取待处理医学规则,通过正则表达式对所述待处理医学规则进行结构化分析,构建输出相应医学规则库;
46、所述矩阵构建模块用于采集获取待处理诊断病例和待处理检验报告,并根据所述待处理诊断病例和所述待处理检验报告进行矩阵相关性分析,输出相应诊断推荐相关性矩阵。
47、作为优选例子,所述数据预处理模块调取预设的文本解析模型对所述医疗检测数据进行数据预处理,获得第一医疗数据,具体为:
48、基于所述医学知识库,通过分词模型和命名实体识别模型依次对所述医疗检测数据进行分词处理和关键词识别处理,获得对应的医疗检测知识信息;
49、基于医学规则库对所述医疗检测知识信息进行关系识别和确定,获得所述医疗检测知识信息中各项实体与实体之间的关联关系,并根据确定的关联关系对所述医疗检测知识信息进行整合获得所述第一医疗数据。