体检项目推荐方法、装置、计算机设备及存储介质与流程

文档序号:37643752发布日期:2024-04-18 18:08阅读:12来源:国知局
体检项目推荐方法、装置、计算机设备及存储介质与流程

本发明涉及智能医疗处理领域,尤其涉及一种体检项目推荐方法、装置、计算机设备及存储介质。


背景技术:

1、随着人们生活质量的提高,体检成为人们生活中的一部分。定期检查身体健康状态,发现隐藏疾病或者健康问题,成为很多人每年必做的功课。然而,医疗系统涉及较多的医疗专业领域术语,普通人采用的一般为自然语言,如何基于自然语言进行体检项目的个性化精准推荐,成了一个难题。现有方式中有些是采用对自然语言直接提取关键词进行匹配的方式。

2、发明人在实现本发明的过程中发现现有方式至少存在如下问题:关键词很多与专业术语相差过大,这使得难以获取到用户的真实需求,使得体检项目推荐不够精准。


技术实现思路

1、本发明实施例提供一种体检项目推荐方法、装置、计算机设备和存储介质,以提高体检项目推荐的精准性。

2、为了解决上述技术问题,本技术实施例提供一种体检项目推荐方法,包括:

3、获取历史体检报告结论库,并对所述历史体检报告结论库中的体检报告结论进行分词处理,得到基础分词;

4、通过医学知识的深度学习实体识别的方式,识别出所述基础分词中的医学特征词,得到目标分词,其中,所述目标分词包括疾病关键词和健康关键词;

5、根据所述历史体检报告结论库、所述疾病关键词和健康关键词,构建体检匹配规则引擎;

6、在接收到体检咨询请求时,从所述体检咨询请求中获取目标关键词,并将所述目标关键词与所述体检匹配规则引擎进行规则匹配,得到体检项目推荐结果。

7、可选地,所述对所述历史体检报告结论库中的体检报告结论进行分词处理,得到基础分词包括:

8、获取预设的训练语料库,并使用n-gram模型对所述预设的训练语料库进行分析,得到所述预设的训练语料库的词序列数据;

9、对所述体检报告结论中的语句进行分词解析,得到m个分词序列;

10、针对每个所述分词序列,依据所述预设的训练语料库的词序列数据,计算每个分词序列的发生概率,得到m个分词序列的发生概率;

11、从m个所述分词序列的发生概率中,选取达到预设概率阈值的发生概率对应的所述分词序列,作为基础分词序列,并将基础分词序列中的每个分词,作为所述基础分词。

12、可选地,所述基于所述疾病词库,通过医学知识的深度学习实体识别的方式,识别出所述基础分词中的医学特征词,得到目标分词包括:

13、读取预置的医学术语库的标签序列;

14、采用所述n-gram模型,对所述基础分词进行词性标注,得到词性标注单元;

15、删除词性为虚词的词性单元,得到词性为实词的词性标注单元,将所述词性为实词的词性标注单元作为目标单元;

16、遍历所述预置的医学术语库,查询与所述目标单元对应的标签分类,作为目标分类;

17、将目标分类为医学特征词的目标单元对应的基础分词,作为所述目标分词。

18、可选地,在所述通过医学知识的深度学习实体识别的方式,识别出所述基础分词中的医学特征词,得到目标分词之后,所述体检项目推荐方法还包括:

19、基于预设语料库,构建每个所述目标分词的基础词向量;

20、针对每个所述基础词向量,计算该基础词向量与其他每个基础词向量之间的空间距离,将每个所述空间距离对应的两个基础词向量作为一组词向量;

21、若所述空间距离小于预设距离阈值,则确定所述空间距离对应的一组词向量为近义词向量,并获取所述近义词向量对应的两个目标分词,作为一组近义词;

22、将每组近义词进行合并处理,得到更新后的目标分词。

23、可选地,所述从所述体检咨询请求中获取目标关键词,包括:

24、向客户端用户发送健康调查问卷,所述健康调查问卷包括用户的既往病史、家族病史和当前状况的至少一项;

25、接收客户端用户的反馈信息,并采用分词和实体识别的方式从所述反馈信息中提取目标关键词。

26、为了解决上述技术问题,本技术实施例还提供一种体检项目推荐装置,包括:

27、分词处理模块,用于获取历史体检报告结论库,并对历史体检报告结论库中的体检报告结论进行分词处理,得到基础分词;

28、实体识别模块,用于通过医学知识的深度学习实体识别的方式,识别出基础分词中的医学特征词,得到目标分词,其中,目标分词包括疾病关键词和健康关键词;

29、规则引擎构建模块,用于根据历史体检报告结论库、疾病关键词和健康关键词,构建体检匹配规则引擎;

30、结果推荐模块,用于在接收到体检咨询请求时,从体检咨询请求中获取目标关键词,并将目标关键词与体检匹配规则引擎进行规则匹配,得到体检推荐结果。

31、可选地,所述分词处理模块包括:

32、语料获取单元,用于获取预设的训练语料库,并使用n-gram模型对预设的训练语料库进行分析,得到预设的训练语料库的词序列数据;

33、分词解析单元,用于对体检报告结论中的语句进行分词解析,得到m个分词序列;

34、概率计算单元,用于针对每个分词序列,依据预设的训练语料库的词序列数据,计算每个分词序列的发生概率,得到m个分词序列的发生概率;

35、分词筛选单元,用于从m个分词序列的发生概率中,选取达到预设概率阈值的发生概率对应的分词序列,作为基础分词序列,并将基础分词序列中的每个分词,作为基础分词。

36、可选地,所述实体识别模块包括:

37、序列读取单元,用于读取预置的医学术语库的标签序列;

38、词性标注单元,用于采用n-gram模型,对基础分词进行词性标注,得到词性标注单元;

39、词性筛选单元,用于删除词性为虚词的词性单元,得到词性为实词的词性标注单元,将词性为实词的词性标注单元作为目标单元;

40、标签分类单元,用于遍历预置的医学术语库,查询与目标单元对应的标签分类,作为目标分类;

41、分词筛选单元,用于将目标分类为医学特征词的目标单元对应的基础分词,作为目标分词。

42、可选地,体检推荐装置还包括:

43、词向量构建单元,用于基于预设语料库,构建每个目标分词的基础词向量;

44、空间距离计算单元,用于针对每个基础词向量,计算该基础词向量与其他每个基础词向量之间的空间距离,将每个空间距离对应的两个基础词向量作为一组词向量;

45、分组单元,用于若空间距离小于预设距离阈值,则确定空间距离对应的一组词向量为近义词向量,并获取近义词向量对应的两个目标分词,作为一组近义词;

46、合并单元,用于将每组近义词进行合并处理,得到更新后的目标分词。

47、可选地,所述结果推荐模块包括:

48、问卷发送单元,用于向客户端用户发送健康调查问卷,健康调查问卷包括用户的既往病史、家族病史和当前状况的至少一项;

49、实体识别单元,用于接收客户端用户的反馈信息,并采用分词和实体识别的方式从反馈信息中提取目标关键词。

50、为了解决上述技术问题,本技术实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述体检项目推荐方法的步骤。

51、为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述体检项目推荐方法的步骤。

52、本发明实施例提供的体检项目推荐方法、装置、计算机设备及存储介质,通过获取历史体检报告结论库,并对历史体检报告结论库中的体检报告结论进行分词处理,得到基础分词;通过医学知识的深度学习实体识别的方式,识别出基础分词中的医学特征词,得到目标分词,其中,目标分词包括疾病关键词和健康关键词;根据历史体检报告结论库、疾病关键词和健康关键词,构建体检匹配规则引擎;在接收到体检咨询请求时,从体检咨询请求中获取目标关键词,并将目标关键词与体检匹配规则引擎进行规则匹配,得到体检项目推荐结果。实现快速判断识别体检需求,提高体检项目推荐的精准性和效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1