用于对关于骨科的文本分类的方法、电子设备和存储介质与流程

文档序号:30983554发布日期:2022-08-03 01:06阅读:来源:国知局

技术特征:
1.一种用于对关于骨科的文本分类的方法,包括:提取关于骨科的文本中的多个语句中的每个语句的关键信息;从所提取的关键信息中识别骨科词元素,以便形成骨科词元素集合,所述骨科词元素与解剖部位、病理学改变、根手术、产品品类和限定词中的至少一项相关联;基于预定的组合模式,将骨科词元素集合中的多个骨科词元素进行组合,以形成备选标签集合,所述备选标签集合包括多个备选标签,预定组合模式包括与手术相关的第一组合模式和与疾病相关第二组合模式;将备选标签集合中的每一备选标签与预定骨科知识图谱中的骨科实体数据相匹配,以便基于匹配结果确定目标标签,骨科实体数据至少包括:手术相关实体数据和疾病相关实体数据;响应于确定目标标签对应的组合模式为第一组合模式,将关于骨科的文本对应的类别确定为手术类别;以及响应于确定目标标签对应的组合模式为第二组合模式,将关于骨科的文本对应的类别确定为疾病类别。2.根据权利要求1所述的方法,其中第一组合模式包括:将与解剖部位相关联的骨科词元素和一个与根手术相关联的骨科词元素组合以形成备选标签;或者将与解剖部位相关联的骨科词元素和一个与根手术相关联的骨科词元素、以及与限定词相关联的骨科词元素、与产品品类相关联的骨科词元素、与限定词相关联的骨科词元素和与病理学改变相关联的骨科词元素中的至少一个组合,以形成备选标签;以及第二组合模式包括:将一个与解剖部位相关联的骨科词元素和一个与病理学改变相关联的骨科词元素组合以形成备选标签。3.根据权利要求1所述的方法,其中提取关于骨科的文本中的多个语句中的每个语句的关键信息包括:对每个语句进行切词处理以得到初始词元素集合,所述初始词元素集合包括多个初始词元素;基于多个初始词元素和预定骨科词库,经由双向匹配算法,得到多个目标词元素;根据目标词元素的词性,确定多个目标词元素之间的语义依赖关系;以及根据多个目标词元素之间的语义依赖关系提取语句的关键信息,所述关键信息包括语句中的主语、谓语和宾语中的至少一项。4.根据权利要求1所述的方法,还包括:以骨科实体数据作为节点、以骨科关系数据作为边构建骨科知识图谱,骨科实体数据包括手术名称、疾病名称,骨科关系数据包括解剖部位名称、治疗方法名称和病理学改变名称;以及查询骨科知识图谱以确定与目标标签对应的目标节点;以及输出与目标节点对应的解剖部位名称、治疗方法名称和病理学改变名称中的至少一项。5.根据权利要求1所述的方法,其中提取关于骨科的文本中的多个语句中的每个语句的关键信息包括:
识别关于骨科的文本中的多个段落;识别每一个段落对应的主题信息;确定每一个段落对应的主题信息是否属于感兴趣的主题信息,感兴趣的主题信息包括以下至少一项:体检信息、诊疗信息、住院信息、病情信息、注意事项、手术操作信息;以及响应于确定所述段落对应的主题信息属于感兴趣的主题信息,提取所述段落中的多个语句中的每个语句的关键信息。6.根据权利要求5所述的方法,其中识别每一个段落对应的主题信息包括:基于识别模型识别每一个段落对应的主题信息,所述识别模型经由预定骨科文本库训练,预定骨科文本库指示分别与体检信息、诊疗信息、住院信息、病情信息、注意事项和手术操作信息中的至少一项相关联的标签,所述识别模型基于vdcnn模型和lstm模型所构建。7.根据权利要求1所述的方法,其中基于预定的组合模式,将骨科词元素集合中的多个骨科词元素进行组合,以形成备选标签集合包括:将骨科词元素集合中的多个骨科词元素进行去重操作;将经由去重操作的骨科词元素进行组合以形成备选标签集合。8.根据权利要求1所述的方法,其中关于骨科的文本包括以下至少一项:骨科病例文本、骨科知识文章、基于对骨科实操视频识别得到的文本。9.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8中任一项所述的方法。10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被机器执行时实现根据权利要求1至8中任一项所述的方法。

技术总结
本公开的实施例涉及用于对关于骨科的文本分类的方法、电子设备和存储介质。在该方法中,提取关于骨科的文本中的多个语句中的每个语句的关键信息;从所提取的关键信息中识别骨科词元素,以便形成骨科词元素集合;基于预定的组合模式,将骨科词元素集合中的多个骨科词元素进行组合,以形成备选标签集合;将备选标签集合中的每一备选标签与预定骨科知识图谱中的骨科实体数据相匹配,以便基于匹配结果确定目标标签;将关于骨科的文本对应的类别确定为手术类别;以及将关于骨科的文本对应的类别确定为疾病类别。其可以显著提高标签标注的效率,并极大提高标签标注的准确性。并极大提高标签标注的准确性。并极大提高标签标注的准确性。


技术研发人员:邹金勇 沈忠美
受保护的技术使用者:北京欧应科技有限公司
技术研发日:2022.06.29
技术公布日:2022/8/2
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1