医学词语映射方法、装置、计算机设备及存储介质与流程

文档序号:27832158发布日期:2021-12-07 22:34阅读:101来源:国知局
医学词语映射方法、装置、计算机设备及存储介质与流程

1.本技术实施例涉及计算机技术领域,特别涉及一种医学词语映射方法、装置、计算机设备及存储介质。


背景技术:

2.随着计算机技术的发展,语义识别的技术应用越来越广泛。例如,在医疗场景下,采用语义识别技术,能够将用户输入的口语化的症状描述语句映射为医学词语,以便后续能够根据医学词语来为用户提供就诊服务。但是,由于仅能输出症状描述语句对应的医学词语,输出的信息量较少。


技术实现要素:

3.本技术实施例提供了一种医学词语映射方法、装置、计算机设备及存储介质,能够提高医学词语映射过程中输出的信息量。所述技术方案如下:
4.一方面,提供了一种医学词语映射方法,所述方法包括:
5.调用词语映射模型,对症状描述语句进行映射,得到所述症状描述语句对应的医学词语,以及所述症状描述语句中的每个词语的权重;
6.将所述症状描述语句分割成多个语句片段,每个语句片段中包括多个词语;
7.基于每个语句片段中的词语的权重,分别确定所述每个语句片段的权重;
8.将所述多个语句片段中最大权重对应的语句片段,确定为导致所述症状描述语句被映射为所述医学词语的目标语句片段;
9.输出所述医学词语以及所述目标语句片段。
10.可选地,所述继续选取以第二词语为起始词语且数量为所述第一数量的词语,构成一个语句片段之前,所述方法还包括:
11.确定小于第三数量与所述第一数量之差的所述第二数量,所述第三数量为所述症状描述语句中的词语的数量。
12.可选地,所述调用所述词语映射模型中的词语编码网络,对所述症状描述语句中的每个词语进行编码,得到所述症状描述语句中的每个词语的词向量,包括:
13.调用所述词语编码网络,对所述症状描述语句进行分词,得到所述症状描述语句中的每个词语;
14.调用所述词语编码网络,对所述每个词语进行编码,得到所述每个词语的词向量。
15.可选地,所述调用所述特征映射网络,对所述样本语句特征进行映射,得到所述多个参考医学词语对应的样本预测概率,包括:
16.调用所述词语映射模型,对所述样本语句特征进行特征变换,得到样本参考特征,所述样本参考特征包括多个维度的样本特征值,每个维度与一个参考医学词语对应;
17.将所述样本参考特征中所述每个维度的样本特征值,分别确定为所述每个维度对应的参考医学词语所对应的样本预测概率。
18.另一方面,提供了一种医学词语映射装置,所述装置包括:
19.映射模块,用于调用词语映射模型,对症状描述语句进行映射,得到所述症状描述语句对应的医学词语,以及所述症状描述语句中的每个词语的权重;
20.语句分割模块,用于将所述症状描述语句分割成多个语句片段,每个语句片段中包括多个词语;
21.权重确定模块,用于基于每个语句片段中的词语的权重,分别确定所述每个语句片段的权重;
22.语句片段确定模块,用于将所述多个语句片段中最大权重对应的语句片段,确定为导致所述症状描述语句被映射为所述医学词语的目标语句片段;
23.输出模块,用于输出所述医学词语以及所述目标语句片段。
24.可选地,所述语句分割模块,用于:
25.按照所述症状描述语句中的词语排列顺序,选取以第一词语为起始词语且数量为第一数量的多个词语,构成一个语句片段,所述第一词语为所述症状描述语句中的任一个词语,所述第一数量为大于1的整数;
26.继续选取以第二词语为起始词语且数量为所述第一数量的多个词语,构成一个语句片段,其中所述第二词语为位于所述第一词语之后,且与所述第一词语间隔第二数量的词语,直至已构成包括所述症状描述语句中的最后一个词语的语句片段,所述第二数量为不小于0的整数。
27.可选地,所述装置还包括:
28.第一数量确定模块,用于将第三数量与目标比例的乘积确定为所述第一数量,所述第三数量为所述症状描述语句中的词语的数量,所述目标比例大于0且小于1。
29.可选地,所述装置还包括:
30.第二数量确定模块,用于确定小于第三数量与所述第一数量之差的所述第二数量,所述第三数量为所述症状描述语句中的词语的数量。
31.可选地,所述语句分割模块,包括:
32.标点符号确定单元,用于确定所述症状描述语句中的每个目标标点符号,所述目标标点符号为表示一个句子结束的标点符号;
33.语句分割单元,用于在所述症状描述语句中所确定的每个目标标点符号所在的位置进行分割,得到所述多个语句片段。
34.可选地,所述权重确定模块,用于将所述每个语句片段中的多个词语的权重之和,分别确定为所述每个语句片段的权重。
35.可选地,所述映射模块,用于:
36.第一编码单元,用于调用所述词语映射模型中的词语编码网络,对所述症状描述语句中的每个词语进行编码,得到所述症状描述语句中的每个词语的词向量;
37.第一特征提取单元,用于调用所述词语映射模型中的特征提取网络,对所述症状描述语句中的多个词语的词向量进行特征提取,得到所述每个词语的权重;
38.第一加权融合单元,用于调用所述词语映射模型中的加权融合网络,基于所述多个词语的权重,对所述多个词语的词向量进行加权融合,得到所述症状描述语句的语句特征;
39.第一映射单元,用于调用所述词语映射模型中的特征映射网络,对所述语句特征进行映射,得到所述医学词语。
40.可选地,所述第一编码单元,用于:
41.调用所述词语编码网络,对所述症状描述语句进行分词,得到所述症状描述语句中的每个词语;
42.调用所述词语编码网络,对所述每个词语进行编码,得到所述每个词语的词向量。
43.可选地,所述特征映射网络包括多个参考医学词语,每个参考医学词语用于描述一种症状;所述第一映射单元,用于:
44.调用所述特征映射网络,对所述语句特征进行映射,得到所述多个参考医学词语对应的预测概率,每个参考医学词语对应的预测概率用于表示所述参考医学词语为所述症状描述语句对应的医学词语的可能性;
45.在所述多个参考医学词语中,确定最大预测概率对应的参考医学词语。
46.可选地,所述第一映射单元,用于:
47.调用所述特征映射网络,对所述语句特征进行特征变换,得到参考特征,所述参考特征包括多个维度的特征值,每个维度与一个参考医学词语对应;
48.将所述参考特征中所述每个维度的特征值,分别确定为所述每个维度对应的参考医学词语对应的预测概率。
49.可选地,所述装置还包括:
50.获取模块,用于获取样本症状描述语句,以及所述样本症状描述语句的标注信息,所述标注信息包括与所述样本症状描述语句所描述的症状关联的医学词语;
51.训练模块,用于根据所述样本症状描述语句以及所述标注信息,对所述词语映射模型进行训练。
52.可选地,所述词语映射模型中的特征映射网络包括多个参考医学词语,所述训练模块,包括:
53.第二编码单元,用于调用所述词语映射模型中的词语编码网络,对所述样本症状描述语句中的每个样本词语进行编码,得到所述样本症状描述语句中的每个样本词语的词向量;
54.第二特征提取单元,用于调用所述词语映射模型中的特征提取网络,对所述样本症状描述语句中的多个样本词语的词向量进行特征提取,得到所述每个样本词语的权重;
55.第二加权融合单元,用于调用所述词语映射模型中的加权融合网络,基于所述多个样本词语的权重,对所述多个样本词语的词向量进行加权融合,得到所述样本症状描述语句的样本语句特征;
56.第二映射单元,用于调用所述特征映射网络,对所述样本语句特征进行映射,得到所述多个参考医学词语对应的样本预测概率;
57.训练单元,用于根据所述多个参考医学词语对应的样本预测概率及所述标注信息中的医学词语,对所述词语映射模型进行训练。
58.可选地,所述第二映射单元,用于:
59.调用所述词语映射模型,对所述样本语句特征进行特征变换,得到样本参考特征,所述样本参考特征包括多个维度的样本特征值,每个维度与一个参考医学词语对应;
60.将所述样本参考特征中所述每个维度的样本特征值,分别确定为所述每个维度对应的参考医学词语所对应的样本预测概率。
61.可选地,所述训练单元,用于:
62.将第一目标数值确定为所述标注信息中的医学词语的真实概率;
63.对于所述标注信息中的任一医学词语,将与所述医学词语相同的参考医学词语对应的样本预测概率,确定为所述医学词语对应的样本预测概率;
64.根据所述标注信息中的每个医学词语对应的样本预测概率和真实概率,确定所述词语映射模型的损失值;
65.根据所述损失值,对所述词语映射模型进行训练。
66.可选地,所述装置还包括:
67.概率确定模块,用于将第二目标数值,确定为所述多个参考医学词语中、未包含于所述标注信息中的参考医学词语对应的真实概率;
68.所述训练单元,用于:
69.根据所述标注信息中的每个医学词语对应的样本预测概率和真实概率,及未包含于所述标注信息中的参考医学词语对应的样本预测概率和真实概率,确定所述词语映射模型的损失值。
70.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的医学词语映射方法中所执行的操作。
71.另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的医学词语映射方法中所执行的操作。
72.另一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取所述计算机程序代码,处理器执行所述计算机程序代码,使得所述计算机设备实现如上述方面所述的医学词语映射方法中所执行的操作。
73.本技术实施例提供的方法、装置、计算机设备及存储介质,在对症状描述语句进行映射得到对应的医学词语的过程中,同时获取症状描述语句中的每个词语的权重,并基于词语的权重确定每个语句片段的权重,则权重最大的目标语句片段即为症状描述语句被映射为医学词语的论据,实现了医学词语映射过程的可解释性。并且,如果在单个词语中确定该论据,会由于词语过于分散,导致确定的论据不够准确,而本技术是在包括多个词语的语句片段中确定症状描述语句被映射为医学词语的论据,能够使医学词语映射过程的可解释性更加准确。
附图说明
74.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获
得其他的附图。
75.图1是本技术实施例提供的一种实施环境的示意图。
76.图2是本技术实施例提供的一种医学词语映射方法的流程图。
77.图3是本技术实施例提供的一种医学词语映射方法的流程图。
78.图4是本技术实施例提供的一种医学词语映射方法的流程图。
79.图5是本技术实施例提供的一种词语映射模型的训练方法的流程图。
80.图6是本技术实施例提供的一种获取标注信息的示意图。
81.图7是本技术实施例提供的一种医学词语映射装置的结构示意图。
82.图8是本技术实施例提供的另一种医学词语映射装置的结构示意图。
83.图9是本技术实施例提供的一种终端的结构示意图。
84.图10是本技术实施例提供的一种服务器的结构示意图。
具体实施方式
85.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
86.可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本技术的范围的情况下,可以将第一词语称为第二词语,且类似地,可将第二词语称为第一词语。
87.其中,至少一个是指一个或者一个以上,例如,至少一个词语可以是一个词语、两个词语、三个词语等任一大于等于一的整数个词语。多个是指两个或者两个以上,例如,多个词语可以是两个词语、三个词语等任一大于等于二的整数个词语。每个是指至少一个中的每一个,例如,每个词语是指多个词语中的每一个词语,若多个词语为3个词语,则每个词语是指3个词语中的每一个词语。
88.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
89.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
90.自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
91.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
92.本技术实施例提供的方案,根据人工智能的自然语言处理、机器学习等技术,利用词语映射模型,能够对症状描述语句映射为医学词语,并获取导致症状描述语句映射为医学词语的目标语句片段。
93.本技术实施例提供的医学词语映射方法,能够用于计算机设备中。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
94.在一种可能实现方式中,本技术实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。
95.区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
96.区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
97.平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基
本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
98.图1是本技术实施例提供的一种实施环境的示意图。该实施环境包括多个终端101(图1中以3个终端101为例)和服务器102。终端101和服务器102之间通过无线或有线网络连接。终端101上安装由服务器102提供服务的目标应用,终端101能够通过目标应用实现例如数据传输、消息交互等功能。可选地,目标应用为终端101操作系统中的目标应用,或者为第三方提供的目标应用。例如,目标应用为就诊指引应用,就诊指引应用具有指引功能,当然,该就诊指引应用还能够具有其他功能,例如,点评功能、内容分享功能、导航功能等。
99.每个终端101用于根据用户标识登录目标应用,通过目标应用向服务器102发送用户输入的症状描述语句,服务器102接收多个终端101发送的症状描述语句,并调用词语映射模型,对每个症状描述语句进行映射,得到每个症状描述语句对应的医学词语,并确定导致症状描述语句映射为医学词语的目标语句片段,然后将医学词语以及目标语句片段返回给对应的终端101,能够实现对任一终端101发送的症状描述语句进行映射。
100.本技术实施例提供的医学词语映射方法,可应用于多种场景。
101.例如,医生问诊场景下:终端中安装有就诊指引应用,该就诊指引应用对应的服务器中配置有词语映射模型。终端基于用户标识登录就诊指引应用,向该服务器发送输入的症状描述语句,服务器接收到该症状描述语句后,采用本技术实施例提供的方法,调用词语映射模型,对该症状描述语句进行映射,得到该症状描述语句对应的医学词语,并确定导致该症状描述语句被映射为该医学词语的目标语句片段,之后医生能够根据目标语句片段来评判将症状描述语句映射为该医学词语的准确性,后续医生还可以根据该医学词语结合用户的其他信息,来确定用户的身体状况。
102.例如,就诊指引场景下:终端中安装有就诊指引应用,该就诊指引应用对应的服务器中配置有词语映射模型。终端基于用户标识登录就诊指引应用,向该服务器发送输入的症状描述语句,服务器接收到该症状描述语句后,调用词语映射模型,对该症状描述语句进行映射,得到该症状描述语句对应的医学词语,并确定导致该症状描述语句被映射为该医学词语的目标语句片段,以及具有该医学词语所描述的症状的疾病所属的科室,将该医学词语、目标语句片段以及该科室或者该科室的医生返回至就诊指引应用,由终端通过该就诊指引应用进行显示,以使用户根据医学词语初步了解自己的身体状况,根据目标语句片段了解导致该医学词语的论据,并根据显示的科室或医生进行就诊。
103.图2是本技术实施例提供的一种医学词语映射方法的流程图。本技术实施例的执行主体为计算机设备,参见图2,该方法包括:
104.201、计算机设备调用词语映射模型,对症状描述语句进行映射,得到症状描述语句对应的医学词语,以及症状描述语句中的每个词语的权重。
105.症状描述语句是用于描述症状的语句。计算机设备中存储有词语映射模型,该词语映射模型用于将任一症状描述语句映射为对应的医学词语,症状描述语句所映射的医学词语是与该症状描述语句所描述的症状相关联的医学词语。
106.其中,症状描述语句中的每个词语的权重,用于表示对应的词语与该症状描述语句所描述的症状的关联程度。词语的权重越大,表示该词语与该症状描述语句所描述的症状的关联程度越大;词语的权重越小,表示该词语与该症状描述语句所描述的症状的关联
程度越小。
107.202、计算机设备将症状描述语句分割成多个语句片段。
108.其中,每个语句片段中包括多个词语。
109.203、计算机设备基于每个语句片段中的词语的权重,分别确定每个语句片段的权重。
110.其中,每个语句片段的权重表示对应的语句片段与该症状描述语句所描述的症状的关联程度。语句片段的权重越大,表示该语句片段与该症状描述语句所描述的症状的关联程度越大;语句片段的权重越小,表示该语句片段与该症状描述语句所描述的症状的关联程度越小。
111.204、计算机设备将多个语句片段中最大权重对应的语句片段,确定为导致症状描述语句被映射为医学词语的目标语句片段。
112.由于语句片段的权重表示该语句片段与该症状描述语句所描述的症状的关联程度。最大权重对应的语句片段,即为该多个语句片段中,与该症状描述语句所描述的症状的关联程度最大的语句片段,而症状描述语句所映射的医学词语是与该症状描述语句所描述的症状相关联的医学词语,因此,可以将该最大权重对应的语句片段,确定为导致症状描述语句被映射为医学词语的目标语句片段。
113.205、计算机设备输出医学词语以及目标语句片段。
114.计算机设备确定医学词语以及目标语句片段后,输出该医学词语和目标语句片段。该目标语句片段为症状描述语句被映射为医学词语的论据,因此通过输出目标语句片段,增加了输出的信息量,使得医学词语映射过程具有可解释性。
115.本技术实施例提供的方法,在对症状描述语句进行映射得到对应的医学词语的过程中,同时获取症状描述语句中的每个词语的权重,并基于词语的权重确定每个语句片段的权重,则权重最大的目标语句片段即为症状描述语句被映射为医学词语的论据,实现了医学词语映射过程的可解释性。并且,如果在单个词语中确定该论据,会由于词语过于分散,导致确定的论据不够准确,而本技术是在包括多个词语的语句片段中确定症状描述语句被映射为医学词语的论据,能够使医学词语映射过程的可解释性更加准确。
116.图3是本技术实施例提供的一种医学词语映射方法的流程图。本技术实施例的执行主体为计算机设备,参见图3,该方法包括:
117.301、计算机设备调用词语映射模型中的词语编码网络,对症状描述语句中的每个词语进行编码,得到症状描述语句中的每个词语的词向量。
118.计算机设备中存储有词语映射模型,该词语映射模型用于将任一症状描述语句映射为对应的医学词语。本技术实施例中,词语映射模型包括词语编码网络、特征提取网络、加权融合网络和特征映射网络。其中,词语编码网络用于对词语进行编码,得到词语的词向量。可选地,本技术实施例中使用的词语映射模型为根据下述图5的实施例提供的方法所训练的词语映射模型。
119.计算机设备获取症状描述语句,其中,该症状描述语句是用于描述症状的语句。可选地,症状描述语句为口语化的描述语句,例如,该症状描述语句为“我肚子痛”。该症状描述语句中包括多个词语,计算机设备调用词语映射模型中的词语编码网络,对该症状描述语句中的每个词语进行编码,得到每个词语的权重。其中,词语的词向量用于表示该词语的
特征。
120.在一种可能实现方式中,计算机设备调用词语编码网络,对症状描述语句进行分词,得到症状描述语句中的每个词语,调用该词语编码网络,对每个词语进行编码,得到每个词语的词向量。
121.302、计算机设备调用词语映射模型中的特征提取网络,对症状描述语句中的多个词语的词向量进行特征提取,得到每个词语的权重。
122.词语映射模型中的特征提取网络用于对词向量进行特征提取得到词语的权重。计算机设备得到症状描述语句中的多个词语的词向量后,调用该特征提取网络,对该多个词语的词向量进行特征提取,得到每个词语的权重。其中,每个词语的权重用于表示对应的词语与该症状描述语句所描述的症状的关联程度,权重越大,表示对应的词语与该症状描述语句所描述的症状的关联程度越大,权重越小,表示对应的词语与该症状描述语句所描述的症状的关联程度越小。
123.可选地,词语映射模型中的特征提取网络为enc

gen(encoder

generator,编码器

发生器),或者为soft atten(soft attention mechanism,软注意力机制)。
124.在一种可能实现方式中,计算机设备根据多个词语的词向量,确定一个目标向量,将每个词语的词向量与目标向量之间的相似度,确定为每个词语的权重。
125.可选地,计算机设备采用以下第一种方式、第二种方式或第三种方式中的任意一种方式,确定目标向量。
126.第一种方式:将多个词语的词向量之和,确定为目标向量。
127.第二种方式:根据多个词语的初始权重,对多个词语的词向量进行加权融合,得到目标向量。其中,初始权重是任意设置的权重,例如,每个词语的初始权重均为0.5,或者,在多个词语中不同词语对应的权重均为大于0小于1的数值。
128.第三种方式:根据多个词语在该症状描述语句中的位置,确定目标词语,将目标词语的向量,确定为目标向量。其中,目标词语为多个词语中的任一个词语,例如,该目标词语为多个词语中的第一个词语,或者,该目标词语为多个词语中的最后一个词语等。
129.可选地,计算机设备采用以下第四种方式、第五种方式或第六种方式中的任意一种方式,确定任一词语的词向量与目标向量之间的相似度。
130.第四种方式:采用以下公式确定相似度:
131.其中,q用于表示目标向量,k用于表示词语的向量,a(q,k)表示目标向量和词语的向量之间的相似度,也即是词语的权重。和w1用于表示两个不同的权重矩阵,[q;k]用于表示将目标向量和词语的向量进行拼接,tanh(
·
)用于表示双曲正切函数。
[0132]
第五种方式:采用以下公式确定相似度:a(q,k)=q
t
·
w
·
k;
[0133]
其中,q用于表示目标向量,k用于表示词语的向量,a(q,k)表示目标向量和词语的向量之间的相似度,也即是词语的权重。q
t
用于表示对目标向量进行转置,w用于表示权重矩阵。
[0134]
第六种方式:采用以下公式确定相似度:a(q,k)=q
t
·
k;
[0135]
其中,q用于表示目标向量,k用于表示词语的向量,a(q,k)表示目标向量和词语的
向量之间的相似度,也即是词语的权重。
[0136]
除此之外,计算机设备还可以采用自监督注意力机制来确定每个词语的权重,本技术实施例对采用何种方式确定词语的权重不做限定。
[0137]
303、计算机设备调用词语映射模型中的加权融合网络,基于多个词语的权重,对多个词语的词向量进行加权融合,得到症状描述语句的语句特征。
[0138]
词语映射模型中的加权融合网络用于对词向量进行加权融合得到语句特征。计算机设备得到每个词语的词向量,以及每个词语的权重,则调用词语映射模型中的加权融合网络,基于多个词语的权重,对多个词语的词向量进行加权融合,得到症状描述语句的语句特征,以使症状描述语句的语句特征中融合了多个词语的词向量。其中,症状描述语句的语句特征用于表示症状描述语句所包含的特征,可选地,该语句特征为语句特征矩阵或语句特征向量。
[0139]
由于词语的权重能够表示该词语与该症状描述语句所描述的症状的关联程度,因此基于多个词语的权重进行加权融合得到的语句特征中,突出了与该症状描述语句所描述的症状关联程度大的词语在语句特征中的影响,削弱与该症状描述语句所描述的症状关联程度小的词语在语句特征中的影响,从而提高了症状描述语句的语句特征的准确性。
[0140]
304、计算机设备调用词语映射模型中的特征映射网络,对语句特征进行映射,得到医学词语。
[0141]
词语映射模型中的特征映射网络用于将语句特征映射为医学词语。计算机设备得到症状描述语句的语句特征后,调用词语映射模型中的特征映射网络,对该语句特征进行映射,得到该症状描述语句对应的医学词语,该医学词语是与该症状描述语句所描述的症状相关联的医学词语。例如,该症状描述语句为“我肚子痛”,该症状描述语句对应的医学词语为“腹痛”或者“肠胃疾病”等。
[0142]
可选地,词语映射模型中的特征映射网络为wordcnn(word convolutional neural networks,词语卷积网络),或者为wordgru(word gate recurrent unit,词语循环神经网络)。
[0143]
在一种可能实现方式中,计算机设备调用特征映射网络,对语句特征进行映射,得到多个参考医学词语对应的预测概率,在多个参考医学词语中,确定最大预测概率对应的参考医学词语。其中,词语映射模型中的特征映射网络包括多个参考医学词语,每个参考医学词语用于描述一种症状。每个参考医学词语对应的预测概率用于表示参考医学词语为症状描述语句对应的医学词语的可能性,预测概率越大,对应的参考医学词语为症状描述语句对应的医学词语的可能性越大,预测概率越小,对应的参考医学词语为症状描述语句对应的医学词语的可能性越小。因此,计算机设备在多个参考医学词语中,确定最大预测概率对应的参考医学词语,该最大预测概率对应的参考医学词语,即为症状描述语句对应的医学词语,也即是将该症状描述语句映射为该医学词语。
[0144]
可选地,计算机设备调用特征映射网络,对语句特征进行特征变换,得到参考特征,参考特征包括多个维度的特征值,每个维度与一个参考医学词语对应,将参考特征中每个维度的特征值,分别确定为每个维度对应的参考医学词语对应的预测概率。
[0145]
参考特征包括多个维度的特征值,可选地,该参考特征为参考特征矩阵或者参考特征向量。参考特征中的每个维度与一个参考医学词语对应。可选地,多个参考医学词语在
该词语映射模型中按顺序排列,该参考特征包括的多个维度,按照顺序,与多个参考医学词语一一对应。例如,参考特征中的第一个维度,与按序排列的多个参考医学词语中的第一个医学词语对应,参考特征中的第二个维度,与按顺序排列的多个参考医学词语中的第二个医学词语对应。
[0146]
由于语句特征中包括症状描述语句所包含的特征,且症状描述语句用于描述症状,每个参考医学词语用于描述一种症状,则通过对该语句特征进行变换,以确定症状描述语句所描述的特征与每个参考医学词语描述的症状之间的相似度,得到参考特征包括的多个维度的特征值,每个维度的特征值即为对应的参考医学词语为症状描述语句对应的医学词语的可能性,即得到多个参考医学词语的预测概率。
[0147]
在步骤301

304中,以词语映射模型包括词语编码网络、特征提取网络、加权融合网络和特征映射网络为例,说明调用词语映射模型,对症状描述语句进行映射,得到症状描述语句对应的医学词语,以及症状描述语句中的每个词语的权重的过程。在另一实施例中,词语映射模型的结构还可以为其他形式,计算机设备可以采用其他方法,调用词语映射模型,对症状描述语句进行映射,得到症状描述语句对应的医学词语,以及每个词语的权重。由于本技术实施例的方案不限制词语映射模型的结构,因此实现了与词语映射模型解耦,也即是可以直接获取已训练的任一词语映射模型,来实现本技术实施例的方案。并且,本技术实施例的方案也不会增大词语映射模型的参数量,即使重新训练一个新的词语映射模型,在训练过程中也不会有额外的时间开销,不会影响词语映射模型的运行速度。
[0148]
305、计算机设备将症状描述语句分割成多个语句片段。
[0149]
其中,每个语句片段中包括多个词语。本技术实施例中,通过将症状描述语句分割成多个语句片段,由于每个语句片段中包括多个词语,而单个词语比较分散,因此相比于单个词语来说,语句片段中包括的信息量更多,且语句片段中的信息更加集中,使用语句片段来表示症状描述语句所描述的症状会更加准确。
[0150]
在一种可能实现方式中,计算机设备按照症状描述语句中的词语排列顺序,选取以第一词语为起始词语且数量为第一数量的多个词语,构成一个语句片段,该第一词语为症状描述语句中的任一个词语。计算机设备继续选取以第二词语为起始词语且数量为该第一数量的多个词语,构成一个语句片段,其中第二词语为位于第一词语之后,且与第一词语间隔第二数量的词语,直至已构成包括症状描述语句中的最后一个词语的语句片段。
[0151]
其中,第一数量为大于1的整数,第二数量为不小于0的整数。则计算机设备得到的多个语句片段中,每个语句片段包括连续的多个词语。可选地,相邻的语句片段中包括至少一个相同的词语。
[0152]
例如,第一词语为症状描述语句中的第一个词语,第二数量为0,也即是第一词语与第二词语相邻,第一词语与第二词语之间没有间隔其他词语。计算机设备选取以第一个词语为起始词语且数量为第一数量的多个词语,构成第一个语句片段。然后继续选取以第二个词语为起始词语且数量为第一数量的多个词语,构成第二个语句片段,继续选取以第三个词语为起始词语且数量为第一数量的多个词语,构成第三个语句片段,直至已构成包括症状描述语句中的最后一个词语的语句片段,也即是构成的最后一个语句片段中的最后一个词语,为症状描述语句中的最后一个词语。
[0153]
可选地,在按照症状描述语句中的词语排列顺序,选取以第一词语为起始词语且
数量为第一数量的词语,构成一个语句片段之前,计算机设备将第三数量与目标比例的乘积确定为第一数量,该第三数量为症状描述语句中的词语的数量,该目标比例大于0且小于1。本技术实施例中,计算机设备根据症状描述语句中词语的数量,确定每个语句片段中词语的数量,以保证语句片段中词语的数量与症状描述语句中词语的数量之间的比例为目标比例。例如,该目标比例为20%,症状描述语句中词语的数量为10个,也即是第三数量为10,则第三数量与目标比例的乘积为2,也即是第一数量为2,因此计算机设备分割得到的每个语句片段中,均包括2个词语。
[0154]
可选地,在继续选取以第二词语为起始词语且数量为第一数量的词语,构成一个语句片段之前,计算机设备确定小于第三数量与第一数量之差的第二数量,第三数量为症状描述语句中的词语的数量。为了确保对症状描述语句进行分割得到至少两个语句片段,且每个语句片段中均包括第一数量的词语,因此需要保证第二数量小于第三数量与第一数量之差,也即是相邻的两个语句片段中的起始词语之间间隔的词语数量小于第三数量与第一数量之差。例如,症状描述语句中词语的数量为10个,也即是第三数量为10,每个语句片段中词语的数量为3个,也即是第一数量为3,则第二数量小于7。
[0155]
可选地,采用滑动窗口的方式分割症状描述语句。确定滑动窗口,滑动窗口的长度等于第四数量的词语的长度;在滑动窗口中的第一个词语为症状描述语句中的第一个词语的情况下,选取滑动窗口中的词语,构成一个语句片段;将滑动窗口向后移动目标长度,目标长度等于第五数量的词语的长度,继续选取滑动窗口中的词语,构成一个语句片段,直至已构成包括症状描述语句中的最后一个词语的语句片段。第四数量为大于1的整数,第五数量为大于0的整数。
[0156]
例如,第四数量为2,第五数量为1,也即是滑动窗口的长度等于2个词语的长度,每个语句片段中包括2个词语,将滑动窗口向后移动1个词语,则继续构成一个语句片段。例如,症状描述语句包括的多个词语为:词语1、词语2、词语3、词语4和词语5,则分割得到的4个语句片段分别为:词语1和词语2、词语2和词语3、词语3和词语4、词语4和词语5。
[0157]
采用滑动窗口的方式来分割症状描述语句,得到的语句片段中包括连续的多个词语,因此语句片段中包括的信息量更多,且语句片段中的信息更加集中,使用语句片段来表示症状描述语句所描述的症状会更加准确。通过设置滑动窗口的长度和滑动窗口的移动长度,即可设置语句片段中包括的词语数量,以及每两个语句片段之间的距离,提高了分割症状描述语句的灵活性。
[0158]
在另一种可能实现方式中,计算机设备确定症状描述语句中的每个目标标点符号,在症状描述语句中所确定的每个目标标点符号所在的位置进行分割,得到多个语句片段。其中,目标标点符号为表示一个句子结束的标点符号,例如目标标点符号为句号、叹号、问号、下引号和句号的组合、下引号和叹号的组合、下引号和问号的组合等。也即是,计算机设备分割得到的每个语句片段,均为一个完整的句子,每个语句会包括连续的多个词语,从而每个语句片段包括连续的多个词语。采用目标标点符号的方式来分割症状描述语句,得到的语句片段中包括一个完整的句子,因此语句片段中的信息更加连贯且集中,进一步提高了使用语句片段来表示症状描述语句所描述的症状的准确性。通过识别症状描述语句中的目标标点符号,即可根据目标标点符号的位置分割症状描述语句,提高了分割症状描述语句的便捷性。
[0159]
例如,症状描述语句为:今天早上起床头晕目眩,恶心想吐。一周前有过感冒,嗓中会有浓痰,怀疑是慢性咽炎。而且前两天胃部不适,吃的较少。则分割得到的3个语句片段分别为:“今天早上起床头晕目眩,恶心想吐”、“我一周前有过感冒,嗓中会有浓痰,怀疑是慢性咽炎”、“而且前两天胃部不适,吃的较少”。
[0160]
306、计算机设备基于每个语句片段中的词语的权重,分别确定每个语句片段的权重。
[0161]
计算机设备确定每个词语的权重以及多个语句片段后,基于每个语句片段中的词语的权重,分别确定每个语句片段的权重,每个语句片段的权重表示对应的语句片段与该症状描述语句所描述的症状的关联程度。语句片段的权重越大,表示该语句片段与该症状描述语句所描述的症状的关联程度越大,语句片段的权重越小,表示该语句片段与该症状描述语句所描述的症状的关联程度越小。
[0162]
在一种可能实现方式中,计算机设备将每个语句片段中的多个词语的权重之和,分别确定为每个语句片段的权重。
[0163]
可选地,多个语句片段的权重满足以下关系:
[0164][0165]
其中,p
i
用于表示多个语句片段中第i个语句片段对应的权重,i用于表示多个语句片段的序号,序号i为大于等于1的正整数;k用于表示第i个语句片段中每个词语在症状描述语句中的序号,l用于表示每个语句片段中包含的词语数量,w
k
用于表示第k个词语对应的权重。
[0166]
可选地,计算机设备采用目标标点符号对症状描述语句进行分割,则多个语句片段的权重满足以下关系:
[0167][0168]
其中,p
i
用于表示多个语句片段中第i个语句片段对应的权重,i用于表示多个语句片段的序号,序号i为大于等于1的正整数;k用于表示第i个语句片段中每个词语在症状描述语句中的序号,k
i
用于表示第i个语句片段中的第一个词语在症状描述语句中的序号,l
i
用于表示第个语句片段中包含的词语数量,ω
k
用于表示第k个词语对应的权重。
[0169]
307、计算机设备将多个语句片段中最大权重对应的语句片段,确定为导致症状描述语句被映射为医学词语的目标语句片段。
[0170]
由于语句片段的权重表示该语句片段与该症状描述语句所描述的症状的关联程度。最大权重对应的语句片段,即为该多个语句片段中,与该症状描述语句所描述的症状的关联程度最大的语句片段,而症状描述语句所映射的医学词语是与该症状描述语句所描述的症状相关联的医学词语,因此,可以将该最大权重对应的语句片段,确定为导致症状描述语句被映射为医学词语的目标语句片段。
[0171]
308、计算机设备输出医学词语以及目标语句片段。
[0172]
计算机设备确定医学词语以及目标语句片段后,输出该医学词语和目标语句片段。该目标语句片段为症状描述语句被映射为医学词语的论据,因此通过输出目标语句片段,增加了输出的信息量,使得医学词语映射过程具有可解释性。
[0173]
在一种可能实现方式中,计算机设备确定医学词语以及目标语句片段后,显示该医学词语和目标语句片段。例如,该计算机设备为终端,步骤301中的症状描述语句是由医生或者用户输入的,该症状描述语句用于描述该用户的症状。终端确定医学词语以及目标语句片段后,显示该医学词语以及目标语句片段,医生即可根据显示的医学词语并结合用户的其他信息,来确定用户的身体状况。并且,由于目标语句片段是导致症状描述语句被映射为该医学词语的论据,因此医生还可以根据显示的目标语句片段,来评判该症状描述语句对应的医学词语的准确性。或者,该计算机设备为服务器,步骤301中的症状描述语句是由终端发送的,则在服务器确定医学词语以及目标语句片段后,将该医学词语以及目标语句片段发送给终端,由终端显示医学词语以及目标语句片段。
[0174]
在另一种可能实现方式中,计算机设备确定医学词语以及目标语句片段后,输出该医学词语以及目标语句片段,并将该医学词语以及目标语句片段作为下一阶段的输入,进行后续处理。例如,该医学词语为用于描述症状的第二医学词语,计算机设备根据该第二医学词语,确定与该第二医学词语对应的第一医学词语,第一医学词语为描述疾病的医学词语,从而显示该第一医学词语,由医生根据显示的第一医学词语并结合用户的其他信息,来确定用户的身体状况。或者,计算机设备继续查询包括第一医学词语与科室信息之间的对应关系的知识数据库,确定与第一医学词语匹配的科室信息,从而显示该科室信息,以便用户到该科室信息所指示的科室进行就诊,从而实现就诊指引的功能。该科室信息用于指示诊断该第一医学词语的科室,可选地,该科室信息包括属于该科室的医生信息。
[0175]
在本技术实施例中,症状描述语句为口语化的描述语句,即用口语化的语句来描述症状,医学词语为标准的医学实体,通过本技术实施例提供的词语映射模型,能够将症状描述语句映射到标准的医学词语,以实现口语化到标准化的精确转换,实现了医疗实体标准化(medical concept normalization),以便后续基于映射得到的标准化的医学词语进行后续处理。例如,将本技术实施例提供的方法应用到医疗预问诊系统中,能够将用户输入的口语化的或是表意不清的症状描述语句,准确地映射到对应的医学词语。并且,在将症状描述语句映射为医学词语的同时,在症状描述语句中抽取导致症状描述语句被映射为医学词语的目标语句片段,该目标语句片段在映射过程中起了决定性的作用,因此通过进行论据抽取(rationale extraction),实现了医学词语映射过程的可解释性。
[0176]
在本技术实施例中,在症状描述语句中抽取目标语句片段作为映射过程的论据,相比于抽取单个的词语作为映射过程的论据,能够避免由于词语过于分散,导致确定的论据不够准确的情况,能够提高论据抽取的准确性。例如,症状描述语句为“最近皮肤有点瘙痒,已经持续一个礼拜了”,如果采用抽取单个词语的方式,则抽取的论据为“瘙痒”,表意不明确。本技术实施例中采用抽取语句片段的方式,则抽取的论据为“皮肤有点瘙痒”,更加精准。
[0177]
图4是本技术实施例提供的一种医学词语映射方法的流程图,该方法包括:
[0178]
1、在词语映射模型对该症状描述语句进行分词,得到多个词语;
[0179]
2、调用词语映射模型中的词语编码网络对多个词语进行编码,得到每个词语的词向量;
[0180]
3、调用词语映射模型中的特征提取网络,对多个词向量进行特征提取,得到每个词语的权重;
[0181]
4、调用词语映射模型中的加权融合网络,基于多个词语的权重,对多个词语的词向量进行加权融合,得到语句特征;
[0182]
5、调用词语映射模型中的特征映射网络,对语句特征进行映射,得到多个医学词语的预测概率,选取最大预测概率对应的医学词语作为该症状描述语句对应的医学词语;
[0183]
6、根据多个词语的权重,分别确定多个语句片段的权重,选取最大权重对应的语句片段,作为导致症状描述语句被映射为该医学词语的目标语句片段;
[0184]
7、输出症状描述语句对应的医学词语以及该目标语句片段。
[0185]
本技术实施例提供的方法,在对症状描述语句进行映射得到对应的医学词语的过程中,同时获取症状描述语句中的每个词语的权重,并基于词语的权重确定每个语句片段的权重,则权重最大的目标语句片段即为症状描述语句被映射为医学词语的论据,实现了医学词语映射过程的可解释性。
[0186]
并且,如果在单个词语中确定该论据,会由于词语过于分散,导致确定的论据不够准确,而本技术是在包括多个词语的语句片段中确定症状描述语句被映射为医学词语的论据,能够使医学词语映射过程的可解释性更加准确。
[0187]
并且,采用滑动窗口的方式分割症状描述语句,得到的语句片段中包括连续的多个词语,相比于单个词语来说,语句片段中包括的信息量更多,且语句片段中的信息更加集中,使用语句片段来表示症状描述语句所描述的症状会更加准确。通过设置滑动窗口的长度和滑动窗口的移动长度,即可设置语句片段中包括的词语数量,以及每两个语句片段之间的距离,提高分割症状描述语句的灵活性。
[0188]
并且,采用目标标点符号的方式来分割症状描述语句,得到的语句片段中包括一个完整的句子,因此语句片段中的信息更加连贯且集中,进一步提高了使用语句片段来表示症状描述语句所描述的症状的准确性。通过识别症状描述语句中的目标标点符号,即可根据目标标点符号的位置分割症状描述语句,提高了分割症状描述语句的便捷性。
[0189]
并且,由于词语的权重能够表示该词语与该症状描述语句所描述的症状的关联程度,因此基于多个词语的权重进行加权融合得到的语句特征中,突出了与该症状描述语句所描述的症状关联程度大的词语在语句特征中的影响,削弱与该症状描述语句所描述的症状关联程度小的词语在语句特征中的影响,从而提高了症状描述语句的语句特征的准确性。
[0190]
为了比较本方案的论据抽取机制,在三份数据上进行了对比试验,并分别选取700条、900条和1137条标注数据作为训练数据,500条标注数据作为开发数据,1000条标注数据作为测试数据。对于词语映射模型中的特征映射网络为wordcnn或wordgru,以及词语映射模型中的特征提取网络为enc

gen或者soft atten,通过采用本技术的预训练的方式和不采用预训练的方式,以及采用滑动窗口的论据抽取机制和采用标点符号的论据抽取机制,分别确定mi(micro accuracy,微精度)和ma(macro accuracy,宏精度),如表1所示。表1中的window(窗口)表示采用滑动窗口的论据抽取机制,表1中的sentence(句子)表示采用标点符号的论据抽取机制。通过表1可知,在经过预训练的情况下,采用滑动窗口的论据抽取机制的wordgru比采用标点符号的论据抽取机制的wordgru提升了2%的mi和1%的ma。
[0191]
表1
[0192][0193]
图5是本技术实施例提供的一种词语映射模型的训练方法的流程图,其中,通过本技术实施例提供的方法所训练的词语映射模型,可以应用于上述图2或者图3的实施例提供的医学词语映射方法中。本技术实施例的执行主体为计算机设备,参见图5,该方法包括:
[0194]
501、计算机设备获取样本症状描述语句,以及样本症状描述语句的标注信息。
[0195]
样本症状描述语句是用于描述症状的语句,该样本症状描述语句与上述图3的实施例中的症状描述语句类似。标注信息包括与样本症状描述语句所描述的症状关联的医学词语。可选地,标注信息包括第一医学词语或第二医学词语中的至少一种,第一医学词语为用于描述疾病的词语,第二医学词语为用于描述症状的词语。例如,样本症状描述语句为“我肚子痛”,该标注信息中包括的医学词语为“腹痛”。
[0196]
在一种可能实现方式中,计算机设备中存储有词语标注模型,该词语标注模型用于为任一症状描述语句标注对应的医学词语。计算机设备获取样本症状描述语句后,调用词语标注模型对样本症状描述语句进行标注,得到该样本症状描述语句对应的医学词语,并将得到的医学词语作为标注信息。
[0197]
通过词语标注模型,能够实现对症状描述语句的自动标注,无需人为对症状描述语句进行标注,节省了人为标注的时间,提高了标注效率。
[0198]
在另一种可能实现方式中,计算机设备获取样本症状描述语句和对该样本症状描述语句的回复语句,基于回复语句中包含的医学词语,生成症状描述语句的标注信息。
[0199]
其中,对样本症状描述语句的回复语句是用于回复样本症状描述语句的语句,该回复语句中包含的医学词语与样本症状描述语句所描述的症状相关联。可选地,该回复语句是由医生针对样本症状描述语句回复的,例如,该回复语句为“腹痛可能是由多种原因造成的”。
[0200]
其中,对样本症状描述语句的回复语句中包含医学词语,且回复语句中包含的医学词语,与该样本症状描述语句关联。可选地,该回复语句中包含的医学词语为第一医学词语,且样本症状描述语句所描述的症状为该第一医学词语所描述的疾病具有的症状。例如,
回复语句中包含的医学词语为“肠胃疾病”,样本症状描述语句为“我肚子痛”,即回复语句中包含的医学词语为第一医学词语,且样本症状描述语句所描述的症状为该第一医学词语所指示的疾病具有的症状。可选地,该回复语句中包含的医学词语为第二医学词语,且该第二医学词语所描述的症状与样本症状描述语句所描述的症状相同。例如回复语句中包含的医学词语为“腹痛”,样本症状描述语句为“我肚子痛”。
[0201]
其中,基于回复语句中包含的医学词语,生成症状描述语句的标注信息包括以下三种方式:
[0202]
第一种方式:计算机设备对回复语句进行关键词提取,得到回复语句中的医学词语,将得到的医学词语构成标注信息。在本技术实施例中,回复语句中包含医学词语,采用关键词提取的方式,从回复语句中提取出该回复语句包含的医学词语,并将提取到的医学词语构成症状描述语句的标注信息。
[0203]
可选地,计算机设备对回复语句进行分词,得到至少一个词语,将至少一个词语,从知识数据库中查询至少一个词语包含的医学词语。其中,知识数据库包括至少一个医学词语。通过采用分词处理的方式,得到该回复语句包含的至少一个词语,将每个词语分别与知识数据库中包含的医学词语进行对比,以确定该至少一个词语中与知识数据库中包含的医学词语相同的词语,从而确定了该至少一个词语包含的医学词语,从而保证了确定的医学词语的准确性。
[0204]
第二种方式:计算机设备对回复语句进行关键词提取,得到回复语句中的第一医学词语及第二医学词语,根据第一医学词语,从知识数据库中查询第一医学词语对应的至少一个第二医学词语,将提取到的第二医学词语及查询到的第二医学词语,构成标注信息。在本技术实施例中,知识数据库包括第一医学词语与第二医学词语之间的对应关系,用于表示某种疾病具有的症状,可选地,该知识数据库为医疗知识图谱。例如,在知识数据库中,任一第一医学词语为“真菌感染”,该第一医学词语对应的第二词语为“红肿”。回复语句中包含第一医学词语及第二医学词语,第一医学词语为用于描述疾病的词语,第二医学词语为用于描述症状的词语。
[0205]
图6是本技术实施例提供的一种获取标注信息的示意图,如图6所示,任一回复语句为“皮疹可能是由真菌感染引起的”,通过对该回复语句进行关键词提取,得到该回复语句中的第一医学词语“真菌感染”及第二医学词语“皮疹”,并根据该第一医学词语,查询该知识数据库,确定该第一医学词语“真菌感染”对应的第二医学词语,将得到的所有第二医学词语,构成该回复语句对应的症状描述语句的标注信息。并且,在知识数据库中,第一医学词语与第二医学词语以三元组的形式存储,即第一医学词语、用于表示关系的词语及第二医学词语,如“真菌感染,症状,发红”,表示第一医学词语“真菌感染”的某种症状为第二医学词语“发红”。
[0206]
可选地,计算机设备对回复语句进行分词,得到至少一个词语,根据至少一个词语,从知识数据库中查询至少一个词语包含的第一医学词语及第二医学词语。通过采用分词处理的方式,得到该回复语句包含的至少一个词语,将每个词语分别与知识数据库中包含的医学词语进行对比,以确定该至少一个词语中与知识数据库中包含的医学词语相同的词语,从而确定了该至少一个词语包含的第一医学词语及第二医学词语,从而保证了确定的医学词语的准确性。
[0207]
第三种方式:计算机设备对回复语句进行关键词提取,得到回复语句中的第一医学词语,根据第一医学词语,从知识数据库中查询第一医学词语对应的至少一个第二医学词语,将查询到的第二医学词语,构成标注信息。该过程与上述第二种方式同理,在此不再赘述。
[0208]
在另一种可能实现方式中,计算机设备获取样本症状描述语句,以及对该样本症状描述语句进行人工标注得到的标注信息。
[0209]
502、计算机设备调用词语映射模型中的词语编码网络,对样本症状描述语句中的每个样本词语进行编码,得到样本症状描述语句中的每个样本词语的词向量。
[0210]
503、计算机设备调用词语映射模型中的特征提取网络,对样本症状描述语句中的多个样本词语的词向量进行特征提取,得到每个样本词语的权重。
[0211]
504、计算机设备调用词语映射模型中的加权融合网络,基于多个样本词语的权重,对多个样本词语的词向量进行加权融合,得到样本症状描述语句的样本语句特征。
[0212]
其中,上述步骤502

504的过程与上述步骤301

303的过程同理,在此不再一一赘述。
[0213]
505、计算机设备调用词语映射模型中的特征映射网络,对样本语句特征进行映射,得到多个参考医学词语对应的样本预测概率。
[0214]
其中,词语映射模型中的特征映射网络包括多个参考医学词语,每个参考医学词语用于描述一种症状。每个参考医学词语对应的样本预测概率用于表示参考医学词语为样本症状描述语句对应的医学词语的可能性,样本预测概率越大,对应的参考医学词语为样本症状描述语句对应的医学词语的可能性越大,样本预测概率越小,对应的参考医学词语为样本症状描述语句对应的医学词语的可能性越小。
[0215]
在一种可能实现方式中,计算机设备调用词语映射模型,对样本语句特征进行特征变换,得到样本参考特征,样本参考特征包括多个维度的样本特征值,每个维度与一个参考医学词语对应;将样本参考特征中每个维度的样本特征值,分别确定为每个维度对应的参考医学词语所对应的样本预测概率。其中,在步骤505中确定样本预测概率的过程与上述步骤304中确定预测概率的过程同理,在此不再一一赘述。
[0216]
506、计算机设备根据多个参考医学词语对应的样本预测概率及标注信息中的医学词语,对词语映射模型进行训练。
[0217]
由于多个参考医学词语对应的样本预测概率用于表示对应的参考医学词语为样本症状描述语句对应的医学词语的可能性,且标注信息中的医学词语为样本症状描述语句对应的医学词语,则通过该多个参考医学词语的样本预测概率及标注信息中的医学词语,能够确定该词语映射模型的准确率,从而对该词语映射模型进行训练,以提高该词语映射模型的准确性。
[0218]
在一种可能实现方式中,计算机设备将第一目标数值确定为标注信息中的医学词语的真实概率,对于标注信息中的任一医学词语,将与医学词语相同的参考医学词语对应的样本预测概率,确定为医学词语对应的样本预测概率,根据标注信息中的每个医学词语对应的样本预测概率和真实概率,确定词语映射模型的损失值,根据损失值,对词语映射模型进行训练。
[0219]
其中,第一目标数值为任意的数值,例如,该第一目标数值为1,标注信息中包括至
少一个医学词语,每个医学词语可能与一个参考医学词语相同,则对于标注信息中的任一医学词语,将与该医学词语相同的参考医学词语对应的样本预测概率,确定为该医学词语对应的样本预测概率,以表示该医学词语为该症状描述语句对应的医学词语的可能性。
[0220]
在得到标注信息中每个医学词语对应的真实概率和样本预测概率后,每个医学词语的真实概率表示对应的医学词语为样本症状描述语句所对应的医学词语,则通过该标注信息中的医学词语对应的真实概率和样本预测概率,能够确定每个医学词语对应的真实概率与样本预测概率之间的差异,从而能够确定该词语映射模型的损失值,通过该损失值对词语映射模型进行训练,以提高词语映射模型的准确性。
[0221]
可选地,获取词语映射模型的损失值的过程包括:在得到标注信息中的每个医学词语对应的样本预测概率之后,还将第二目标数值,确定为多个参考医学词语中、未包含于标注信息中的参考医学词语对应的真实概率,根据标注信息中的每个医学词语对应的样本预测概率和真实概率,及未包含于标注信息中的参考医学词语对应的样本预测概率和真实概率,确定词语映射模型的损失值。
[0222]
其中,第二目标数值为任意的数值,例如,该第二目标数值为0。在多个参考医学词语中,未包含于标注信息中的参考医学词语所描述的症状与样本症状描述语句所描述的症状无关。在确定未包含于标注信息中的参考医学词语的真实概率后,即确定了标注信息中的每个医学词语对应的样本预测概率和真实概率,及未包含于标注信息中的参考医学词语对应的样本预测概率和真实概率,则根据每个医学词语对应的样本预测概率与真实概率之间的差异,及每个参考医学词语对应的样本预测概率与真实概率之前的差异,能够确定词语映射模型的损失值。
[0223]
可选地,在确定标注信息中的每个医学词语对应的样本预测概率和真实概率,及未包含于标注信息中的参考医学词语对应的样本预测概率和真实概率后,也即是确定了多个参考医学词语对应的样本预测概率和真实概率,将多个参考医学词语对应的真实概率,构成真实特征,可选地,该真实特征为真实特征向量,或者,为真实特征矩阵。该真实特征包括多个维度的特征值,每个维度与一个参考医学词语对应,每个维度的特征值为对一个的参考医学词语的真实概率,则词语映射模型的损失值满足以下关系:
[0224][0225]
其中,用于表示词语映射模型的损失值,用于表示真实特征,σ(
·
)用于表示sigmoid(逻辑回归)函数,用于将数值映射到(0,1);υ用于表示样本症状描述语句的语句特征;w用于表示词语映射模型中的特征变换矩阵;t用于表示对矩阵的转置;v
·
w
t
用于表示参考特征。
[0226]
上述步骤502

505说明了根据样本症状描述语句以及标注信息,对词语映射模型进行训练的过程。需要说明的是,本技术实施例仅是以一个轮次来说明对词语映射模型的训练过程,而在另一实施例中,获取多个样本症状描述语句和对每个样本症状描述语句的标注信息,重复上述步骤502

506,对词语映射模型进行迭代训练,响应于迭代伦次达到第一阈值,停止对该词语映射模型进行训练;或者,响应于当前迭代轮次得到的损失值不大于第二阈值,停止对词语映射模型进行训练。其中,第一阈值和第二阈值均为任意的数值,例如,第一阈值为10或15等,第二阈值为0.4或0.3等。
[0227]
需要说明的是,上述根据多个参考医学词语对应的样本预测概率及标注信息中的医学词语,对词语映射模型进行训练的过程,是在多个参考医学词语包括标注信息中的医学词语的情况下进行说明的,而在另一实施例中,在得到样本症状描述语句的标注信息后,响应于标注信息中的任一医学词语不包含于该多个参考医学词语中,将该医学词语确定为参考医学词语,更新词语映射模型中包括的多个参考医学词语,并在更新词语映射模型包含的参考医学词语之后,按照上述步骤301

304,重新对词语映射模型进行训练。
[0228]
本技术实施例提供的方法,通过采用样本症状描述语句和对应的标注信息训练词语映射模型,后续采用训练后的词语映射模型,能够实现对症状描述语句的映射,得到症状描述语句对应的医学词语,实现了对症状描述语句的标准化映射。
[0229]
并且,通过样本症状描述语句和对该样本症状描述语句的回复语句,自动确定样本症状描述语句的标注信息,根据样本症状描述语句和标注信息对该词语映射模型进行训练,在此训练过程中,无需人为对症状描述语句进行标注,实现了对词语映射模型的无监督训练,能够减轻词语映射模型对人工标注的数据的依赖,提高了词语映射模型的准确性。
[0230]
图7是本技术实施例提供的一种医学词语映射装置的结构示意图。参见图7,该装置包括:
[0231]
映射模块701,用于调用词语映射模型,对症状描述语句进行映射,得到症状描述语句对应的医学词语,以及症状描述语句中的每个词语的权重;
[0232]
语句分割模块702,用于将症状描述语句分割成多个语句片段,每个语句片段中包括多个词语;
[0233]
权重确定模块703,用于基于每个语句片段中的词语的权重,分别确定每个语句片段的权重;
[0234]
语句片段确定模块704,用于将多个语句片段中最大权重对应的语句片段,确定为导致症状描述语句被映射为医学词语的目标语句片段;
[0235]
输出模块705,用于输出医学词语以及目标语句片段。
[0236]
本技术实施例提供的医学词语映射装置,在对症状描述语句进行映射得到对应的医学词语的过程中,同时获取症状描述语句中的每个词语的权重,并基于词语的权重确定每个语句片段的权重,则权重最大的目标语句片段即为症状描述语句被映射为医学词语的论据,实现了医学词语映射过程的可解释性。并且,如果在单个词语中确定该论据,会由于词语过于分散,导致确定的论据不够准确,而本技术是在包括多个词语的语句片段中确定症状描述语句被映射为医学词语的论据,能够使医学词语映射过程的可解释性更加准确。
[0237]
可选地,参见图8,语句分割模块702,用于:
[0238]
按照症状描述语句中的词语排列顺序,选取以第一词语为起始词语且数量为第一数量的多个词语,构成一个语句片段,第一词语为症状描述语句中的任一个词语,第一数量为大于1的整数;
[0239]
继续选取以第二词语为起始词语且数量为第一数量的多个词语,构成一个语句片段,其中第二词语为位于第一词语之后,且与第一词语间隔第二数量的词语,直至已构成包括症状描述语句中的最后一个词语的语句片段,第二数量为不小于0的整数。
[0240]
可选地,参见图8,装置还包括:
[0241]
第一数量确定模块706,用于将第三数量与目标比例的乘积确定为第一数量,第三
数量为症状描述语句中的词语的数量,目标比例大于0且小于1。
[0242]
可选地,参见图8,装置还包括:
[0243]
第二数量确定模块707,用于确定小于第三数量与第一数量之差的第二数量,第三数量为症状描述语句中的词语的数量。
[0244]
可选地,参见图8,语句分割模块702,包括:
[0245]
标点符号确定单元712,用于确定症状描述语句中的每个目标标点符号,目标标点符号为表示一个句子结束的标点符号;
[0246]
语句分割单元722,用于在症状描述语句中所确定的每个目标标点符号所在的位置进行分割,得到多个语句片段。
[0247]
可选地,参见图8,权重确定模块703,用于将每个语句片段中的多个词语的权重之和,分别确定为每个语句片段的权重。
[0248]
可选地,参见图8,映射模块701,用于:
[0249]
第一编码单元711,用于调用词语映射模型中的词语编码网络,对症状描述语句中的每个词语进行编码,得到症状描述语句中的每个词语的词向量;
[0250]
第一特征提取单元721,用于调用词语映射模型中的特征提取网络,对症状描述语句中的多个词语的词向量进行特征提取,得到每个词语的权重;
[0251]
第一加权融合单元731,用于调用词语映射模型中的加权融合网络,基于多个词语的权重,对多个词语的词向量进行加权融合,得到症状描述语句的语句特征;
[0252]
第一映射单元741,用于调用词语映射模型中的特征映射网络,对语句特征进行映射,得到医学词语。
[0253]
可选地,参见图8,第一编码单元711,用于:
[0254]
调用词语编码网络,对症状描述语句进行分词,得到症状描述语句中的每个词语;
[0255]
调用词语编码网络,对每个词语进行编码,得到每个词语的词向量。
[0256]
可选地,参见图8,特征映射网络包括多个参考医学词语,每个参考医学词语用于描述一种症状;第一映射单元741,用于:
[0257]
调用特征映射网络,对语句特征进行映射,得到多个参考医学词语对应的预测概率,每个参考医学词语对应的预测概率用于表示参考医学词语为症状描述语句对应的医学词语的可能性;
[0258]
在多个参考医学词语中,确定最大预测概率对应的参考医学词语。
[0259]
可选地,参见图8,第一映射单元741,用于:
[0260]
调用特征映射网络,对语句特征进行特征变换,得到参考特征,参考特征包括多个维度的特征值,每个维度与一个参考医学词语对应;
[0261]
将参考特征中每个维度的特征值,分别确定为每个维度对应的参考医学词语对应的预测概率。
[0262]
可选地,参见图8,装置还包括:
[0263]
获取模块708,用于获取样本症状描述语句,以及样本症状描述语句的标注信息,标注信息包括与样本症状描述语句所描述的症状关联的医学词语;
[0264]
训练模块709,用于根据样本症状描述语句以及标注信息,对词语映射模型进行训练。
[0265]
可选地,参见图8,词语映射模型中的特征映射网络包括多个参考医学词语,训练模块709,包括:
[0266]
第二编码单元719,用于调用词语映射模型中的词语编码网络,对样本症状描述语句中的每个样本词语进行编码,得到样本症状描述语句中的每个样本词语的词向量;
[0267]
第二特征提取单元729,用于调用词语映射模型中的特征提取网络,对样本症状描述语句中的多个样本词语的词向量进行特征提取,得到每个样本词语的权重;
[0268]
第二加权融合单元739,用于调用词语映射模型中的加权融合网络,基于多个样本词语的权重,对多个样本词语的词向量进行加权融合,得到样本症状描述语句的样本语句特征;
[0269]
第二映射单元749,用于调用特征映射网络,对样本语句特征进行映射,得到多个参考医学词语对应的样本预测概率;
[0270]
训练单元759,用于根据多个参考医学词语对应的样本预测概率及标注信息中的医学词语,对词语映射模型进行训练。
[0271]
可选地,参见图8,第二映射单元749,用于:
[0272]
调用词语映射模型,对样本语句特征进行特征变换,得到样本参考特征,样本参考特征包括多个维度的样本特征值,每个维度与一个参考医学词语对应;
[0273]
将样本参考特征中每个维度的样本特征值,分别确定为每个维度对应的参考医学词语所对应的样本预测概率。
[0274]
可选地,参见图8,训练单元759,用于:
[0275]
将第一目标数值确定为标注信息中的医学词语的真实概率;
[0276]
对于标注信息中的任一医学词语,将与医学词语相同的参考医学词语对应的样本预测概率,确定为医学词语对应的样本预测概率;
[0277]
根据标注信息中的每个医学词语对应的样本预测概率和真实概率,确定词语映射模型的损失值;
[0278]
根据损失值,对词语映射模型进行训练。
[0279]
可选地,参见图8,装置还包括:
[0280]
概率确定模块710,用于将第二目标数值,确定为多个参考医学词语中、未包含于标注信息中的参考医学词语对应的真实概率;
[0281]
训练单元759,用于:
[0282]
根据标注信息中的每个医学词语对应的样本预测概率和真实概率,及未包含于标注信息中的参考医学词语对应的样本预测概率和真实概率,确定词语映射模型的损失值。
[0283]
需要说明的是:上述实施例提供的医学词语映射装置在进行医学词语映射时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的医学词语映射装置与医学词语映射方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0284]
本技术实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的医学词语映射方法中所执行的操作。
[0285]
可选地,该计算机设备提供为终端。图9示出了本技术一个示例性实施例提供的终端900的结构示意图。终端900包括有:处理器901和存储器902。
[0286]
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用dsp(digital signal processing,数字信号处理)、fpga(fieldprogrammable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以集成有gpu(graphics processing unit,图像处理的交互器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0287]
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一条计算机程序,该至少一条计算机程序用于被处理器901所具有以实现本技术中方法实施例提供的医学词语映射方法。
[0288]
在一些实施例中,终端900还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。可选地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。
[0289]
外围设备接口903可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0290]
射频电路904用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0291]
显示屏905用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或
软键盘。在一些实施例中,显示屏905可以为一个,设置在终端900的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端900的不同表面或呈折叠设计;在另一些实施例中,显示屏905可以是柔性显示屏,设置在终端900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light

emitting diode,有机发光二极管)等材质制备。
[0292]
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。前置摄像头设置在终端900的前面板,后置摄像头设置在终端900的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0293]
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
[0294]
定位组件908用于定位终端900的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件908可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0295]
电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0296]
在一些实施例中,终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
[0297]
加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
[0298]
陀螺仪传感器912可以检测终端900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端900的3d动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的
图像稳定、游戏控制以及惯性导航。
[0299]
压力传感器913可以设置在终端900的侧边框和/或显示屏905的下层。当压力传感器913设置在终端900的侧边框时,可以检测用户对终端900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时,由处理器901根据用户对显示屏905的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0300]
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户具有相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置在终端900的正面、背面或侧面。当终端900上设置有物理按键或厂商logo时,指纹传感器914可以与物理按键或厂商标志集成在一起。
[0301]
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制显示屏905的显示亮度。可选地,当环境光强度较高时,调高显示屏905的显示亮度;当环境光强度较低时,调低显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
[0302]
接近传感器916,也称距离传感器,设置在终端900的前面板。接近传感器916用于采集用户与终端900的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与终端900的正面之间的距离逐渐变小时,由处理器901控制显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到用户与终端900的正面之间的距离逐渐变大时,由处理器901控制显示屏905从息屏状态切换为亮屏状态。
[0303]
本领域技术人员可以理解,图9中示出的结构并不构成对终端900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0304]
可选地,该计算机设备提供为服务器。图10是本技术实施例提供的一种服务器的结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)1001和一个或一个以上的存储器1002,其中,所述存储器1002中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器1001加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0305]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的医学词语映射方法中所执行的操作。
[0306]
本技术实施例还提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机程序代码,计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机程序代码,处理器执行计算机程序代码,使得计算机设备实现如上述实施例的医学词语映射方法中所执行的操作。
[0307]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0308]
以上所述仅为本技术实施例的可选实施例,并不用以限制本技术实施例,凡在本技术实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1