本发明涉及人工智能领域,尤其涉及一种科室推荐方法、装置、电子设备及计算机可读存储介质。
背景技术:
人工智能技术的不断发展和完善,极大的丰富和便利了人们的日常生活。例如,目前在医疗领域中,许多医院配置了包含智能导诊服务的机器,目的在于通过互联网技术平台和机器学习、统计学习方法,以数据驱动的方法实现线上智能导诊功能,给患者推荐科室和医生,从而最大发挥就诊人员的主观能动性,使其有效而精准地找到自己需要的医疗服务。同时,线上问诊平台也有迫切的智能导诊需求,问诊用户数量巨大,而在线医生资源数量不足且背景各异,根据智能导诊的结果,可以帮助用户更加精准的匹配对应医生,从而可以提高线上问诊的效率。
虽然智能导诊服务的投入使用在提高就诊效率方面已经有一些成果,但目前大多数系统的设计模式仍然存在一些问题。第一、由于许多医疗机构针对不同疾病的科室划分趋于细致化、专业化,且不同医院的科室名称存在差异化,而一般患者缺乏专业的医疗知识,因此导致患者知识与医疗专业术语和医院信息的不对称,给导诊增加了难度;第二、目前导诊服务通常是基于统计或文本分类的方法进行科室和医生推荐,但统计方法无法根据患者自身的症状情况提供个性化的推荐策略,而后者又难以区分文本中的噪声数据,提取关键的医疗因素(疾病、症状等),从而也会给导诊增加一定的难度。
技术实现要素:
本发明提供一种科室推荐方法、装置、电子设备及计算机可读存储介质,其主要目的在于降低科室推荐难度。
为实现上述目的,本发明提供的一种科室推荐方法,包括:
对问诊文本中的问诊数据进行清洗,得到标准文本;
利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
可选地,所述对所述问诊文本中的问诊数据进行清洗,得到标准文本,包括:
对所述问诊文本中的问诊数据进行去重操作,并检测去重后的所述问诊文本中是否存在数据缺失值;
若不存在数据缺失值,则将去重后的所述问诊文作为标准文本;
若存在数据缺失值,则对所述数据缺失值进行数据填充,得到标准文本。
可选地,所述对所述问诊文本中的问诊数据进行去重操作,包括:
计算所述问诊文本中任意两个问诊数据的相似度;
若所述相似度大于预设相似度,则同时保留所述问诊文本中任意两个问诊数据;
若所述相似度不大于预设相似度,则删除所述问诊文本中任意两个问诊数据的一个问诊数据。
可选地,所述利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,包括:
利用所述疾病实体识别模型中的编码层对所述标准样本中字符进行位置向量编码,生成字符向量;
利用所述疾病实体识别模型中的前馈注意力机制对所述字符向量进行特征序列提取,得到特征序列向量;
利用所述疾病实体识别模型中疾病实体识别模块的对所述特征序列向量进行疾病实体识别,得到疾病实体。
可选地,所述利用所述疾病实体识别模型中的前馈注意力机制对所述字符向量进行特征序列提取,得到特征序列向量,包括:
利用所述前馈注意力机制中的自注意力模块查询所述字符向量;
利用所述前馈注意力机制中的卷积模块对查询到的所述字符向量进行特征提取,得到特征字符向量;
利用所述前馈注意力机制中的编码器提取所述特征字符向量的信息序列,得到特征序列向量。
可选地,所述对识别的所述疾病实体构建实体关系图谱,包括:
利用翻译模型对识别的所述疾病实体进行关系向量建模,得到所述实体关系图谱向量空间;
将所述实体关系图谱向量空间转换为可视化界面的实体关系图谱,得到所述实体关系图谱。
可选地所述计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,包括:
利用下述方法计算所述匹配度:
其中,t(x,y)表示匹配度,xi表示筛选的所述疾病实体中第i个疾病实体,yi表示疾病实体字典库中第i个疾病实体。
为了解决上述问题,本发明还提供一种科室推荐装置,所述装置包括:
清洗模块,用于对问诊文本中的问诊数据进行清洗,得到标准文本;
筛选模块,用于利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
选取模块,用于利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
汇总模块,用于对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
计算模块,用于计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的科室推荐方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的科室推荐方法。
本发明实施例首先对获取的问诊文本中数据进行清洗,得到标准文本,可以提高后续问诊文本中数据的处理速度;其次,本发明实施例利用预训练完成的疾病实体识别模型以及疾病实体正则表达式分别从所述标准文本中筛选疾病实体,保障了疾病实体获取的全面性,从而可以解决在疾病实体过程中医疗信息不匹配,及文本中出现噪声数据难以区分的问题,进而提高问诊科室推荐的准确性;进一步地,本发明实施例通过对疾病实体进行降维,以提高后续计算的速度,并根据所述目标疾病实体与医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,以进一步地提高问诊科室推荐的准确率。因此,本发明提出的一种科室推荐方法、装置、电子设备以及存储介质可以降低科室推荐难度。
附图说明
图1为本发明一实施例提供的科室推荐方法的流程示意图;
图2为本发明第一实施例中图1提供的科室推荐方法其中一个步骤的详细流程示意图;
图3为本发明一实施例提供的科室推荐装置的模块示意图;
图4为本发明一实施例提供的实现科室推荐方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种科室推荐方法。所述科室推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述科室推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的科室推荐方法的流程示意图。在本发明实施例中,所述科室推荐方法包括:
s1、对所述问诊文本中的问诊数据进行清洗,得到标准文本。
本发明实施例中,所述问诊文本可以理解为在业务场景中产生的数据汇总,比如在医疗问诊场景中用户的基本数据和行为数据的汇总,所述问诊数据是指用户输入需要咨询的医疗数据,其包括:疾病症状、疾病类别以及疾病名称等。进一步地,应该了解,在实际业务场景中产生的数据错综复杂且数据量极大,为了更好的对所述问诊文本进行分析处理,本发明对所述问诊文本中的问诊数据进行清洗,以筛选出所述问诊文本的无用数据,提高后续文本处理的效率。
详细地,所述对所述问诊文本中的问诊数据进行清洗,得到标准文本,包括:对所述问诊文本中的问诊数据进行去重操作,并检测去重后的所述问诊文本中是否存在数据缺失值;若不存在数据缺失值,则将去重后的所述问诊文本作为标准文本;若存在数据缺失值,则对所述数据缺失值进行数据填充,得到标准文本。
详细地,所述对所述问诊文本中的问诊数据进行去重操作,包括:计算所述问诊文本中任意两个问诊数据的相似度,若所述相似度大于预设相似度,则同时保留所述问诊文本中任意两个问诊数据,若所述相似度不大于预设相似度,则删除所述问诊文本中任意两个问诊数据的一个问诊数据。
需要说明的是,本发明实施例在计算所述问诊文本中任意两个问诊数据的相似度之前,还包括:利用hash算法将所述问诊文本中的问诊数据转换成对应hash值,以实现后续问诊数据相似度的计算。
一个可选实施例中,利用下述方法计算所述问诊文本中任意两个问诊数据的相似度:
其中,d表示问诊文本中任意两个问诊数据的相似度,w1j和w2j表示问诊文本中任意两个问诊数据的hash值。
进一步地,应该了解在实际业务场景中,用户在进行医疗咨询时,会存在输入的数据存在缺失的情况,比如用户的身份证或者手机号码少输一个或多个,导致用户信息不全,从而影响整个问诊文本的完整性,因此本发明通过检测去重后的所述问诊文本中是否存在数据缺失值,以实现对存在的数据缺失值填补。
一个可选实施例中,所述数据缺失值的检测可以通过当前已知的数据缺失值检测工具中的检测函数实现,如ameliapackage工具中的missmapfunction检测函数实现。
一个可选实施例中,所述对所述数据缺失值进行填充包括:获取待填充数据的缺失位置,在所述缺失位置预设的填充参数,并计算所述填充参数的缺失值概率,根据所述缺失位置、填充参数以及缺失值概率,得到对应填充的数据缺失值。可选的,利用下述公式对所述数据缺失值进行填充:
其中,l(θ)表示填充的数据缺失值,xi表示第i个数据缺失值的缺失位置,θ表示填充的数据缺失值对应的填充参数,n表示去重后的所述问诊文本中问诊数据的数量,p(xi|θ)表示填充参数的缺失值概率。
s2、利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体。
本发明实施例中,所述疾病实体识别模型包括bert神经网络,用于识别所述标准文本中的疾病实体,其中,所述疾病实体是指所述问诊文本中的疾病名称和疾病症状,所述疾病名称包括:胆结石、肺结节以及感冒发烧等,所述疾病症状包括;恶心、眩晕以及无力等。为了更好的了解所述问诊文本中需要查询的目标科室,本发明实施例通过预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,以保障后续目标科室匹配的前提。
详细地,参阅图2所示,所述利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,包括:
s20、利用所述疾病实体识别模型中的编码层对所述标准样本中字符进行位置向量编码,生成字符向量;
s21、利用所述疾病实体识别模型中的前馈注意力机制对所述字符向量进行特征序列提取,得到特征序列向量;
s22、利用所述疾病实体识别模型中疾病实体识别模块的对所述特征序列向量进行疾病实体识别,得到疾病实体。
一个可选实施例中,所述编码层包括embedding,所述s20包括:利用所述编码层对所述标准样本中的字符进行索引编码,得到字符编码索引;利用所述编码层将所述字符转换成对应的字符向量,得到初始字符向量;将所述字符编码索引和所述字符向量进行组合,生成字符向量。
一个可选实施例中,所述前馈注意力机制包括:自注意力模块、卷积模块以及编码器,所述s21包括:利用所述前馈注意力机制中的自注意力模块查询所述字符向量,利用所述前馈注意力机制中的卷积模块对查询到的所述字符向量进行特征提取,得到特征字符向量,利用所述前馈注意力机制中的编码器提取所述特征字符向量的信息序列,得到特征序列向量。
一个可选实施例中,所述疾病实体识别模块包括:全连接层和激活函数,所述s22包括:利用所述全连接层检测所述特征序列向量中的疾病实体位置信息,利用所述激活函数输出所述疾病实体位置信息,得到所述疾病实体。
需要说明的是,所述疾病实体识别模型的训练过程属于当前较为成熟的技术,在此不做进一步地阐述。
进一步地,应该了解,在识别出的疾病实体中,会存在一定的实体关系,比如疾病症状与疾病名称对应关系(如感冒包含无力),为了更加直观了解到识别的疾病实体之间的关系,本发明实施例对识别的所述疾病实体构建实体关系图谱,详细地,所述对识别的所述疾病实体构建实体关系图谱,包括:利用翻译模型对识别的所述疾病实体进行关系向量建模,得到所述实体关系图谱向量空间;将所述实体关系图谱向量空间转换为可视化界面的实体关系图谱,得到所述实体关系图谱。
其中,所述利用翻译模型(trans)包括:多元关系数据嵌入(简称transe)、将知识嵌入到超平面(简称transh)、实体和关系分开嵌入(transr)、通过动态映射矩阵嵌入(transd)以及自适应的度量函数(transa)。需要声明的是,利用所述trans实现实体-关系向量的建模属于当前较为成熟的技术,在此不做进一步地阐述。
一个可选实施例中,所述实体关系图谱向量空间的可视化界面的转换通过当前已知的tensorboard工具实现。
进一步地,本发明实施例通过所述实体关系图谱,可以确定疾病实体之间的关联关系,因此本发明实施例根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体。其中,所述预设条件可以根据实际业务场景设置,比如设置疾病实体是否具有两个及两个以上关联的疾病实体,若具有,则筛选出对应疾病实体,生成第一疾病。
一个可选实施例中,所述疾病实体的筛选可以通过当前预设的实体筛选脚本实现,所述预设的实体筛选脚本可以由当前已知的javascript脚本语言编译。
s3、利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体。
本发明实施例中,所述预构建的疾病实体正则表达式可以通过当前已知的实体命名识别(namedentityrecognition,ner)工具进行构建,比如根据统计分析找到高频描述主要疾病实体词语或者根据用户在系统前端自动选择的疾病实体。
进一步地,应该了解,在实际业务场景中,由于用户的表达习惯不同等因素不同,会导致通过疾病实体正则表达式提取的疾病实体并不满足行业内标准的疾病实体,因此,本发明实施例通过计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,并从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体,以保障疾病实体的提取准确率。其中,所述疾病实体字典库中疾病实体通过从专业网站下载和咨询专业医疗人员得到,可选的,所述疾病实体字典库通过数据库构建,用于实现数据的快速存储和读取。
一个可选实施例中,利用下述方法计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度:
其中,t(x,y)表示匹配度,xi表示筛选的所述疾病实体中第i个疾病实体,yi表示疾病实体字典库中第i个疾病实体。
一个可选实施例中,所述预设阈值为0.9,也可以根据实际业务场景设置。
s4、对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体。
本发明实施例中,将所述第一疾病实体和所述第二疾病实体进行降维,以将所述第一疾病实体和所述第二疾病实体映射到区间[0,1]中,提高后续疾病实体的处理速度。
一个可选实施例中,利用下述方法对所述第一疾病实体进行降维:
x'=(x-x_min)/(x_max-x_min)
其中,x'表示降维后的所述第一疾病实体,x表示第一疾病实体,x_max表示第一疾病实体中维度最大的疾病实体,x_min表示第一疾病实体中维度最小的疾病实体。
进一步地,所述第二疾病实体的降维方法可以参阅所述第一疾病实体的降维方法,在此不作进一步的赘述。
进一步地,本发明实施例将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体,以确保后续与目标科室匹配时疾病实体的信息全面性,以提高目标科室匹配的准确率。
进一步地,为保障所述目标疾病实体的复用性和隐私性,所述目标疾病实体还可存储于一区块链节点中。
s5、计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
本发明实施例中,所述医疗科室库中科室是指在医疗领域中的医生诊疗位置信息,比如:皮肤科室、胸透科室以及心电图科室等等,所述医疗科室库也基于数据库进行构建,方便数据的快速存取。
进一步地,本发明实施例通过计算所述目标疾病实体与医疗科室库中科室的关联度,并从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室,以实现疾病实体的目标科室匹配。其中,所述关联度的计算方法可以参阅上述s3中匹配度的计算方法,在此不做进一步阐述,可选的所述预设关联度为0.85,也可以根据实际业务场景设置。
本发明实施例首先对获取的问诊文本中数据进行清洗,得到标准文本,可以提高后续问诊文本中数据的处理速度;其次,本发明实施例利用预训练完成的疾病实体识别模型以及疾病实体正则表达式分别从所述标准文本中筛选疾病实体,保障了疾病实体获取的全面性,从而可以解决在疾病实体过程中医疗信息不匹配,及文本中出现噪声数据难以区分的问题,进而提高问诊科室推荐的准确性;进一步地,本发明实施例通过对疾病实体进行降维,以提高后续计算的速度,并根据所述目标疾病实体与医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,以进一步地提高问诊科室推荐的准确率。因此,本发明提出的一种科室推荐方法、装置、电子设备以及存储介质可以降低科室推荐难度。
如图3所示,是本发明科室推荐装置的功能模块图。
本发明所述科室推荐装置100可以安装于电子设备中。根据实现的功能,所述科室推荐装置可以包括清洗模块101、筛选模块102、选取模块103、汇总模块104以及计算模块105。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述清洗模块101,用于对问诊文本中的问诊数据进行清洗,得到标准文本;
所述筛选模块102,用于利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
所述选取模块103,用于利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
所述汇总模块104,用于对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
所述计算模块105,用于计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
详细地,本发明实施例中所述科室推荐装置100中的所述各模块在使用时采用与上述的图1和图2中所述的科室推荐方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图4所示,是本发明实现科室推荐方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如科室推荐程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smartmediacard,smc)、安全数字(securedigital,sd)卡、闪存卡(flashcard)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如科室推荐程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(controlunit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行科室推荐程序12等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的科室推荐程序12是多个程序的组合,在所述处理器10中运行时,可以实现:
对问诊文本中的问诊数据进行清洗,得到标准文本;
利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
具体地,所述处理器10对上述程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
对问诊文本中的问诊数据进行清洗,得到标准文本;
利用预训练完成的疾病实体识别模型识别所述标准文本中的疾病实体,并对识别的所述疾病实体构建实体关系图谱,根据所述实体关系图谱,从识别的所述疾病实体中筛选出满足预设条件的疾病实体,得到第一疾病实体;
利用预构建的疾病实体正则表达式从所述标准文本中筛选疾病实体,并计算筛选的所述疾病实体与预设的疾病实体字典库中疾病实体的匹配度,从筛选的所述疾病实体中选取所述匹配度大于预设阈值的疾病实体,得到第二疾病实体;
对所述第一疾病实体和所述第二疾病实体分别进行降维,将降维后的所述第一疾病实体和所述第二疾病实体汇总,得到目标疾病实体;
计算所述目标疾病实体与预构建的医疗科室库中科室的关联度,从所述医疗科室中选取所述关联度大于预设关联度的科室,得到目标科室。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。