基于医疗领域的图片分类方法、装置、存储介质及设备与流程

文档序号:32162601发布日期:2022-11-12 03:10阅读:49来源:国知局
基于医疗领域的图片分类方法、装置、存储介质及设备与流程

1.本发明涉及医疗信息技术领域,尤其涉及一种基于医疗领域的图片分类方法、装置、存储介质及设备。


背景技术:

2.随着互联网技术的发展,数字化技术也开始在医疗领域逐渐兴起。在医疗领域中,患者的医疗图片是医疗数据中心的重要信息。每名患者从挂号开始看病,就会生成许多的医疗图片信息,比如发票图片、检验报告、影像报告、住院病案首页以及出院证明等。上述数量庞大的医疗图片需要在数据中心进行相应地保管存储,进行分类分级管理。
3.目前,大多数医疗机构仍然是采取人工的方式对医疗图片进行分类,上述分类方式会消耗大量的时间,并且准确率不高。因此,如何提高对医疗图片分类的效率和准确率成为亟需解决的技术问题。


技术实现要素:

4.本技术实施例提供一种基于医疗领域的图片分类方法、装置、存储介质及电子设备,以解决现有技术对医疗图片进行分类,效率低下的技术问题。
5.第一方面,提供了一种基于医疗领域的图片分类方法,包括:
6.获取待分类的目标图片,并提取出目标图片的文字特征;
7.根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征;
8.将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;
9.判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征;
10.将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
11.在一种可能的实现方式中,所述分类模型的建立,包括:
12.获取多项类别的源图片信息,其中,所述源图片信息包括:多名患者的源图片;
13.基于第一类别的源图片信息,并根据bert算法,训练构建出第一类别图片的特征信息;
14.基于第二类别的源图片信息,并根据bert算法,训练构建出第二类别图片的特征信息;
15.依次类推,基于最后类别的源图片信息,并根据bert算法,训练构建出最后类别图片的特征信息。
16.在一种可能的实现方式中,所述将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,包括:
17.基于预先建立的分类模型,将医疗文本特征或医疗双模态特征与第一类别图片的
特征信息进行计算,生成第一类别图片的权重值;
18.将医疗文本特征或医疗双模态特征与第二类别图片的特征信息进行计算,生成第二类别图片的权重值;
19.依次类推,将医疗文本特征或医疗双模态特征与最后类别图片的特征信息进行计算,生成最后类别图片的权重值;
20.根据所述权重值,生成目标图片的分类结果。
21.在一种可能的实现方式中,所述根据所述权重值,生成目标图片的分类结果,包括:
22.将所述权重值导入到归一化指数函数中,生成所述权重值对应的权重系数;
23.根据所述权重系数,生成目标图片的分类结果。
24.在一种可能的实现方式中,所述分类模型预定义了多项类别图片的阈值,所述根据所述权重系数,生成目标图片的分类结果,包括:
25.判断所述权重系数是否均小于多项类别图片的阈值;
26.如果所述权重系数均小于多项类别图片的阈值,则目标图片的分类结果为其他;否则,将所述权重系数和所述多项类别的阈值进行计算,根据计算后得到的最大值确定目标图片的类别。
27.在一种可能的实现方式中,所述根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征,包括;
28.预先生成医学关键词词库;
29.将目标图片的文字特征与医学关键词词库中的关键词进行比对,若比对成功,则提取出目标图片的关键词特征。
30.在一种可能的实现方式中,所述判断目标图片是否具有图像信息,包括:
31.基于卷积神经网络算法,训练构建出多种类型图像特征信息;
32.根据多种类型图像特征信息,判断目标图片是否具有图像信息。
33.第二方面,提供了一种基于医疗领域的图片分类装置,包括:
34.提取模块:用于获取待分类的目标图片,并提取出目标图片的文字特征;根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征;
35.融合模块:用于将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征;
36.分类模块:用于将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
37.在一种可能的实现方式中,所述分类模块还用于分类模型的建立,包括用于:
38.获取多项类别的源图片信息,其中,所述源图片信息包括:多名患者的源图片;
39.基于第一类别的源图片信息,并根据bert算法,训练构建出第一类别图片的特征信息;
40.基于第二类别的源图片信息,并根据bert算法,训练构建出第二类别图片的特征信息;
41.依次类推,基于最后类别的源图片信息,并根据bert算法,训练构建出最后类别图
片的特征信息。
42.在一种可能的实现方式中,所述分类模块还用于:
43.基于预先建立的分类模型,将医疗文本特征或医疗双模态特征与第一类别图片的特征信息进行计算,生成第一类别图片的权重值;
44.将医疗文本特征或医疗双模态特征与第二类别图片的特征信息进行计算,生成第二类别图片的权重值;
45.依次类推,将医疗文本特征或医疗双模态特征与最后类别图片的特征信息进行计算,生成最后类别图片的权重值;
46.根据所述权重值,生成目标图片的分类结果。
47.在一种可能的实现方式中,所述分类模型预定义了多项类别图片的阈值,所述分类模块还用于:
48.判断所述权重系数是否均小于多项类别图片的阈值;
49.如果所述权重系数均小于多项类别图片的阈值,则目标图片的分类结果为其他;否则,将所述权重系数和所述多项类别的阈值进行计算,根据计算后得到的最大值确定目标图片的类别。
50.在一种可能的实现方式中,所述提取模块还用于:
51.预先生成医学关键词词库;
52.将目标图片的文字特征与医学关键词词库中的关键词进行比对,若比对成功,则提取出目标图片的关键词特征。
53.在一种可能的实现方式中,所述融合模块还用于:
54.基于卷积神经网络算法,训练构建出多种类型图像特征信息;
55.根据多种类型图像特征信息,判断目标图片是否具有图像信息。
56.第三方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述基于医疗领域的图片分类方法的步骤。
57.第四方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于医疗领域的图片分类方法的步骤。
58.上述基于医疗领域的图片分类方法、装置、存储介质及电子设备所实现的方案,应用于医疗领域,通过提取大量的医疗图片的文字特征、关键词特征和图像特征信息,并利用分类算法,训练构建出不同类别的医疗图片特征,进而建立出医疗图片分类模型,对带有文字的医疗图片以及带有文字和图像的医疗图片实现自动化分类。与此同时,在分类模型中,通过预定义不同类别图片的阈值,进一步提高了分类模型对图片的识别准确率。
附图说明
59.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
60.图1是是本发明一实施例中基于医疗领域的图片分类方法的一应用环境示意图;
61.图2是本发明一实施例中基于医疗领域的图片分类方法的一流程示意图;
62.图3是本发明一实施例中基于医疗领域的图片分类方法的说明示意图;
63.图4是本发明一实施例中分类模型的建立方法的一流程示意图;
64.图5是图2中步骤s50的一具体实施方式流程示意图;
65.图6是本发明一实施例中基于医疗领域的图片分类装置的一结构示意图;
66.图7是本发明一实施例中计算机设备的一结构示意图。
具体实施方式
67.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
68.本发明实施例提供的基于医疗领域的图片分类方法,可应用在如图1所示的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以通过客户端获取到待分类的图片,并在客户端提取出目标图片的文字特征及关键词特征,将上述目标图片的文字特征和关键词特征进行融合生成医疗文本特征传输给服务端。与此同时,在客户端还需要判断目标图片是否具有图像信息,如果具有,则提取出图像特征,将图像特征和上述医疗文本特征进行融合,生成医疗双模态特征传输给服务端。服务端接收医疗文本特征或医疗双模态特征信息后,将医疗文本特征信息或医疗双模态特征信息导入预先建立的分类模型中,通过该分类模型确定目标图片的分类结果。
69.在本发明实施例中,上述服务端中的分类模型通过提取大量的医疗图片的文字特征、关键词特征和图像特征信息,并利用分类算法,训练构建出不同类别的医疗图片特征,进而建立出医疗图片分类模型,对带有文字的医疗图片以及带有文字和图像的医疗图片实现自动化分类。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
70.请参阅图2所示,图2是本发明一实施例中基于医疗领域的图片分类方法的一流程示意图,包括如下步骤:
71.s10:获取待分类的目标图片,并提取出目标图片的文字特征;
72.在医疗机构,存储着不同类型的医疗图片。比如,患者就诊后出具的发票图片,包含着相关身份、费用信息;患者做完相关检查后产生的超声报告、磁共振报告以及ct报告等,包含着超声成像、磁共振成像以及ct成像等图片信息,同时也包含着患者的身份及诊断意见等文字信息。当获取到各种各样的图片之后,首先,要提取出目标图片的文字特征。比如,在一份超声检查报告单的图片中,需要提取“超声检查报告单”的文字信息、除此之外,还需要提取“姓名”、“性别”、“年龄”以及“超声描述”等所有的文字信息。在一种实施方式中,可以采取ocr(optical character recognition)文字识别技术,提取出目标图片的文字特征。
73.s20:根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征;
74.需要说明的是,不同类型的图片会具有一些共同特征的信息,比如超声检查报告单中,一般都会包含着“超声所见”、“超声提示”以及“超声号”等共同的特征信息。再比如,在住院病案首页中,一般都会包含着“病理诊断”和“病案号”等共同的特征信息。为了提高图片的识别效率,可以从s10步骤提取出的文字中,再进一步提取出关键词特征。
75.可选的,可以通过以下步骤提取出目标图片的关键词特征:
76.a1:预先生成医学关键词词库;
77.a2:将目标图片的文字特征与医学关键词词库中的关键词进行比对,若比对成功,则提取出目标图片的关键词特征。
78.首先,可以通过对大量的医疗图片中的文字特征进行提取,筛选出出现频率较高的医学关键词词汇,比如:“超声提示”、“诊断意见”和“收费票据”等,并将上述医学关键词词汇进行组建,预先形成医学关键词词库。其次,可以将目标图片中提取出的文字特征与医学关键词词库中的词汇进行比对,若提取出的文字特征存在与医学关键词词库中具备相同的词汇,则将该词汇认定为目标图片的关键词特征。
79.s30:将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;
80.s40:判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征;
81.需要说明的是,医疗图片中除了包含文字特征,在一些检查报告中还包含图像特征。比如,超声成像、磁共振成像以及ct成像等医学影像图片会出现在超声报告、磁共振报告以及ct报告中。因此,当获取到待分类的医疗图片后,还需要判断所述医疗图片是否具有图像信息,进而根据所提取出的图像特征,进行分类。
82.可选的,判断目标图片是否具有图像信息,可以通过以下步骤:
83.b1:基于卷积神经网络算法,训练构建出多种类型图像特征信息;
84.b2:根据多种类型图像特征信息,判断目标图片是否具有图像信息。
85.首先,可以根据所搜集的包含医学影像图片的大量医疗图片信息,基于卷积神经网络算法,训练构建出图像特征信息,图像特征信息可以包括医学影像特征信息、病理图像特征信息等。在本实施例中,可以通过vgg(visual geometry group)算法来提取图像特征,并通过大量的参数信息进行训练,从而实现图像的分类。vgg是一种卷积神经网络算法,主要采用增加卷积层的方法来加深网络,如果发现的深度越深,网络学习能力越好,分类能力越强。在本实施例中,可以采取16层的卷积层,提取出图像的特征信息。图像的特征信息可以为超声成像的特征信息、磁共振成像的特征信息以及ct成像的特征信息等。
86.其次,根据图像特征信息,判断目标图片是否具有图像信息。即,如果目标图片中包含超声成像、磁共振成像以及ct成像等图像特征信息,则确定目标图片具有图像信息。然后,将上述提取形成的医疗文本特征和图像特征进行叠加,生成医疗双模态特征。
87.s50:将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
88.请参阅图3所示,图3是本发明一实施例中基于医疗领域的图片分类方法的说明示意图。医疗图片的分类方法从整体上进行阐述为,当获取到待分类的医疗图片后,对图片进行提取,提取出文字特征,并基于文字特征,提取出关键词特征。然后,将上述文字特征和关键词特征进行融合,生成医疗文本特征。并行的,当获取到待分类的医疗图片后,判断医疗
图片是否具有图像信息,如果具有,则提取出图像特征。同时,当医疗文本特征生成之后,将图像特征和医疗文本特征进行融合,生成医疗双模态特征,并将医疗双模态特征输入到分类模型中,生成医疗图片的分类结果。如果判断医疗图片不具有图像信息,则当医疗文本特征生成之后,将医疗文本特征直接输入到分类模型中,生成医疗图片的分类结果。其中,所述分类模型是根据分类算法建立的模型。具体地,所述分类模型的建立,请参阅图4所示,图4是本发明一实施例中分类模型的建立方法的一流程示意图,包括:
89.s201:获取多项类别的源图片信息,其中,所述源图片信息包括:多名患者的源图片;
90.为了建立图片分类模型,首先需要获取现存的大量的医疗图片,也即源图片。当获取了所述源图片后,对源图片进行特征提取,提取出源图片的文字特征、关键词特征、图像特征信息。需要说明的是,所述源图片有多种类型,本实施例中,主要包括十种类型,分别为:医嘱单、检验报告、影像报告、基因报告、入院证明、病理报告、住院病案首页、出院证明、患者身份图片、发票。
91.s202:基于第一类别的源图片信息,并根据bert算法,训练构建出第一类别图片的特征信息;
92.在本实施例中,如果将住院病案首页作为第一类别图片,则将所提取的所有住院病案首页中的源图片信息,包括文字特征和关键词特征信息所形成的医疗文本特征信息,根据bert(bidirectional encoder representation from transformers)算法,进行训练,进而训练构建出第一类别图片的特征信息。bert算法是一种神经网络算法,是一种自然语言处理预训练技术,是由多层transformer结构堆叠而成。其中每层transformer包含编码和解码两个模块。bert算法构成的模型,主要是用来学习文本的语法和语义信息。具体到本实施例,主要是通过大量的参数信息,学习到每种类别图片的特征信息,所述特征信息可以包括图片中出现的词汇,出现词汇的权重系数,出现词汇在图片中的具体位置关系,图片是否具有某种类型的图像信息等。当提取到所有住院病案首页中的源图片信息后,接着通过bert算法进行训练,构建出第一类别图片,即住院病案首页的特征信息。
93.s203:基于第二类别的源图片信息,并根据bert算法,训练构建出第二类别图片的特征信息;
94.同样地,如果将医嘱单作为第二类别图片,则根据bert算法,训练构建出医嘱单的特征信息。
95.s204:依次类推,基于最后类别的源图片信息,并根据bert算法,训练构建出最后类别图片的特征信息。
96.采取相同的方法,依次训练构建出检验报告、影像报告、基因报告、入院证明、病理报告、出院证明、患者身份图片、发票的特征信息。
97.上述分类模型建立完成后,将医疗文本特征或医疗双模态特征输入到预先建立的分类模型进行分类的过程,请参阅图5所示,图5是本发明步骤s50的一具体实施方式流程示意图,包括:
98.s51:基于预先建立的分类模型,将医疗文本特征或医疗双模态特征与第一类别图片的特征信息进行计算,生成第一类别图片的权重值;
99.s52:将医疗文本特征或医疗双模态特征与第二类别图片的特征信息进行计算,生
成第二类别图片的权重值;
100.s53:依次类推,将医疗文本特征或医疗双模态特征与最后类别图片的特征信息进行计算,生成最后类别图片的权重值;
101.s54:根据所述权重值,生成目标图片的分类结果。
102.基于预先建立的分类模型,将医疗文本特征或医疗双模态特征输入到分类模型,依次与各个类别的图片特征信息进行计算,分别得到与相应类别图片的权重值。比如,在本实施例中,获取的待分类图片为超声影像报告单,则从待分类图片中提取并生成医疗双模态特征后,输入到分类模型,依次与各个类别的图片特征信息进行计算,所得到第一类别到第十类别的图片中,第三类别影像报告的权重值最大为3089,其它类别均小于3089。那么,就可以根据所计算得到的最大权重值,确定为图片的类型。
103.可选的,为了更加直观地辨别出待分类图片与各种类型图片的相似度,可以通过将计算得到权重值导入到归一化指数函数中,生成所述权重值对应的权重系数。在本实施例中,可以将权重值导入到softmax函数中,这样从分类模型中计算后得到的结果可以为:0.02、0.02、0.86、0.03、0.01等。并且,上述十种类别图片的权重系数相加为1,这样可以非常直观地辨别出,第三类别图片的权重系数最大为0.86。
104.可选的,有的时候通过模型计算出来的权重系数都很低,这表明获取的待分类图片不属于预定义的十个类别的图片。进一步地,为了提高分类模型对图片的识别准确率,可以预定义不同类别图片的阈值,并将上述各个类别图片的权重系数与相应类别图片的阈值进行计算,根据所得到的最大值确定目标图片的分类结果。比如,十个类别的阈值可以设置为0.8。如果所获取的待分类目标图片为某个人物的自拍照片,则会判断出每个类别图片的权重系数均小于0.8,则将该分类目标图片的分类结果定义为其他。否则,将所述权重系数和所述多项类别的阈值进行计算,根据计算后得到的最大值确定目标图片的类别。
105.可见,在上述方案中,通过提取大量的医疗图片的文字特征、关键词特征和图像特征信息,并利用分类算法,训练构建出不同类别的医疗图片特征,进而建立出医疗图片分类模型,对带有文字的医疗图片以及带有文字和图像的医疗图片实现自动化分类。与此同时,在分类模型中,通过预定义不同类别图片的阈值,进一步提高了分类模型对图片的识别准确率。
106.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。此外,术语“包括”及其变体要被解读为“包括但不限于”的开放式术语。
107.在一实施例中,提供一种基于医疗领域的图片分类装置,该分类装置与上述实施例中基于医疗领域的图片分类方法一一对应。如图6所示,该图片分类装置包括:提取模块301、融合模块302、分类模块303。各功能模块详细说明如下:
108.提取模块301:用于获取待分类的目标图片,并提取出目标图片的文字特征;根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征。
109.融合模块302:用于将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征。
110.分类模块303:用于将医疗文本特征或医疗双模态特征输入到预先建立的分类模
型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
111.在一实施例中,分类模块303,还具体用于分类模型的建立,包括用于:
112.获取多项类别的源图片信息,其中,所述源图片信息包括:多名患者的源图片;
113.基于第一类别的源图片信息,并根据bert算法,训练构建出第一类别图片的特征信息;
114.基于第二类别的源图片信息,并根据bert算法,训练构建出第二类别图片的特征信息;
115.依次类推,基于最后类别的源图片信息,并根据bert算法,训练构建出最后类别图片的特征信息。
116.在一实施例中,分类模块303,包括用于:
117.基于预先建立的分类模型,将医疗文本特征或医疗双模态特征与第一类别图片的特征信息进行计算,生成第一类别图片的权重值;
118.将医疗文本特征或医疗双模态特征与第二类别图片的特征信息进行计算,生成第二类别图片的权重值;
119.依次类推,将医疗文本特征或医疗双模态特征与最后类别图片的特征信息进行计算,生成最后类别图片的权重值;
120.根据所述权重值,生成目标图片的分类结果。
121.在一实施例中,分类模块303,包括用于:
122.将所述权重值导入到归一化指数函数中,生成所述权重值对应的权重系数;
123.根据所述权重系数,生成目标图片的分类结果。
124.在一实施例中,所述分类模型预定义了多项类别图片的阈值,分类模块303,还包括用于:
125.判断所述权重系数是否均小于多项类别图片的阈值;
126.如果所述权重系数均小于多项类别图片的阈值,则目标图片的分类结果为其他;否则,将所述权重系数和所述多项类别的阈值进行计算,根据计算后得到的最大值确定目标图片的类别。
127.在一实施例中,提取模块301,还包括用于:
128.预先生成医学关键词词库;
129.将目标图片的文字特征与医学关键词词库中的关键词进行比对,若比对成功,则提取出目标图片的关键词特征。
130.在一实施例中,融合模块302,还包括用于:
131.基于卷积神经网络算法,训练构建出多种类型图像特征信息;
132.根据多种类型图像特征信息,判断目标图片是否具有图像信息。
133.本发明提供了一种基于医疗领域的图片分类装置,通过提取大量的医疗图片的文字特征、关键词特征和图像特征信息,并利用分类算法,训练构建出不同类别的医疗图片特征,进而建立出医疗图片分类模型,对带有文字的医疗图片以及带有文字和图像的医疗图片实现自动化分类。与此同时,在分类模型中,通过预定义不同类别图片的阈值,进一步提高了分类模型对图片的识别准确率。
134.关于图片分类装置的具体限定可以参见上文中基于医疗领域的图片分类方法的
限定,在此不再赘述。上述图片分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
135.在一个实施例中,提供了一种计算机设备,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于医疗领域的图片分类方法的功能或步骤。
136.在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
137.获取待分类的目标图片,并提取出目标图片的文字特征;
138.根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征;
139.将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;
140.判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征;
141.将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
142.在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
143.获取待分类的目标图片,并提取出目标图片的文字特征;
144.根据目标图片的文字特征,提取出用于提高图片识别率的目标图片的关键词特征;
145.将目标图片的文字特征和关键词特征进行融合,生成医疗文本特征;
146.判断目标图片是否具有图像信息,若具有,则根据目标图片的图像信息提取出图像特征,并将医疗文本特征与图像特征进行融合,生成医疗双模态特征;
147.将医疗文本特征或医疗双模态特征输入到预先建立的分类模型中,生成目标图片的分类结果,其中,所述分类模型是根据分类算法建立的模型。
148.需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中的相关描述,为避免重复,这里不再一一描述。
149.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括
随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
150.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
151.以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1