一种模型训练方法及装置、电子设备和存储介质与流程

文档序号:31624199发布日期:2022-09-24 00:08阅读:44来源:国知局
一种模型训练方法及装置、电子设备和存储介质与流程

1.本公开涉及计算机视觉技术领域,尤其涉及一种模型训练方法及装置、电子设备和存储介质。


背景技术:

2.深度学习模型在跨域的不同数据集上的性能可能会出现大幅度的下降。例如:在核磁共振成像(mri)数据上训练的分割模型只能引用在核磁共振成像数据上,拿到电子计算机断层扫描(ct)数据上就会表现的很糟糕。在仅标注了mri数据的情况下,我们无法用常规的训练方法,使得模型在没有ct数据的标注信息的情况下,很好的应对ct数据。


技术实现要素:

3.有鉴于此,本公开提出了一种模型训练技术方案。
4.根据本公开的一方面,提供了一种模型训练方法,包括:获取目标域数据和源域数据,所述目标域数据和所述源域数据中包含的目标对象相同,所述源域数据中包含的目标对象具有标签,所述目标域数据和所述源域数据包括影像数据;根据所述目标域数据和所述源域数据,得到拟合数据,所述拟合数据包含所述目标域数据的风格特征和所述源域数据的结构特征,所述结构特征为所述目标对象的空间位置及布局的信息;根据所述拟合数据和所述标签,训练初始模型,得到中间模型;根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,所述目标模型用于识别所述目标域数据中包含的目标对象。
5.在一种可能的实现方式中,所述根据所述目标域数据和所述源域数据,得到拟合数据,包括:将所述目标域数据和所述源域数据输入对抗生成网络,所述对抗生成网络包括提取网络和生成网络;根据所述提取网络,提取所述目标域数据的风格特征和所述源域数据的结构特征;根据所述生成网络,生成包含所述源域数据的风格特征和所述目标域数据的结构特征的拟合数据;其中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到。
6.在一种可能的实现方式中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到,包括:根据所述提取网络,提取所述目标域数据的第一风格特征和第一结构特征、所述源域数据的第二结构特征和第二风格特征;根据所述生成网络,生成第一重建数据、第一转换数据、第二转换数据和第二重建数据,所述第一重建数据包含第一风格特征和第一结构特征,所述第一转换数据包含第一风格特征和第二结构特征,所述第二转换数据包含所述第一结构特征和第二风格特征,所述第二重建数据包含第二结构特征和第二风格特征;根据所述判别网络,判别所述第一重建数据、所述第一转换数据、所述第二转换数据和所述第二重建数据的真假,得到判别结果;根据所述判别结果,对所述对抗生成网络的参数进行调整。
7.在一种可能的实现方式中,根据所述判别结果,对所述对抗生成网络的参数进行调整,包括:根据所述目标域数据和所述第一重建数据之间的差异,生成第一重建损失;根
据所述源域数据和所述第二重建数据之间的差异,生成第二重建损失;根据所述判别网络输出的对所述第一重建数据的判别结果,生成第一判别损失;根据所述判别网络输出的对所述第一转换数据的判别结果,生成第二判别损失;根据所述判别网络输出的对所述第二转换数据的判别结果,生成第三判别损失;根据所述判别网络输出的对所述第二重建数据的判别结果,生成第四判别损失;根据所述第一重建损失、所述第二重建损失、所述第一判别损失、所述第二判别损失、所述第三判别损失和所述第四判别损失,对所述生成网络和所述判别网络进行对抗训练,获得训练后的神经网络。
8.在一种可能的实现方式中,所述根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,包括:将所述目标域数据输入所述中间模型,得到输出结果,作为所述目标域数据的伪标签;根据所述目标域数据和所述伪标签,训练所述中间模型,得到更新后的中间模型;对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型。
9.在一种可能的实现方式中,在所述将所述目标域数据输入所述中间模型,得到输出结果,作为所述目标域数据的伪标签之后,所述根据所述目标域数据和所述伪标签,训练所述中间模型,得到更新后的中间模型之前,所述根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,包括:将所述中间模型的参数进行初始化。
10.在一种可能的实现方式中,所述对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型,包括:按照概率p
n-i
抽取第n-i次迭代得到的中间模型的输出结果,作为第n次迭代时所使用的目标域数据的伪标签,其中n为大于1的整数,i为小于n的正整数,p
n-i
的值与n-i的值正相关。
11.根据本公开的另一方面,提供了一种模型训练装置,包括:数据获取模块,用于获取目标域数据和源域数据,所述目标域数据和所述源域数据中包含的目标对象相同,所述源域数据中包含的目标对象具有标签,所述目标域数据和所述源域数据包括影像数据;拟合数据生成模块,用于根据所述目标域数据和所述源域数据,得到拟合数据,所述拟合数据包含所述目标域数据的风格特征和所述源域数据的结构特征,所述结构特征为所述目标对象的空间位置及布局的信息;全监督训练模块,用于根据所述拟合数据和所述标签,训练初始模型,得到中间模型;自监督训练模块,用于根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,所述目标模型用于识别所述目标域数据中包含的目标对象。
12.在一种可能的实现方式中,所述拟合数据生成模块,包括:数据输入子模块,用于将所述目标域数据和所述源域数据输入对抗生成网络,所述对抗生成网络包括提取网络和生成网络;特征提取子模块,用于根据所述提取网络,提取所述目标域数据的风格特征和所述源域数据的结构特征;拟合数据生成子模块,用于根据所述生成网络,生成包含所述源域数据的风格特征和所述目标域数据的结构特征的拟合数据;其中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到。
13.在一种可能的实现方式中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到,包括:根据所述提取网络,提取所述目标域数据的第一风格特征和第一结构特征、所述源域数据的第二结构特征和第二风格特征;根据所述生成网络,生成第一重建数据、第一转换数据、第二转换数据和第二重建数据,所述第一重建数据包含第一风格特征和第一结构特征,所述第一转换数据包含第一风格特征和第二结构特征,所述第二转换数据包含所述第一结构特征和第二风格特征,所述第二重建数据包含第二结构特征和第
二风格特征;根据所述判别网络,判别所述第一重建数据、所述第一转换数据、所述第二转换数据和所述第二重建数据的真假,得到判别结果;根据所述判别结果,对所述对抗生成网络的参数进行调整。
14.在一种可能的实现方式中,所述根据所述判别结果,对所述对抗生成网络的参数进行调整,包括:根据所述目标域数据和所述第一重建数据之间的差异,生成第一重建损失;根据所述源域数据和所述第二重建数据之间的差异,生成第二重建损失;根据所述判别网络输出的对所述第一重建数据的判别结果,生成第一判别损失;根据所述判别网络输出的对所述第一转换数据的判别结果,生成第二判别损失;根据所述判别网络输出的对所述第二转换数据的判别结果,生成第三判别损失;根据所述判别网络输出的对所述第二重建数据的判别结果,生成第四判别损失;根据所述第一重建损失、所述第二重建损失、所述第一判别损失、所述第二判别损失、所述第三判别损失和所述第四判别损失,对所述生成网络和所述判别网络进行对抗训练,获得训练后的神经网络。
15.在一种可能的实现方式中,所述自监督训练模块,包括:伪标签获取子模块,用于将所述目标域数据输入所述中间模型,得到输出结果,作为所述目标域数据的伪标签;中间模型训练字母模块,用于根据所述目标域数据和所述伪标签,训练所述中间模型,得到更新后的中间模型;对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型。
16.在一种可能的实现方式中,所述伪标签获取子模块,包括:初始化子模块,用于将所述中间模型的参数进行初始化。
17.在一种可能的实现方式中,所述自监督训练模块,包括:伪标签更新子模块,用于按照概率p
n-i
抽取第n-i次迭代得到的中间模型的输出结果,作为第n次迭代时所使用的目标域数据的伪标签,其中n为大于1的整数,i为小于n的正整数,p
n-i
的值与n-i的值正相关。
18.根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现上述方法。
19.根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
20.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
21.在本公开的实施例中,通过已标注的源域数据的结构特征和无标注的目标域数据的风格特征所生成的拟合数据、源域数据的标签进行初始模型的训练,生成中间模型,由于拟合数据具有目标域数据的风格特征,该训练过程使得中间模型相较初始模型对目标域数据的识别能力得到提升;通过目标域数据对中间模型的自监督训练,得到目标模型,由于进一步学习了目标域数据的结构特征,该训练过程使得目标模型相较中间模型对目标域数据的识别能力得到进一步的提升,最终得到了对无标注的目标域数据有较好识别能力的模型。通过上述过程,有效提高了模型对跨域的无标注数据的识别能力,从而提升了模型在不同数据集之间的泛化能力。
22.根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
23.包括在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
24.图1示出根据本公开一实施例的模型训练方法的流程图。
25.图2示出根据本公开一实施例的对腹部ct和mr示意图的示意图。
26.图3示出根据本公开一实施例的对抗生成网络训练方法的示意图。
27.图4示出根据本公开一应用示例的模型预测结果的对比图。
28.图5示出根据本公开一实施例的模型训练装置的框图。
29.图6示出根据本公开实施例的一种电子设备的框图。
30.图7示出根据本公开实施例的一种电子设备的框图。
具体实施方式
31.以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
32.在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
33.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
34.另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
35.图1示出根据本公开一实施例的模型训练方法的流程图,该方法可以应用于模型训练装置,模型训练装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等。
36.在一些可能的实现方式中,该模型训练方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
37.如图1所示,所述模型训练方法可以包括:
38.步骤s11,获取目标域数据和源域数据,所述目标域数据和所述源域数据中包含的目标对象相同,所述源域数据中包含的目标对象具有标签,所述目标域数据和所述源域数据包括影像数据。
39.步骤s12,根据所述目标域数据和所述源域数据,得到拟合数据,所述拟合数据包含所述目标域数据的风格特征和所述源域数据的结构特征,所述结构特征为所述目标对象的空间位置及布局的信息。
40.步骤s13,根据所述拟合数据和所述标签,训练初始模型,得到中间模型。
41.步骤s14,根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,所述目标模型用于识别所述目标域数据中包含的目标对象。
42.其中,源域数据是已被标注的具有标签的数据集。在一种可能的实现方式中,源域数据可以是图像数据的数据集,也可以是视频数据的数据集。进一步的,在一种可能的实现方式中,源域数据也可以是已被标注的其他类型的数据集。在一种可能的实现方式中,所述源域数据的标签可以为目标对象的种类的标签。其中,该标注信息是人工进行标注的或者通过其他方式标注的,本公开实施例对此不做限定。后续各公开实施例均以源域数据为图像数据为例展开说明,在源域数据为其他形式数据的情况下,其处理方法可以根据本公开实施例提出的方法进行灵活扩展,不再举例说明。
43.目标域数据可以是与源域数据的数据类型相同的、没有被标注的数据集,目标域数据和源域数据所包含的目标对象可以相同。在一种可能的实现方式中,目标对象的个数可以为一个或者多个,本公开实施例对目标对象的数量不做具体限定。在一个示例中,目标对象可以是医学影像中的器官或部位,如心脏、腹部等,本公开实施例对目标对象的具体类型不做具体限定,根据实际情况灵活选择即可。在目标对象是医学影像中的器官时,相应的,目标域数据和源域数据可以是核磁共振成像(mri)数据集、电子计算机断层扫描(ct)数据等各种医学影像的数据集。在一种可能的实现方式中,目标域数据和源域数据可以是两种不同的医学影像的数据集,例如,目标域数据可以是mri数据集,源域数据就可以是ct数据集;或者,目标域数据可以是ct数据集,源域数据就可以是mri数据集。在一种可能的实现方式中,目标域数据和源域数据也可以是相同的医学影像的数据集,例如目标域数据和源域数据可以都是mri数据集或可以都是ct数据集,只是来源有所不同而使目标域数据和源域数据具有不同的风格和/或结构,具体的,目标域数据和源域数据可以分别是两个不同机型或两个不同医院的数据。后续各公开实施例均以目标域数据为mri数据集、源域数据为ct数据集或目标域数据为ct数据集、源域数据为mri数据集为例进行说明,在目标域数据和源域数据为其他形式的情况下,其处理方法可以根据本公开实施例提出的方法进行灵活扩展,不再举例说明。
44.如上述各公开实施例所述,源域数据、目标域数据的实现形式可以根据实际情况灵活决定。因此,获取源域数据、目标域数据的方式也可以根据实际情况灵活决定。在一种可能的实现方式中,获取源域数据、目标域数据的方式可以为通过医学影像设备直接进行数据传输。步骤s11其余的可能实现方式可以根据实际情况灵活选择,不再举例一一说明。
45.在得到了包括目标对象的源域数据、目标域数据后,可以通过步骤s12进行源域数据和目标域数据的拟合,得到拟合数据。在一种可能的实现方式中,该拟合数据具有源域数据的结构特征和目标域数据的风格特征。具体的,所述风格特征为区分所述目标域数据和所述源域数据的风格的信息,具体可以是颜色、纹理等体现图像或视频风格的特征,通过风格特征可以区分目标域数据和源域数据为mri数据集或ct数据集。例如,从图2可以很明显看出,腹部ct和mr原始图像风格有所不同,其中,图2(1)是腹部核磁原始图像,图2(3)是腹部ct原始图像。所述结构特征是指所述目标对象的空间位置及布局的信息,具体可以是目标对象的轮廓等特征。当目标域数据为mri数据集、源域数据为ct数据集时,通过步骤s12得到的拟合数据为mri风格的ct数据集。当目标域数据为ct数据集、源域数据为mri数据集时,通过步骤s12得到的拟合数据为ct风格的mri数据。所述拟合数据的具体生成方法,可以根
据实际情况灵活决定,可以参见下述各公开实施例,在此先不做展开。图2展示了ct图像和mri图像的拟合效果,图2(2)为ct风格的mr图像,图2(4)为mr风格的ct图像。
46.由于源域数据已被标注,由源域数据和目标域数据生成的拟合数据也可以携带和源域数据一样的标签,因此,在步骤s13中,可以根据带有标签的拟合数据对初始模型进行训练,得到中间模型。该中间模型相比初始模型来说,由于学习了目标域数据所具有的风格特征,会具有更好的识别目标域数据的能力。
47.自监督训练通过利用无标注数据对深度神经网络进行训练,以进行神经网络参数的微调,以使神经网络具有更好的效果。具体的,自监督训练方法是使用数据及其标签进行训练,该标签是利用图像属性或通过传统的特征设计方法自动生成的伪标签。由于自监督训练的方式需要模型具有一定的性能,而通过步骤s12和步骤s13,中间模型已经具有了目标域数据的部分分割性能,因此,可以在得到中间模型后,通过自监督训练的方式,进一步提高模型对目标域数据中的目标对象的识别能力。
48.在得到中间模型后,可以将目标域数据输入中间模型,对中间模型进行自监督训练,以进一步学习目标域数据的结构特征,得到目标模型,以提高目标模型对目标域对象的识别能力。在一种可能的实现方式中,可以根据目标域数据和其伪标签对中间模型进行迭代训练。具体的,将目标域数据输入中间模型后,可以得到该目标域数据的伪标签,伪标签就是中间模型对目标域数据的预测结果。之后,可以将该伪标签和目标域数据一同输入到中间模型,进行一次训练,得到更准确的伪标签和更新的中间模型。该训练过程可以迭代多次。本公开对具体迭代次数不作限制。通过对目标域数据的自监督学习得到的目标模型,由于学习了除目标域数据风格特征外的其他特征,相比中间模型,对目标域数据中的目标对象具有更高的识别能力。在一种可能的实现方式中,所述目标模型除用于目标对象的识别外,还可以用于目标对象的检测、分割等任务。本公开对此不作具体限定。
49.在本公开实施例中,通过已标注的源域数据的结构特征和无标注的目标域数据的风格特征所生成的拟合数据、源域数据的标签进行初始模型的训练,生成中间模型,由于拟合数据具有目标域数据的风格特征,该训练过程使得中间模型相较初始模型对目标域数据的识别能力得到提升;通过目标域数据对中间模型的自监督训练,得到目标模型,由于进一步学习了目标域数据的结构特征,该训练过程使得目标模型相较中间模型对目标域数据的识别能力得到进一步的提升,最终得到了对无标注的目标域数据有较好识别能力的模型。通过上述过程,有效提高了模型对跨域的无标注数据的识别能力,从而提升了模型在不同数据集之间的泛化能力。
50.对抗生成网络(gan)是目前计算机视觉研究领域热点研究方向之一,其解决的主要问题是如何从已有的训练样本中学习出新的样本。该模型中通常至少包括两个模块:生成模型(generative model)和判别模型(discriminative model),其中,生成模型用于生成新的数据,且该新的数据尽可能真实,判别网络用于判断新的数据的是来自真实样本集和假样本集,通过生成模型和判别模型的互相博弈学习能够产生相当好的输出。其中由于对抗生成网络能够生成目标数据集,以弥补训练数据不足的缺陷,因而对深度学习意义重大。
51.在一种可能的实现方式中,可以通过对抗生成网络利用已有的目标域数据和源域数据,生成拟合数据。具体的,可以将所述目标域数据和所述源域数据输入对训练好的抗生
成网络,生成具有目标域数据的风格特征和源域数据的结构特征的拟合数据。其中,对抗生成网络的具体实现形式在本公开实施例中不做限制,任意可以根据目标域数据的结构特征和源域数据的风格特征生成拟合数据的对抗生成网络均可。在一种可能的实现方式中,对抗生成网络可以通过目标域数据和源域数据进行对抗训练,以生成可以生成较为真实的拟合数据的对抗生成网络。本公开对对抗生成网络的训练方法不做限制,可以根据实际情况灵活选择,训练采取的损失函数也可以根据实际情况灵活选择。
52.在一种可能的实现方式中,所述对抗生成网络可以包括提取网络和生成网络。具体的,可以根据所述提取网络,提取所述目标域数据的风格特征和所述源域数据的结构特征;可以根据所述生成网络,生成包含所述源域数据的风格特征和所述目标域数据的结构特征的拟合数据。在一种可能的实现方式中,所述提取网络、生成网络可以是深度卷积网络。
53.在本公开实施例中,通过对抗生成网络将目标域数据的结构特征和源域数据的风格特征进行提取、拟合,进而生成拟合数据。拟合数据的真实度,直接决定了后续对初始模型的训练质量。由于对抗生成网络生成的新数据具有较高的真实性,因此,通过对抗生成网络能够提高生成的拟合数据的真实度,进而提高后续对初始模型的训练质量。
54.在一些可能的实现方式中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到,包括:
55.根据所述提取网络,提取所述目标域数据的第一风格特征和第一结构特征、所述源域数据的第二结构特征和第二风格特征;
56.根据所述生成网络,生成第一重建数据、第一转换数据、第二转换数据和第二重建数据,所述第一重建数据包含第一风格特征和第一结构特征,所述第一转换数据包含第一风格特征和第二结构特征,所述第二转换数据包含所述第一结构特征和第二风格特征,所述第二重建数据包含第二结构特征和第二风格特征;
57.根据所述判别网络,判别所述第一重建数据、所述第一转换数据、所述第二转换数据和所述第二重建数据的真假,得到判别结果;
58.根据所述判别结果,对所述对抗生成网络的参数进行调整。
59.在一种可能的实现方式中,如图3所示,所述对抗生成网络可以包括提取网络、生成网络和判别网络。在网络训练过程中,提取网络的目标是提取目标域数据和源域数据的特征,生成网络的目标是根据提取网络提取的特征尽量生成可以欺骗判别网络的数据,也即期望生成网络生成的数据更像真实的具有第一风格特征或具有第二风格特征的数据,而判别网络的目标是尽量把生成网络生成的具有第一风格特征与真实的目标域数据区分开,把具有第二风格特征的数据和真实的源域数据区分开。本公开对于提取网络、生成网络与判别网络的网络结构不作限制。
60.在一种可能的实现方式中,如图3所示,所述提取网络有2个,分别用于从目标域数据和源域数据中提取风格特征和结构特征。具体的,从目标域数据中提取第一风格特征和第一结构特征,从源域数据中提取第二结构特征和第二风格特征。所述生成网络有4个,用于结合目标域数据和源域数据中提取风格特征和结构特征,生成新的数据。具体的,4个生成网络可以根据第一风格特征和第一结构特征生成第一重建数据,根据第一风格特征和第二结构特征生成第一转换数据,根据第一结构特征和第二风格特征生成第二转换数据,根
据第二结构特征和第二风格特征生成第二重建数据,可以看出,第一转换数据和第二转换数据是转换了风格的数据,第一重建数据和第二重建数据是目标域数据和源域数据的重建数据。所述判别网络有2个,判别网络可以判别生成网络生成的数据的真假。具体的,两个判别网络可以分别判别所述第一重建数据和所述第一转换数据的真假、所述第二转换数据和所述第二重建数据的真假,以使生成网络生成以假乱真的图像。在训练过程中,生成网络所产生的第一重建数据、第一转换数据、第二转换数据和所述第二重建数据的质量和判别网络的判别能力都得到了交互式的改善。
61.在本公开实施例中,通过目标域数据和源域数据实现对对抗生成网络的训练。该训练过程具体包括对生成图像的生成网络的训练和对判别网络的判别网络的训练,通过生成网络和判别网络的对抗,使得对抗生成网络能够生成较真实的拟合数据,提升了拟合数据的精度,为后续通过拟合数据训练的初始模型能够较好的学习目标域数据的风格特征,提升模型识别精度。
62.在一种可能的实现方式中,所述根据所述判别结果,对所述对抗生成网络的参数进行调整,包括:
63.根据所述目标域数据和所述第一重建数据之间的差异,生成第一重建损失;
64.根据所述源域数据和所述第二重建数据之间的差异,生成第二重建损失;
65.根据所述判别网络输出的对所述第一重建数据的判别结果,生成第一判别损失;
66.根据所述判别网络输出的对所述第一转换数据的判别结果,生成第二判别损失;
67.根据所述判别网络输出的对所述第二转换数据的判别结果,生成第三判别损失;
68.根据所述判别网络输出的对所述第二重建数据的判别结果,生成第四判别损失;
69.根据所述第一重建损失、所述第二重建损失、所述第一判别损失、所述第二判别损失、所述第三判别损失和所述第四判别损失,对所述生成网络和所述判别网络进行对抗训练,获得训练后的神经网络。
70.由于对抗生成网络的训练过程主要包括对生成图像的生成网络的训练和对判别网络的判别网络的训练,在一种可能的实现方式中,该对抗生成网络的损失函数可以包括两部分:生成网络的损失和判别网络的损失。在一种可能的实现方式中,所述生成网络的损失可以包括新生成的第一重建数据和原始的目标域数据之间的重建一致性损失、新生成的第四重建数据和原始的源域数据之间的重建一致性损失。在一种可能的实现方式中,可以通过mae评价绝对误差的方式计算重建一致性损失。本公开对重建一致性损失的计算方式不做具体限定。在一种可能的实现方式中,判别网络的损失可以包括判断所有重建数据、转换数据的真假的损失。由于所述判别网络是二分类任务,在一种可能的实现方式中,所使用的损失函数可以为二值交叉熵。本公开对判别损失的计算方式不做具体限定。
71.在本公开实施例中,根据损失函数多次迭代优化生成网络和判别网络的参数,使得损失收敛,能够使得图像生成网络生成的图像更加真实,也使得判别网络的判断能力得到提升,并达到判别网络和生成网络之间的平衡。
72.在初始模型学习进行了对拟合数据和源域数据的标签学习后,得到了中间模型,由于拟合数据中仅包含了目标域数据中的风格特征,所以中间模型并没有学习到目标域数据中除风格特征以外的其他特征,为进一步提高中间模型对目标域数据中目标对象的识别能力,需对无标签的目标域数据进行进一步的学习。
73.近年来,自监督学习在图像识别、检测和分割等视觉感知任务中取得了显著的成效。借助这种学习方式可以从大规模的无标签数据中自动构造样本标签,实现网络的自监督训练,并学习到对原始任务有价值的特征表示。
74.在一种可能的实现方式中,可以对所述中间模型进行自监督训练,以使中间模型学习目标域数据中除风格特征外的其他特征。自监督学习方法是使用数据及其标注进行训练,该标注是利用图像属性或通过传统的特征设计方法自动生成的伪标注。在一种可能的实现方式中,可以将所述目标域数据输入所述中间模型,得到输出结果,作为所述目标域数据的伪标签。在得到目标域数据的伪标签后,利用目标域数据及其伪标签,对中间模型进行训练,得到更新后的中间模型。显而易见的,该更新后的中间模型已经学习到了目标域数据的除风格特征外的其他特征。
75.在完成中间模型对目标域数据的学习后,中间模型对目标域数据中的目标对象的识别能力进一步增强,可以将所述目标域数据再次输入中间模型,得到更准确的伪标签,然后用该更准确的伪标签和目标域数据对中间模型进行再一次的训练,进一步提高中间模型对目标域数据的识别能力。在一种可能的实现方式中,可以对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型。本公开对该迭代次数不做具体限定,可以根据实际情况进行选择。
76.在对中间模型进行迭代训练的过程中,不准确的伪标签所产生的噪声会有持续传递的可能,当噪声过大时,就会引起模型的崩溃。因此,如何处理伪标签所产生的噪声对模型最终的性能具有至关重要的影响。
77.为了阻断伪标签噪声的传递,在一种可能的实现方式中,可以在每次迭代过程中,在生成伪标签之后和训练中间模型之前,可以对所述中间模型的参数进行初始化。在本实施例中,由于每次迭代过程中,都进行中间模型的参数初始化,即对中间模型重新训练,这样就不会完全继承上一次迭代中的中间模型,可以避免由于伪标签的噪声传递所导致的模型崩溃。
78.在一种可能的实现方式中,按照概率p
n-i
抽取第n-i次迭代得到的中间模型的输出结果,作为第n次迭代时所使用的目标域数据的伪标签,其中n为大于1的整数,i为小于n的正整数,p
n-i
的值与n-i的值正相关。具体的,p
n-i
的具体取值可以以公式(1)进行计算。
[0079][0080]
其中,s代表衰减系数,用于控制p的取值,以使距离第n次迭代越近的迭代中中间模型输出的伪标签对第n次迭代中训练目标模型的伪标签的影响越大;n代表迭代序号;n代表用于更新第n次迭代的伪标签所使用的中间模型的个数;i∈{1,2,...,n}。
[0081]
在一种可能的实现方式中,s和n的取值可以根据实际情况进行设定,本公开对此不作限定。当s=0.6且n=3时,s1=0.6,s2=0.62=0.36,s3=0.63=0.216,经计算得知,p
n-1
=0.51,p
n-2
=0.31,p
n-3
=0.18。则第n次迭代的所述目标域数据中每个数据的伪标签以0.51的概率抽取第n-1次迭代中中间模型输出的伪标签、以0.31的概率抽取第n-2次迭代中中间模型输出的伪标签、以0.18的概率抽取第n-3次迭代中中间模型输出的伪标签。
[0082]
在本实施例中,由于每次迭代过程中所使用的伪标签按照一定概率抽取该迭代之前的多次迭代中中间模型输出的伪标签,不全部选择前一次迭代过程中训练得到的中间模
型所生成的伪标签,会减轻伪标签所产生的噪声,避免由于伪标签噪声引起的模型崩溃,且p
n-i
的值与n-i的值正相关,使得迭代次数越往后的中间模型输出的伪标签对模型参数的影响越大,能够使得中间模型趋于收敛,得到的目标模型准确度更高。
[0083]
在一种可能的实现方式中,所述方法还包括:对所述目标域数据和所述源域数据进行数据预处理,使所述目标域数据和所述源域数据的数据质量一致。在一种可能的实现方式中,所述预处理可以包括尺寸标准化和归一化。具体的,所述尺寸标准化可以包括将图像修改尺寸为256x256的分辨率,本公开对尺寸的数据不作具体限定。所述归一化可以包括,使目标域数据和源域数据分布在0~1之间。
[0084]
应用场景示例
[0085]
在电子计算机断层扫描(ct)图像上训练的分割模型只能应用在电子计算机断层扫描(ct)图像上,拿到核磁共振成像(mri)图像上就会表现的很糟糕。在仅仅标注了ct图像的情况下,我们无法用常规的训练方法,使得模型在没有mri图像的标注信息的情况下,很好的应对mri图像。因此,如何利用已标注的ct图像进行初始模型的训练,使训练得到的目标模型对mri图像具有较好的识别效果,成为目前一个亟待解决的问题。
[0086]
本公开实施例提出了一种模型训练方法,这一训练方法可以通过风格迁移和自监督训练的结合实现初始模型对ct图像的良好识别,该模型训练的过程大致分为四个步骤。
[0087]
第一步,分别获取ct图像和mri图像(其中,目标域时mri图像,源域是ct图像),该ct图像和mri图像都包含相同的人体器官。将ct图像和mri图像进行预处理,具体为:将图像修改尺寸为256x256的分辨率,然后对图像数据进行归一化,使其分布在0~1之间。
[0088]
第二步,通过训练好的对抗生成网络,进行mri图像的风格特征和ct图像的结构特征的拟合,生成拟合图像。对抗生成网络包括提取网络、生成网络和判别网络。对抗生成网络通过ct图像和mri图像进行训练。
[0089]
第三步,根据ct图像的标签和第二步得到的拟合图像,训练初始模型,得到中间模型。
[0090]
第四步,根据所述mri图像,对第三步得到中间模型进行自监督训练,得到目标模型。通过上述后处理,得到最终的目标模型,该目标模型可以对ct图像中的人体器官具有较好的识别结果。
[0091]
具体的,对抗生成网络的训练过程可以包括:
[0092]
根据提取网络,提取mri图像的第一风格特征和第一结构特征、ct图像的第二结构特征和第二风格特征;
[0093]
根据生成网络,生成第一重建图像、第一转换图像、第二转换图像和第二重建图像,所述第一重建图像包含第一风格特征和第一结构特征,所述第一转换图像包含第一风格特征和第二结构特征,所述第二转换图像包含所述第一结构特征和第二风格特征,所述第二重建图像包含第二结构特征和第二风格特征;
[0094]
根据判别网络,判别所述第一重建图像、所述第一转换图像、所述第二转换图像和所述第二重建图像的真假,得到判别结果。
[0095]
损失函数有两个:用于计算图像重建一致性损失的mae损失函数和用于计算判别损失的二至交叉熵损失函数。根据该损失函数,对所述对抗生成网络的参数进行调整。
[0096]
具体的,该自监督训练过程可以包括:
[0097]
将mri图像输入所述中间模型,得到输出结果,作为mri图像的伪标签;
[0098]
根据mri图像和其伪标签,训练所述中间模型,得到更新后的中间模型;
[0099]
对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型,其中,在第n次对中间模型进行训练时,输入中间模型的伪标签为按照概率抽取第n-3次到第n-1次迭代得到的中间模型输出的伪标签,具体的,选取第n-1次得到的伪标签的概率可以为51%,第n-2次得到的伪标签的概率可以为31%,第n-3次得到的伪标签的概率可以为18%。
[0100]
图4展示了腹部的人为标注和训练得到的模型预测结果的对比,图4的第一行图为核磁图像,第二行图为为标注或模型预测的区域,图中不同灰度代表不同区域。其中,图4(1)为人为标注区域,图4(2)为未使用域迁移和自监督方法,直接用ct图像和ct标注数据进行训练的预测区域,图4(3)为使用域迁移的方法,使用mri风格的ct标注的数据进行训练的预测区域,图4(4)为使用域迁移,加上自监督的训练的预测区域。从图4中可以看出,图4(2)、图4(3)和图4(4)三者比较,图4(2)效果最差,图4(3)较图4(2)有所提高,图4(4)效果最好,图4(4)得到的预测区域与图4(1)中人为标注的区域最为接近。
[0101]
本方法也可用于其他的同部位(如心脏)ct和mr医学影像数据的相互转化。
[0102]
通过上述过程,通过已标注的源域数据的结构特征和无标注的目标域数据的风格特征所生成的拟合数据、源域数据的标签进行初始模型的训练,生成中间模型,由于拟合数据具有目标域数据的风格特征,该训练过程使得中间模型相较初始模型对目标域数据的识别能力得到提升;通过目标域数据对中间模型的自监督训练,得到目标模型,由于进一步学习了目标域数据的结构特征,该训练过程使得目标模型相较中间模型对目标域数据的识别能力得到进一步的提升,最终得到了对无标注的目标域数据有较好识别能力的模型。通过上述过程,有效提高了模型对跨域的无标注数据的识别能力,从而提升了模型在不同数据集之间的泛化能力。
[0103]
需要说明的是,本公开实施例的模型训练方法不限于应用在上述医学图像的处理中,可以应用于任意的不同域数据,本公开对此不作限定。
[0104]
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0105]
此外,本公开还提供了模型训练装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种模型训练方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
[0106]
图5示出根据本公开实施例的模型训练装置的框图。该模型训练装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等。
[0107]
在一些可能的实现方式中,该模型训练装置可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
[0108]
如图5所示,所述模型训练装置50可以包括:
[0109]
数据获取模块51,用于获取目标域数据和源域数据,所述目标域数据和所述源域
数据中包含的目标对象相同,所述源域数据中包含的目标对象具有标签,所述目标域数据和所述源域数据包括影像数据;
[0110]
拟合数据生成模块52,用于根据所述目标域数据和所述源域数据,得到拟合数据,所述拟合数据包含所述目标域数据的风格特征和所述源域数据的结构特征,所述结构特征为所述目标对象的空间位置及布局的信息;
[0111]
全监督训练模块53,用于根据所述拟合数据和所述标签,训练初始模型,得到中间模型;
[0112]
自监督训练模块54,根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,所述目标模型用于识别所述目标域数据中包含的目标对象。
[0113]
在一种可能的实现方式中,所述拟合数据生成模块,包括:数据输入子模块,用于将所述目标域数据和所述源域数据输入对抗生成网络,所述对抗生成网络包括提取网络和生成网络;特征提取子模块,用于根据所述提取网络,提取所述目标域数据的风格特征和所述源域数据的结构特征;拟合数据生成子模块,用于根据所述生成网络,生成包含所述源域数据的风格特征和所述目标域数据的结构特征的拟合数据;其中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到。
[0114]
在一种可能的实现方式中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到,包括:根据所述提取网络,提取所述目标域数据的第一风格特征和第一结构特征、所述源域数据的第二结构特征和第二风格特征;根据所述生成网络,生成第一重建数据、第一转换数据、第二转换数据和第二重建数据,所述第一重建数据包含第一风格特征和第一结构特征,所述第一转换数据包含第一风格特征和第二结构特征,所述第二转换数据包含所述第一结构特征和第二风格特征,所述第二重建数据包含第二结构特征和第二风格特征;根据所述判别网络,判别所述第一重建数据、所述第一转换数据、所述第二转换数据和所述第二重建数据的真假,得到判别结果;根据所述判别结果,对所述对抗生成网络的参数进行调整。
[0115]
在一种可能的实现方式中,所述根据所述判别结果,对所述对抗生成网络的参数进行调整,包括:根据所述目标域数据和所述第一重建数据之间的差异,生成第一重建损失;根据所述源域数据和所述第二重建数据之间的差异,生成第二重建损失;根据所述判别网络输出的对所述第一重建数据的判别结果,生成第一判别损失;根据所述判别网络输出的对所述第一转换数据的判别结果,生成第二判别损失;根据所述判别网络输出的对所述第二转换数据的判别结果,生成第三判别损失;根据所述判别网络输出的对所述第二重建数据的判别结果,生成第四判别损失;根据所述第一重建损失、所述第二重建损失、所述第一判别损失、所述第二判别损失、所述第三判别损失和所述第四判别损失,对所述生成网络和所述判别网络进行对抗训练,获得训练后的神经网络。
[0116]
在一种可能的实现方式中,所述自监督训练模块,包括:伪标签获取子模块,用于将所述目标域数据输入所述中间模型,得到输出结果,作为所述目标域数据的伪标签;中间模型训练字母模块,用于根据所述目标域数据和所述伪标签,训练所述中间模型,得到更新后的中间模型;对所述中间模型迭代地执行上述步骤,直至得到满足预设条件的目标模型。
[0117]
在一种可能的实现方式中,所述伪标签获取子模块,包括:初始化子模块,用于将所述中间模型的参数进行初始化。
[0118]
在一种可能的实现方式中,所述自监督训练模块,包括:伪标签更新子模块,用于按照概率p
n-i
抽取第n-i次迭代得到的中间模型的输出结果,作为第n次迭代时所使用的目标域数据的伪标签,其中n为大于1的整数,i为小于n的正整数,p
n-i
的值与n-i的值正相关。
[0119]
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
[0120]
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
[0121]
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,当计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任一实施例提供的模型训练方法的指令。
[0122]
本公开实施例还提供了另一种计算机程序产品,用于存储计算机可读指令,指令被执行时使得计算机执行上述任一实施例提供的模型训练方法的操作。
[0123]
电子设备可以被提供为终端、服务器或其它形态的设备。
[0124]
图6示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
[0125]
参照图6,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。
[0126]
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
[0127]
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0128]
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
[0129]
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍
摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0130]
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
[0131]
i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0132]
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0133]
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0134]
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0135]
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
[0136]
图7示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图7,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
[0137]
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(i/o)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如windows server
tm
,mac os x
tm
,unixtm,linux
tm
,freebsd
tm
或类似。
[0138]
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算
机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
[0139]
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
[0140]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0141]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0142]
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0143]
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0144]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指
令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0145]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0146]
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0147]
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0148]
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1