医疗数据的生成方法和装置、存储介质及电子设备与流程

文档序号:35955193发布日期:2023-11-08 16:41阅读:31来源:国知局
医疗数据的生成方法和装置、存储介质及电子设备与流程

本技术涉及计算机领域,具体而言,涉及一种医疗数据的生成方法和 装置、存储介质及电子设备。


背景技术:

1、目前,在对医疗任务的进行处理的应用场景中,经常使用神经网络模 型作为处理医疗任务的工具,transformer自发布以来,依赖其知名的 attention(注意力)机制及对长序列信息处理的能力,在多类医疗任务中 完成对过往模型结构的超越,transformer被证实具有较强的序列信息学习 能力,然而,transformer模型的输入模式为二维数据,横向为序列,纵向 为词向量(token),将其他任务迁移到transformer上需要定义序列与词 向量的内容,而在医疗场景中,绝大多数医疗数据是无序的,无序训练数 据并不包含序列与词向量信息,因此无法有效使用transformer进行训练。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种医疗数据的生成方法和装置、存储介质及电 子设备,以至少解决相关技术中由于无法输入无序医疗数据,导致医疗任 务所需的医疗数据的生成准确率较低的技术问题。

2、根据本技术实施例的一个方面,提供了一种医疗数据的生成方法,包 括:获取待处理的初始医疗数据,其中,所述初始医疗数据包括不同类别 的医疗数据,所述不同类别的医疗数据共同用于处理预先配置的医疗任务; 对所述初始医疗数据执行特征提取操作,得到未按规则排列的无序特征数 据组,其中,所述无序特征数据组中的一个特征数据对应于所述初始医疗 数据中一个类别的医疗数据;对所述无序特征数据组与预训练的排序矩阵 执行注意力操作,得到经目标重排处理的有序特征数据组和目标序列信息, 其中,所述目标序列信息表示所述初始医疗数据中不同类别的医疗数据所 提取的特征数据之间的排列关系;利用所述目标序列信息将所述有序特征 数据组进行目标编码处理,以将所述有序特征数据组映射在目标向量空间, 得到对应的目标表征向量,其中,所述目标表征向量是所述目标向量空间 中表征所述有序特征数据组的向量,所述目标表征向量包括所述有序特征 数据组中特征数据之间的排列关系;根据所述目标表征向量生成目标医疗 数据,其中,所述目标医疗数据用于处理所述预先配置的医疗任务。

3、根据本技术实施例的另一方面,还提供了一种医疗数据的生成装置, 包括:

4、获取模块,用于获取待处理的初始医疗数据,其中,所述初始医疗数 据包括不同类别的医疗数据,所述不同类别的医疗数据共同用于处理预先 配置的医疗任务;

5、提取模块,用于对所述初始医疗数据执行特征提取操作,得到未按规 则排列的无序特征数据组,其中,所述无序特征数据组中的一个特征数据 对应于所述初始医疗数据中一个类别的医疗数据;

6、重排模块,用于对所述无序特征数据组与预训练的排序矩阵执行注意 力操作,得到经目标重排处理的有序特征数据组和目标序列信息,其中, 所述目标序列信息表示所述初始医疗数据中不同类别的医疗数据所提取 的特征数据之间的排列关系;

7、编码模块,用于利用所述目标序列信息将所述有序特征数据组进行目 标编码处理,以将所述有序特征数据组映射在目标向量空间,得到对应的 目标表征向量,其中,所述目标表征向量是所述目标向量空间中表征所述 有序特征数据组的向量,所述目标表征向量包括所述有序特征数据组中特 征数据之间的排列关系;

8、生成模块,用于根据所述目标表征向量生成目标医疗数据,其中,所 述目标医疗数据用于处理所述预先配置的医疗任务。

9、可选地,所述装置用于通过如下方式对所述无序特征数据组与预训练 的排序矩阵执行注意力操作,得到经目标重排处理的有序特征数据组和目 标序列信息:将所述无序特征数据组与所述预训练的排序矩阵进行注意力 操作,得到一组权重参数;将所述一组权重参数运用到所述预训练的排序 矩阵得到所述目标序列信息;根据所述目标序列信息对所述无序特征数据 组进行所述目标重排处理,得到所述有序特征数据组。

10、可选地,所述装置用于通过如下方式利用所述目标序列信息将所述有 序特征数据组进行目标编码处理,以将所述有序特征数据组映射在目标向 量空间,得到对应的目标表征向量:将所述有序特征数据组按照第一比例 执行第一重组操作,得到第一维度的第一矩阵,其中,所述第一维度由所 述第一比例的取值确定,所述第一重组操作用于增加特征数据组的维度; 对所述第一矩阵和第一位置编码矩阵执行矩阵运算,并对所述矩阵运算的结果进行所述目标编码处理,得到第一有序特征数据组,其中,所述目标 序列信息包括第一位置编码矩阵;将所述第一有序特征数据组按照第二比 例执行所述第一重组操作,得到第二维度的第二矩阵,其中,所述第二维 度由所述第二比例的取值确定;对所述第二矩阵和第二位置编码矩阵执行 所述矩阵运算,并对所述矩阵运算的结果进行所述目标编码处理,得到第 二有序特征数据组,其中,所述目标序列信息包括第二位置编码矩阵;对 第二有序特征数据组进行第二重组操作,得到目标表征向量,其中,目标 表征向量的维度与所述有序特征数据组的维度相同,所述第二重组操作用 于降低特征数据组的维度。

11、可选地,所述装置用于通过如下方式根据所述目标表征向量生成目标 医疗数据:对所述目标表征向量添加随机噪声,生成第一表征向量;对所 述第一表征向量执行目标解码操作,得到所述目标医疗数据;或者在所述 目标向量空间中获取与所述目标表征向量之间的距离满足预设距离阈值 的第二表征向量,对所述第二表征向量执行所述目标解码操作,得到所述 目标医疗数据。

12、可选地,所述装置还用于:对所述初始医疗数据执行更新操作,得到 更新医疗数据,其中,所述更新医疗数据和所述初始医疗数据均包括目标 类别的医疗数据,所述目标类别的医疗数据在所述更新医疗数据和所述初 始医疗数据中的取值不同;利用所述更新医疗数据确定与所述更新医疗数 据对应的更新表征向量,并生成更新医疗数据,其中,所述更新表征向量 的生成方式与所述目标表征向量的生成方式相同,所述更新医疗数据与所 述目标医疗数据的生成方式相同;比对所述目标医疗数据和所述更新医疗 数据,确定差异信息,其中,所述差异信息用于表示在所述目标类别的医 疗数据发生更新时,对所述目标医疗数据和所述更新医疗数据的影响程度。

13、可选地,所述装置还用于:对样本医疗数据执行所述特征提取操作, 得到未按规则排列的样本无序特征数据组;对所述样本无序特征数据组与 待训练的排序矩阵执行所述注意力操作,得到经所述目标重排处理的样本 有序特征数据组和样本序列信息,其中,所述待训练的排序矩阵是允许调 整参数的排序矩阵;利用所述样本序列信息将所述样本有序特征数据组进 行所述目标编码处理,以将所述样本有序特征数据组映射在所述目标向量 空间,得到对应的样本表征向量;根据所述样本表征向量迭代训练用于进 行所述目标编码处理,且包括所述待训练的排序矩阵的神经网络模型,其 中,在所述神经网络模型的损失值不满足预设损失条件时,调整所述神经 网络模型中的参数,在所述神经网络模型的损失值满足所述预设损失条件 时,结束训练。

14、可选地,所述装置用于通过如下方式根据所述样本表征向量迭代训练 用于进行所述目标编码处理,且包括所述待训练的排序矩阵的神经网络模 型:对所述样本表征向量执行目标重建操作,得到第一样本特征向量,其 中,所述第一样本特征向量表示与所述样本无序特征数据组对应的特征向 量;对所述样本表征向量执行目标重整操作,得到第二样本特征向量,所 述第二样本特征向量表示与所述样本有序特征数据组对应的特征向量;根据所述第一样本特征向量和所述第二样本特征向量确定所述神经网络模 型的联合损失值,并根据所述联合损失值与所述预设损失条件之间的关系 对所述神经网络模型进行迭代训练。

15、可选地,所述装置用于通过如下方式根据所述第一样本特征向量和所 述第二样本特征向量确定所述神经网络模型的联合损失值:在每次迭代训 练过程中,通过如下方式根据所述第一样本特征向量和所述第二样本特征 向量确定所述神经网络模型的联合损失值:根据所述样本无序特征数据组 和所述第一样本特征向量计算重建损失值;根据所述样本有序特征数据组 和所述第二样本特征向量计算重整损失值;根据所述样本表征向量的均值 和方差计算散度损失值;根据所述重建损失值、所述重整损失值以及所述 散度损失值确定所述联合损失值。

16、根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质, 该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设 置为运行时执行上述医疗数据的生成方法。

17、根据本技术实施例的又一方面,提供一种计算机程序产品或计算机程 序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储 在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读 取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以 上医疗数据的生成方法。

18、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器 和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所 述计算机程序执行上述的医疗数据的生成方法。

19、在本技术实施例中,采用获取包括不同类别的医疗数据的初始医疗数 据,首先,对初始医疗数据执行特征提取操作,得到未按规则排列的无序 特征数据组,再对无序特征数据组与预训练的排序矩阵执行注意力操作, 以对无序特征数据组进行排序,得到有序特征数据组和目标序列信息,然 后,利用目标序列信息将有序特征数据组编码为目标表征向量,最后,根 据上述目标表征向量生成目标医疗数据,以用于处理相关的医疗任务的方式,通过获取原有无序特征数据组中所包含的潜在序列关系,自适应地对 原始无序特征数据组进行排序,从而理解特征的最优分割与排列,达到了 利用目标序列信息将有序特征数据组编码为目标表征向量,并根据上述目 标表征向量生成目标医疗数据,以用于处理相关医疗任务的目的,从而实 现了有效拟合潜在的序列关系,提高了生成医疗任务所需的医疗数据的准 确率的技术效果,使得无序医疗数据能够转换为有序数据,以便进行后续 处理,进而解决了相关技术中由于无法输入无序医疗数据,导致医疗任务 所需的医疗数据的生成准确率较低的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1