医疗数据的生成方法和装置、存储介质及电子设备与流程

文档序号：35955193发布日期：2023-11-08 16:41阅读：31来源：国知局

本技术涉及计算机领域，具体而言，涉及一种医疗数据的生成方法和装置、存储介质及电子设备。

背景技术：

1、目前，在对医疗任务的进行处理的应用场景中，经常使用神经网络模型作为处理医疗任务的工具，transformer自发布以来，依赖其知名的 attention(注意力)机制及对长序列信息处理的能力，在多类医疗任务中完成对过往模型结构的超越，transformer被证实具有较强的序列信息学习能力，然而，transformer模型的输入模式为二维数据，横向为序列，纵向为词向量(token)，将其他任务迁移到transformer上需要定义序列与词向量的内容，而在医疗场景中，绝大多数医疗数据是无序的，无序训练数据并不包含序列与词向量信息，因此无法有效使用transformer进行训练。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本技术实施例提供了一种医疗数据的生成方法和装置、存储介质及电子设备，以至少解决相关技术中由于无法输入无序医疗数据，导致医疗任务所需的医疗数据的生成准确率较低的技术问题。

2、根据本技术实施例的一个方面，提供了一种医疗数据的生成方法，包括：获取待处理的初始医疗数据，其中，所述初始医疗数据包括不同类别的医疗数据，所述不同类别的医疗数据共同用于处理预先配置的医疗任务；对所述初始医疗数据执行特征提取操作，得到未按规则排列的无序特征数据组，其中，所述无序特征数据组中的一个特征数据对应于所述初始医疗数据中一个类别的医疗数据；对所述无序特征数据组与预训练的排序矩阵执行注意力操作，得到经目标重排处理的有序特征数据组和目标序列信息，其中，所述目标序列信息表示所述初始医疗数据中不同类别的医疗数据所提取的特征数据之间的排列关系；利用所述目标序列信息将所述有序特征数据组进行目标编码处理，以将所述有序特征数据组映射在目标向量空间，得到对应的目标表征向量，其中，所述目标表征向量是所述目标向量空间中表征所述有序特征数据组的向量，所述目标表征向量包括所述有序特征数据组中特征数据之间的排列关系；根据所述目标表征向量生成目标医疗数据，其中，所述目标医疗数据用于处理所述预先配置的医疗任务。

3、根据本技术实施例的另一方面，还提供了一种医疗数据的生成装置，包括：

4、获取模块，用于获取待处理的初始医疗数据，其中，所述初始医疗数据包括不同类别的医疗数据，所述不同类别的医疗数据共同用于处理预先配置的医疗任务；

5、提取模块，用于对所述初始医疗数据执行特征提取操作，得到未按规则排列的无序特征数据组，其中，所述无序特征数据组中的一个特征数据对应于所述初始医疗数据中一个类别的医疗数据；

6、重排模块，用于对所述无序特征数据组与预训练的排序矩阵执行注意力操作，得到经目标重排处理的有序特征数据组和目标序列信息，其中，所述目标序列信息表示所述初始医疗数据中不同类别的医疗数据所提取的特征数据之间的排列关系；

7、编码模块，用于利用所述目标序列信息将所述有序特征数据组进行目标编码处理，以将所述有序特征数据组映射在目标向量空间，得到对应的目标表征向量，其中，所述目标表征向量是所述目标向量空间中表征所述有序特征数据组的向量，所述目标表征向量包括所述有序特征数据组中特征数据之间的排列关系；

8、生成模块，用于根据所述目标表征向量生成目标医疗数据，其中，所述目标医疗数据用于处理所述预先配置的医疗任务。

9、可选地，所述装置用于通过如下方式对所述无序特征数据组与预训练的排序矩阵执行注意力操作，得到经目标重排处理的有序特征数据组和目标序列信息：将所述无序特征数据组与所述预训练的排序矩阵进行注意力操作，得到一组权重参数；将所述一组权重参数运用到所述预训练的排序矩阵得到所述目标序列信息；根据所述目标序列信息对所述无序特征数据组进行所述目标重排处理，得到所述有序特征数据组。

10、可选地，所述装置用于通过如下方式利用所述目标序列信息将所述有序特征数据组进行目标编码处理，以将所述有序特征数据组映射在目标向量空间，得到对应的目标表征向量：将所述有序特征数据组按照第一比例执行第一重组操作，得到第一维度的第一矩阵，其中，所述第一维度由所述第一比例的取值确定，所述第一重组操作用于增加特征数据组的维度；对所述第一矩阵和第一位置编码矩阵执行矩阵运算，并对所述矩阵运算的结果进行所述目标编码处理，得到第一有序特征数据组，其中，所述目标序列信息包括第一位置编码矩阵；将所述第一有序特征数据组按照第二比例执行所述第一重组操作，得到第二维度的第二矩阵，其中，所述第二维度由所述第二比例的取值确定；对所述第二矩阵和第二位置编码矩阵执行所述矩阵运算，并对所述矩阵运算的结果进行所述目标编码处理，得到第二有序特征数据组，其中，所述目标序列信息包括第二位置编码矩阵；对第二有序特征数据组进行第二重组操作，得到目标表征向量，其中，目标表征向量的维度与所述有序特征数据组的维度相同，所述第二重组操作用于降低特征数据组的维度。

11、可选地，所述装置用于通过如下方式根据所述目标表征向量生成目标医疗数据：对所述目标表征向量添加随机噪声，生成第一表征向量；对所述第一表征向量执行目标解码操作，得到所述目标医疗数据；或者在所述目标向量空间中获取与所述目标表征向量之间的距离满足预设距离阈值的第二表征向量，对所述第二表征向量执行所述目标解码操作，得到所述目标医疗数据。

12、可选地，所述装置还用于：对所述初始医疗数据执行更新操作，得到更新医疗数据，其中，所述更新医疗数据和所述初始医疗数据均包括目标类别的医疗数据，所述目标类别的医疗数据在所述更新医疗数据和所述初始医疗数据中的取值不同；利用所述更新医疗数据确定与所述更新医疗数据对应的更新表征向量，并生成更新医疗数据，其中，所述更新表征向量的生成方式与所述目标表征向量的生成方式相同，所述更新医疗数据与所述目标医疗数据的生成方式相同；比对所述目标医疗数据和所述更新医疗数据，确定差异信息，其中，所述差异信息用于表示在所述目标类别的医疗数据发生更新时，对所述目标医疗数据和所述更新医疗数据的影响程度。

13、可选地，所述装置还用于：对样本医疗数据执行所述特征提取操作，得到未按规则排列的样本无序特征数据组；对所述样本无序特征数据组与待训练的排序矩阵执行所述注意力操作，得到经所述目标重排处理的样本有序特征数据组和样本序列信息，其中，所述待训练的排序矩阵是允许调整参数的排序矩阵；利用所述样本序列信息将所述样本有序特征数据组进行所述目标编码处理，以将所述样本有序特征数据组映射在所述目标向量空间，得到对应的样本表征向量；根据所述样本表征向量迭代训练用于进行所述目标编码处理，且包括所述待训练的排序矩阵的神经网络模型，其中，在所述神经网络模型的损失值不满足预设损失条件时，调整所述神经网络模型中的参数，在所述神经网络模型的损失值满足所述预设损失条件时，结束训练。

14、可选地，所述装置用于通过如下方式根据所述样本表征向量迭代训练用于进行所述目标编码处理，且包括所述待训练的排序矩阵的神经网络模型：对所述样本表征向量执行目标重建操作，得到第一样本特征向量，其中，所述第一样本特征向量表示与所述样本无序特征数据组对应的特征向量；对所述样本表征向量执行目标重整操作，得到第二样本特征向量，所述第二样本特征向量表示与所述样本有序特征数据组对应的特征向量；根据所述第一样本特征向量和所述第二样本特征向量确定所述神经网络模型的联合损失值，并根据所述联合损失值与所述预设损失条件之间的关系对所述神经网络模型进行迭代训练。

15、可选地，所述装置用于通过如下方式根据所述第一样本特征向量和所述第二样本特征向量确定所述神经网络模型的联合损失值：在每次迭代训练过程中，通过如下方式根据所述第一样本特征向量和所述第二样本特征向量确定所述神经网络模型的联合损失值：根据所述样本无序特征数据组和所述第一样本特征向量计算重建损失值；根据所述样本有序特征数据组和所述第二样本特征向量计算重整损失值；根据所述样本表征向量的均值和方差计算散度损失值；根据所述重建损失值、所述重整损失值以及所述散度损失值确定所述联合损失值。

16、根据本技术实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述医疗数据的生成方法。

17、根据本技术实施例的又一方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如以上医疗数据的生成方法。

18、根据本技术实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过所述计算机程序执行上述的医疗数据的生成方法。

19、在本技术实施例中，采用获取包括不同类别的医疗数据的初始医疗数据，首先，对初始医疗数据执行特征提取操作，得到未按规则排列的无序特征数据组，再对无序特征数据组与预训练的排序矩阵执行注意力操作，以对无序特征数据组进行排序，得到有序特征数据组和目标序列信息，然后，利用目标序列信息将有序特征数据组编码为目标表征向量，最后，根据上述目标表征向量生成目标医疗数据，以用于处理相关的医疗任务的方式，通过获取原有无序特征数据组中所包含的潜在序列关系，自适应地对原始无序特征数据组进行排序，从而理解特征的最优分割与排列，达到了利用目标序列信息将有序特征数据组编码为目标表征向量，并根据上述目标表征向量生成目标医疗数据，以用于处理相关医疗任务的目的，从而实现了有效拟合潜在的序列关系，提高了生成医疗任务所需的医疗数据的准确率的技术效果，使得无序医疗数据能够转换为有序数据，以便进行后续处理，进而解决了相关技术中由于无法输入无序医疗数据，导致医疗任务所需的医疗数据的生成准确率较低的技术问题。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：路杰程叶碧荣
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：电动窗的电机控制方法、系统、介质及计算机设备与流程
上一篇：一种挂轨式巡检机器人充电装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。