一种孤独症谱系障碍个体识别装置

文档序号:36654784发布日期:2024-01-06 23:41阅读:24来源:国知局
一种孤独症谱系障碍个体识别装置

本发明涉及数据处理,尤其涉及一种孤独症谱系障碍个体识别装置。


背景技术:

1、孤独症谱系障碍 (autism spectrum disorder, asd) 是一种较为严重的神经发育障碍性疾病,以语言交流异常、社会交往能力异常、重复及/或刻板行为模式为主要临床表现。目前,asd患病率已达到1:54。asd不仅会对患者的健康发展造成影响,还会给家庭和社会带来巨大压力。然而,截至目前,人们仍未探明asd的具体成因,缺乏明确的生物标记物,医生通常只能通过对患者行为、心理和发育情况进行长期观察来做出诊断,具有较大的不确定性与滞后性。因此,寻找一种快速、有效的asd诊断方法,有助于缩短诊断延迟,提高诊断精度,使患者及时得到治疗与帮助。

2、随着人工智能的高速发展与医学数据的持续扩增,人们开始探索使用神经影像数据、表型数据等医学数据,并利用智能算法对asd进行诊断。从简单的机器学习(如支持向量机、随机森林等)到复杂的深度学习(如神经网络等),这些数据驱动方法都面临一个共同的问题:数据量的不足。数据增强是一种最常用的扩充数据样本规模的方法。它利用先验知识,基于有限数据生成更多的相似数据,从而扩大数据集,并提高数据集的多样性,有助于提高分类模型的性能。

3、目前,在使用数据增强的asd识别研究中,绝大部分都是对数据集进行统一的数据增强,忽略了数据集分布的不平衡性,包括但不限于asd疾病的高异质性有关的亚型分布不平衡性,这种亚型分布的不平衡性可能是导致模型对该亚型识别准确率低的原因。因此常规的无条件的数据增强算法由于缺乏针对性补充数据的能力,导致数据增强后模型识别能力的提升并不显著。此外,现有的用于提升个体识别能力的数据增强算法,往往只对新生成数据的数量及类别比例有约束,忽略了对生成数据分布的约束。缺少数据分布约束的数据增强算法会导致生成数据集分布脱离实际数据,过于分散或聚集,限制了数据增强对模型识别能力和泛化能力的提升能力。因此需要一种有约束的条件数据增强方法对数据进行扩充,从而提高模型对asd个体的识别能力。


技术实现思路

1、鉴于此,本发明实施例提供了一种孤独症谱系障碍个体识别装置,以消除或改善现有技术中存在的一个或更多个缺陷,以解决现有技术忽略数据集分布不平衡性且对数据增强产生的新数据缺少分布约束的问题。

2、本发明提供一种孤独症谱系障碍个体识别装置,所述装置包括:

3、核磁共振成像设备用于采集待测用户的待测fmri数据,并基于所述待测fmri数据和分区图谱提取各脑区的待测bold信号时间序列数据,对两两脑区的所述待测bold信号时间序列数据做相关性强度计算,得到每个被试的待测功能连接网络,取所述待测功能连接网络的上三角元素并向量化作为该被试的待识别特征向量;分类识别处理模块,所述分类识别处理模块预装载孤独症谱系障碍个体识别模型,所述孤独症谱系障碍个体识别模型以所述待测用户的所述待识别特征向量为输入,并输出孤独症谱系障碍个体分类识别结果;

4、其中,所述孤独症谱系障碍个体识别模型的预训练步骤包括:

5、获取第一训练数据集,所述第一训练数据集包括多个被试数据,所述被试数据是针对健康被试或孤独症谱系障碍被试对应fmri数据的各脑区bold信号时间序列数据,对两两脑区的所述bold信号时间序列数据做相关性强度计算,得到每个被试的功能连接网络,取功能连接网络的上三角元素并向量化作为该被试的特征向量,每个被试数据添加该被试属于健康或孤独症谱系障碍的标签;

6、获取预训练的初始分类模型,用所述初始分类模型对所述第一训练数据集中的每个被试进行多次分类,将分类正确率大于等于设定阈值的标记为易分类个体,将分类正确率小于设定阈值的标记为难分类个体;将所述易分类个体中的健康被试数据归为第一数据集合,将所述易分类个体中的孤独症谱系障碍被试数据归为第二数据集合;将所述难分类个体对应的被试数据归为第三数据集合;基于第一预设算法计算所述第一数据集合的第一中心以及所述第二数据集合的第二中心,以代表其平均水平;以及计算所述第一数据集合中所有被试数据距离所述第一中心的第一平均距离,计算所述第二数据集合中所有被试数据距离所述第二中心的第二平均距离;

7、在设定约束条件下,对所述第三数据集合中的每个被试的特征向量,添加具有设定缩放系数的高斯噪声以生成新被试数据,将所述第三数据集合添加噪声后的新被试数据按照原始被试标签加入所述第一数据集合或所述第二数据集合,使所述第一数据集合和所述第二数据集合中的新旧被试数量一致,实现数据增强;所述设定约束条件为,令所述第一中心或所述第二中心中与所述新被试数据标签相同的为同类中心,令所述第一中心或所述第二中心中与所述新被试数据标签不同的为异类中心,所述新被试数据与所述同类中心的距离小于所述新被试数据与所述异类中心的距离;以及,在所述新被试数据按照标签类别并入所述第一数据集合或所述第二数据集合后,基于所述第一预设算法重新计算合并后所述第一数据集合的第三中心,计算合并后所述第一数据集中所有被试数据与所述第三中心的第三平均距离,要求所述第三平均距离与所述第一平均距离的偏差符合第一设定范围;或,基于所述第一预设算法重新计算合并后所述第二数据集合的第四中心,计算合并后所述第二数据集中所有被试数据与所述第四中心的第四平均距离,要求所述第四平均距离与所述第二平均距离的偏差符合第二设定范围;

8、利用数据增强后的所述第一数据集合和所述第二数据集合构建第二训练数据集,利用所述第二训练数据集对所述初始分类模型进行训练,对参数进行微调优化得到所述孤独症谱系障碍个体识别模型。

9、在一些实施例中,所述初始分类模型为支持向量机。

10、在一些实施例中,基于第一预设算法计算所述第一数据集合的第一中心以及所述第二数据集合的第二中心,包括:

11、采用动态时间规划重心平均算法计算所述第一数据集合的第一中心以及所述第二数据集合的第二中心;

12、计算所述第一数据集合中所有被试数据距离所述第一中心的第一平均距离,计算所述第二数据集合中所有被试数据距离所述第二中心的第二平均距离中,采用动态时间规整距离进行计算。

13、在一些实施例中,添加具有设定缩放系数的高斯噪声以生成新被试数据,表达式为:

14、;

15、其中,bnew表示添加高斯噪声后的新被试数据,b为所述第三数据集合中的原始数据,β表示缩放系数。

16、在一些实施例中,所述孤独症谱系障碍个体识别模型的预训练步骤还包括:

17、将所述第一训练数据集按照设定比例划分为训练集和测试集,所述训练集用于进行数据增强构建所述第二训练数据集对所述孤独症谱系障碍个体识别模型进行参数微调优化,所述测试集用于对所述孤独症谱系障碍个体识别模型进行最终测试。

18、在一些实施例中,所述第一训练数据集采用abide i数据集,并对每个被试的fmri数据选择cc200分区图谱划分脑区并提取bold信号时间序列数据。

19、在一些实施例中,所述装置还包括:对两两脑区的所述bold信号时间序列数据做pearson相关计算得到每个被试的功能连接网络。

20、在一些实施例中,所述约束条件中,令所述第一中心或所述第二中心中与所述新被试数据标签相同的为同类中心,令所述第一中心或所述第二中心中与所述新被试数据标签不同的为异类中心,所述新被试数据与所述同类中心的距离小于所述新被试数据与所述异类中心的距离,表达式为:

21、;

22、其中,d表示动态时间规整距离,bnew表示添加高斯噪声后的新被试数据,表示所述第二中心,表示所述第一中心;asd表示孤独症谱系障碍个体,hc表示健康个体。

23、在一些实施例中,所述约束条件中,在所述新被试数据按照标签类别并入所述第一数据集合或所述第二数据集合后,基于所述第一预设算法重新计算合并后所述第一数据集合的第三中心,计算合并后所述第一数据集中所有被试数据与所述第三中心的第三平均距离,要求所述第三平均距离与所述第一平均距离的偏差符合第一设定范围;或,基于所述第一预设算法重新计算合并后所述第二数据集合的第四中心,计算合并后所述第二数据集中所有被试数据与所述第四中心的第四平均距离,要求所述第四平均距离与所述第二平均距离的偏差符合第二设定范围,表达式为:

24、;

25、其中,n1表示在所述新被试数据按照标签类别并入后所述第一数据集合后的被试数,n2表示在所述新被试数据按照标签类别并入后所述第二数据集合后的被试数;表示初始状态下所述第一数据集合中各被试数据与所述第一中心的平均距离,表示初始状态下所述第二数据集合中各被试数据与所述第二中心的平均距离;bnew表示添加高斯噪声后的新被试数据,an表示并入所述新被试数据后所述第二数据集合中的被试数据,cn表示并入所述新被试数据后所述第一数据集合中的被试数据,asd表示孤独症谱系障碍个体,hc表示健康个体。

26、在一些实施例中,所述设定阈值为80%。

27、本发明的有益效果至少是:

28、本发明所述孤独症谱系障碍个体识别装置中,分类识别处理模块所装载的孤独症谱系障碍个体识别模型,在训练过程中对训练数据区分易分类个体和难分类个体,利用难分类个体添加高斯噪声生成新数据进行数据增强规模扩充,扩充过程中通过对数据分布特征建立约束,一方面要求新数据相对同类标签易分类个体中心距离接近,相对异类标签易分类个体中心距离较远,另一方面,要求新数据加入后,易分类个体中健康个体组和asd组内各被试数据到数据中心的平均距离与原始状态的偏差符合设定范围。利用增强后的数据对模型进行参数微调优化,提升了模型对asd个体的识别准确度和泛化能力。

29、本发明的附加优点、目的,以及特征将在下面的描述中部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。

30、本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1