本发明涉及临床分子分型,尤其涉及一种多囊卵巢综合征的分型系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、多囊卵巢综合征(polycystic ovary syndrome,pcos),是育龄期女性最常见最复杂的生殖内分泌代谢疾病之一。pcos的发病受遗传和环境双重影响,临床表现复杂多样。目前pcos的临床分型仅根据其诊断标准涉及的三大指标,即稀发/无排卵、临床/生化高雄激素血症和多囊卵巢形态,可将pcos分为严重pcos(a型)、高雄激素血症和慢性无排卵pcos(b型)、排卵型pcos(c型)和轻度pcos(d型)四型。该分型方法多依赖于临床医生根据实践经验摸索,且仅仅局限于生殖内分泌相关临床表现,忽略该疾病本质上存在代谢障碍,未将代谢指标纳入分型依据中。随着pcos研究的进展,越来越多业内专家认为amh、胰岛素抵抗等其他临床指标同样与pcos的发生发展关系密切。2020年plos medicine报道一项欧美人群研究纳入部分生殖和代谢指标,将1156名pcos分为生殖型、代谢型和中间混合型三种亚型。然而,该研究基于最严苛的nih标准纳入,整体样本量较小,且未能明确中间混合型的具体临床意义。
3、因此,现有技术中缺乏一种具有普适性且能够对多方面指标全面分析的多囊卵巢综合征分型系统,以克服现有分型方法无法满足患者个性化需求,临床分子分型精确度低的缺点。
技术实现思路
1、针对现有技术存在的不足,本发明的目的是提供一种多囊卵巢综合征的分型系统,基于医疗大数据,纳入临床内分泌、代谢等多方面的指标,利用无监督的机器学习方法,建立了一套pcos人工智能精准分型系统,用于辅助pcos的分型诊断与治疗规范化。
2、为了实现上述目的,本发明是通过如下的技术方案来实现:
3、本发明第一方面提供了一种多囊卵巢综合征的分型系统,包括:
4、数据采集模块,被配置为采集临床检测数据,对临床检测数据进行处理得到临床变量;
5、无监督学习模块,被配置为对临床变量进行无监督学习,所述无监督学习过程包括对临床变量归一化得到模型变量;
6、模型构建模块,被配置为根据模型变量,利用岭回归算法建立pcos分型诊断模型;
7、分型预测模块,被配置利用pcos分型诊断模型对多囊卵巢综合征进行分型。
8、进一步的,数据采集模块中,采集的临床检测数据为根据鹿特丹标准诊断为多囊卵巢综合征的参与者的临床检测数据。
9、进一步的,数据采集模块中,对临床检测数据进行处理得到临床变量的具体步骤为:
10、对临床检测数据进行处理得到29个临床变量;
11、通过探索性因子分析,对临床变量进行删减,得到9个最终临床变量。
12、更进一步的,对临床检测数据进行处理得到29个临床变量的具体步骤为:将临床检测数据进行规范化整理,将整理后的数据进行异常值剔除,得到处理后的临床变量。
13、更进一步的,9个最终临床变量为:体重指数、卵泡刺激素、黄体生成素、睾酮、抗苗勒氏管激素、硫酸脱氢表雄酮、性激素结合球蛋白、空腹胰岛素和空腹葡萄糖。
14、进一步的,无监督学习模块还被配置为对归一化后的模型变量进行聚类,利用得到的聚类变量分配聚类标签。
15、更进一步的,分型预测模块中,利用pcos分型诊断模型对多囊卵巢综合征进行分型的具体步骤为:
16、利用pcos分型诊断模型预测聚类标签的概率;
17、根据概率分布确定多囊卵巢综合征的分型。
18、进一步的,多囊卵巢综合征的分型包括高雄激素型、肥胖型、代谢保护型和高促性腺激素型。
19、进一步的,还包括验证模块,验证模块被配置为采用10倍交叉验证方法对pcos分型诊断模型的lambda值进行验证。
20、进一步的,还包括模型评估模块,模型评估模块被配置为利用roc曲线和auc对pcos分型诊断模型的效能进行评估。
21、以上一个或多个技术方案存在以下有益效果:
22、本发明公开了一种多囊卵巢综合征的分型系统,基于医疗大数据队列建模,纳入临床内分泌、代谢等多方面的指标,利用无监督的机器学习方法,建立了一套pcos人工智能精准分型系统,用于辅助pcos的分型诊断与治疗规范化,便于揭示pcos的内源性病因。
23、本发明对多方面指标进行了全面分析,考虑患者的个性化需求,构建了一种具有普适性的pcos分型诊断模型,通过数据模型获得量化指标,实现了pcos的精确分型,为深入研究pcos的精确治疗提供了理论依据,在一定程度上可以辅助pcos的精细化诊治。
24、本发明的多囊卵巢综合征的分型系统对于疾病个体化治疗有重要意义,为指导临床个性化治疗方案提供了重要依据。可以帮助更好地指导临床用药,提供个性化的治疗策略,更能超前识别并发症的风险,从而有助于做好提前防治工作。
25、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
1.一种多囊卵巢综合征的分型系统,其特征在于,包括:
2.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,
3.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,数据采集模块中,对临床检测数据进行处理得到临床变量的具体步骤为:
4.如权利要求3所述的多囊卵巢综合征的分型系统,其特征在于,对临床检测数据进行处理得到29个临床变量的具体步骤为:将临床检测数据进行规范化整理,将整理后的数据进行异常值剔除,得到处理后的临床变量。
5.如权利要求4所述的多囊卵巢综合征的分型系统,其特征在于,9个最终临床变量为:体重指数、卵泡刺激素、黄体生成素、睾酮、抗苗勒氏管激素、硫酸脱氢表雄酮、性激素结合球蛋白、空腹胰岛素和空腹葡萄糖。
6.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,无监督学习模块还被配置为对归一化后的模型变量进行聚类,利用得到的聚类变量分配聚类标签。
7.如权利要求6所述的多囊卵巢综合征的分型系统,其特征在于,分型预测模块中,利用pcos分型诊断模型对多囊卵巢综合征进行分型的具体步骤为:
8.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,多囊卵巢综合征的分型包括高雄激素型、肥胖型、代谢保护型和高促性腺激素型。
9.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,还包括验证模块,验证模块被配置为采用10倍交叉验证方法对pcos分型诊断模型的lambda值进行验证。
10.如权利要求1所述的多囊卵巢综合征的分型系统,其特征在于,还包括模型评估模块,模型评估模块被配置为利用roc曲线和auc对pcos分型诊断模型的效能进行评估。