一种中国儿童身高预测模型系统

文档序号:34367797发布日期:2023-06-04 23:20阅读:77来源:国知局
一种中国儿童身高预测模型系统的制作方法

本发明涉及身高预测领域,尤其涉及一种中国儿童身高预测模型系统。


背景技术:

1、儿童的身高生长是家长颇为关心的问题之一,然而进行身高预测的研究需要对儿童的生长发育进行长期的跟踪,准确的数据较难获得,因此目前这方面的数据和研究都非常有限。传统身高预测法有遗传身高法、tw3法、中华05法、b-p法等,影响成年身高的因素很多,如遗传、营养、运动、环境、睡眠等,而上述方法未能全面考虑同时,各方法本身存在着误差大、不适用于中国人、数据库较老等问题,故当前中国儿童身高预测准确性有较大提升空间。

2、因此,本领域的技术人员致力于开发一种身高预测方法。


技术实现思路

1、有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何进行身高预测。

2、为实现上述目的,本发明提供了一种中国儿童身高预测模型系统,其特征在于,采用长期收集的大样本数据,在综合已有研究方法的基础上,采用了多种回归模型进行建模,并在各个年龄段,采用多种评价指标进行验证;最后按照儿童生长规律,分不同年龄段选择不同的生长发育模型,构成中国儿童身高预测系统。

3、进一步地,所述预测模型系统采用了多种模型进行预测,包含线性回归、多项式回归、岭回归、拉索回归、弹性网络、支持向量机、决策树、adaboost、随机森林、神经网络、线性混合模型。。

4、进一步地,所述评价指标包括rmse、mae、r2、res_mid、pa。

5、进一步地,所述预测模型系统可以对成年身高和1,2,3年后的身高共同预测,并把预测结果格点展示在身高增长曲线上,有助于对儿童生长情况进行直观预判。

6、进一步地,所述神经网络模型为多层感知器(multilayer perceptron,mlp),它是一种监督学习算法;多层感知器模型的激活函数采用sigmoid;所述神经网络的超参数为隐藏层神经元的数量、层数和迭代轮数,不同的随机初始化权重会导致不同的测试集准确率。

7、进一步地,所述adaboost方法是一种集成学习的方法,它在迭代的每一轮中加入一个新的弱分类器,选用的所述弱分类器是一个层数较浅的决策树。

8、进一步地,所述预测模型系统建模过程中考虑分三个不同年龄段,分别是≤10岁、10~13岁和≥13岁,建立不同的模型,并与不分年龄段直接建模的结果相比较,选取其中预测精度最高者。

9、进一步地,由于男孩与女孩身高增长规律在年龄上表现不一致,发育特征也有差异,所述预测模型系统在建模时,将男孩与女孩分开讨论。

10、进一步地,所述预测模型系统在测试数据集上得到n年身高预测系统rmse≤3.6cm,mae≤3.1cm,r2≥0.955的效果。

11、进一步地,所述预测模型系统在测试数据集上得到成年身高预测系统0.8≤rmse≤1.4,0.6≤mae≤1.2,r2≥0.911的效果。

12、本发明系统的输入有测试年龄、测试身高、测试体重、测试骨龄(可选),输出为预测的成年身高和1~3年后的身高。适用年龄段较广,且包含专业机构的含骨龄预测和家庭个人版的无骨龄预测,在测试集上平均预测误差≤3cm,较已有文献中的模型提高至少30%。

13、以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。



技术特征:

1.一种中国儿童身高预测模型系统,其特征在于,采用长期大样本数据,采用了多种预测模型系统进行建模,并在各个年龄段,采用多种评价指标进行验证;最后按照儿童生长规律,分不同年龄段选择不同的生长发育模型,构成中国儿童身高预测系统。

2.如权利要求1所述的一种中国儿童身高预测模型系统,其特征在于,所述采用的长期大样本数据表示距成年至少3年以上,样本量500条以上。

3.如权利要求2所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统采用了多种模型进行预测,包含线性回归、多项式回归、岭回归、拉索回归、弹性网络、支持向量机、决策树、adaboost、随机森林、神经网络、线性混合模型;所述评价指标包括rmse、mae、r2、res_mid、pa。

4.如权利要求3所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统对成年身高和1,2,3年后的身高共同预测,并把预测结果格点展示在身高增长曲线上,对儿童生长情况进行直观预判。

5.如权利要求4所述的一种中国儿童身高预测模型系统,其特征在于,所述神经网络为多层感知器(multilayer perceptron,mlp)模型,所述多层感知器模型的激活函数采用sigmoid;所述神经网络模型的超参数为隐藏层神经元的数量、层数和迭代轮数,不同的随机初始化权重会导致不同的测试集准确率。

6.如权利要求5所述的一种中国儿童身高预测模型系统,其特征在于,所述adaboost方法是一种集成学习的方法,它在迭代的每一轮中加入一个新的弱分类器,选用的所述弱分类器是一个层数较浅的决策树。

7.如权利要求6所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统建模过程中考虑分三个不同年龄段,分别是≤10岁、10~13岁和≥13岁,建立不同的模型,并与不分年龄段直接建模的结果相比较,选取其中预测精度最高者;所述预测模型系统在建模时,将男孩与女孩分开建模。

8.如权利要求7所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统在测试数据集上得到n年身高预测系统rmse≤3.6cm,mae≤3.1cm,r2≥0.955的效果。

9.如权利要求8所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统在测试数据集上得到成年身高预测系统0.8≤rmse≤1.4,0.6≤mae≤1.2,r2≥0.911的效果。

10.如权利要求10所述的一种中国儿童身高预测模型系统,其构建方法为,在权利要求7所述的年龄段分法和分性别的情况下,每个性别和每个年龄段对应一个权利要求3中的最优模型。这些模型组合最终构建为身高预测系统。


技术总结
本发明公开了一种中国儿童身高预测模型系统,涉及身高预测领域,本发明采用重庆和上海2012‑2020年采集到的有回访儿童的各3000多条男女孩数据,在综合已有研究方法的基础上,采用了多种回归模型进行建模,并在各个年龄段,采用多种评价指标进行验证;最后按照儿童生长规律,分不同年龄段选择不同的生长发育模型,构成中国儿童身高预测系统。本发明适用年龄段较广,且包含专业机构的含骨龄预测和家庭个人版的无骨龄预测,在测试集上平均预测误差≤3cm,较已有文献中的模型提高至少30%。

技术研发人员:张小群,张玉灿,丁乔乔,金石,金磊,鲜翾,房劬,袁豪磊
受保护的技术使用者:上海交通大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1