本发明涉及身高预测领域,尤其涉及一种中国儿童身高预测模型系统。
背景技术:
1、儿童的身高生长是家长颇为关心的问题之一,然而进行身高预测的研究需要对儿童的生长发育进行长期的跟踪,准确的数据较难获得,因此目前这方面的数据和研究都非常有限。传统身高预测法有遗传身高法、tw3法、中华05法、b-p法等,影响成年身高的因素很多,如遗传、营养、运动、环境、睡眠等,而上述方法未能全面考虑同时,各方法本身存在着误差大、不适用于中国人、数据库较老等问题,故当前中国儿童身高预测准确性有较大提升空间。
2、因此,本领域的技术人员致力于开发一种身高预测方法。
技术实现思路
1、有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何进行身高预测。
2、为实现上述目的,本发明提供了一种中国儿童身高预测模型系统,其特征在于,采用长期收集的大样本数据,在综合已有研究方法的基础上,采用了多种回归模型进行建模,并在各个年龄段,采用多种评价指标进行验证;最后按照儿童生长规律,分不同年龄段选择不同的生长发育模型,构成中国儿童身高预测系统。
3、进一步地,所述预测模型系统采用了多种模型进行预测,包含线性回归、多项式回归、岭回归、拉索回归、弹性网络、支持向量机、决策树、adaboost、随机森林、神经网络、线性混合模型。。
4、进一步地,所述评价指标包括rmse、mae、r2、res_mid、pa。
5、进一步地,所述预测模型系统可以对成年身高和1,2,3年后的身高共同预测,并把预测结果格点展示在身高增长曲线上,有助于对儿童生长情况进行直观预判。
6、进一步地,所述神经网络模型为多层感知器(multilayer perceptron,mlp),它是一种监督学习算法;多层感知器模型的激活函数采用sigmoid;所述神经网络的超参数为隐藏层神经元的数量、层数和迭代轮数,不同的随机初始化权重会导致不同的测试集准确率。
7、进一步地,所述adaboost方法是一种集成学习的方法,它在迭代的每一轮中加入一个新的弱分类器,选用的所述弱分类器是一个层数较浅的决策树。
8、进一步地,所述预测模型系统建模过程中考虑分三个不同年龄段,分别是≤10岁、10~13岁和≥13岁,建立不同的模型,并与不分年龄段直接建模的结果相比较,选取其中预测精度最高者。
9、进一步地,由于男孩与女孩身高增长规律在年龄上表现不一致,发育特征也有差异,所述预测模型系统在建模时,将男孩与女孩分开讨论。
10、进一步地,所述预测模型系统在测试数据集上得到n年身高预测系统rmse≤3.6cm,mae≤3.1cm,r2≥0.955的效果。
11、进一步地,所述预测模型系统在测试数据集上得到成年身高预测系统0.8≤rmse≤1.4,0.6≤mae≤1.2,r2≥0.911的效果。
12、本发明系统的输入有测试年龄、测试身高、测试体重、测试骨龄(可选),输出为预测的成年身高和1~3年后的身高。适用年龄段较广,且包含专业机构的含骨龄预测和家庭个人版的无骨龄预测,在测试集上平均预测误差≤3cm,较已有文献中的模型提高至少30%。
13、以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
1.一种中国儿童身高预测模型系统,其特征在于,采用长期大样本数据,采用了多种预测模型系统进行建模,并在各个年龄段,采用多种评价指标进行验证;最后按照儿童生长规律,分不同年龄段选择不同的生长发育模型,构成中国儿童身高预测系统。
2.如权利要求1所述的一种中国儿童身高预测模型系统,其特征在于,所述采用的长期大样本数据表示距成年至少3年以上,样本量500条以上。
3.如权利要求2所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统采用了多种模型进行预测,包含线性回归、多项式回归、岭回归、拉索回归、弹性网络、支持向量机、决策树、adaboost、随机森林、神经网络、线性混合模型;所述评价指标包括rmse、mae、r2、res_mid、pa。
4.如权利要求3所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统对成年身高和1,2,3年后的身高共同预测,并把预测结果格点展示在身高增长曲线上,对儿童生长情况进行直观预判。
5.如权利要求4所述的一种中国儿童身高预测模型系统,其特征在于,所述神经网络为多层感知器(multilayer perceptron,mlp)模型,所述多层感知器模型的激活函数采用sigmoid;所述神经网络模型的超参数为隐藏层神经元的数量、层数和迭代轮数,不同的随机初始化权重会导致不同的测试集准确率。
6.如权利要求5所述的一种中国儿童身高预测模型系统,其特征在于,所述adaboost方法是一种集成学习的方法,它在迭代的每一轮中加入一个新的弱分类器,选用的所述弱分类器是一个层数较浅的决策树。
7.如权利要求6所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统建模过程中考虑分三个不同年龄段,分别是≤10岁、10~13岁和≥13岁,建立不同的模型,并与不分年龄段直接建模的结果相比较,选取其中预测精度最高者;所述预测模型系统在建模时,将男孩与女孩分开建模。
8.如权利要求7所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统在测试数据集上得到n年身高预测系统rmse≤3.6cm,mae≤3.1cm,r2≥0.955的效果。
9.如权利要求8所述的一种中国儿童身高预测模型系统,其特征在于,所述预测模型系统在测试数据集上得到成年身高预测系统0.8≤rmse≤1.4,0.6≤mae≤1.2,r2≥0.911的效果。
10.如权利要求10所述的一种中国儿童身高预测模型系统,其构建方法为,在权利要求7所述的年龄段分法和分性别的情况下,每个性别和每个年龄段对应一个权利要求3中的最优模型。这些模型组合最终构建为身高预测系统。