技术特征:
1.一种基于血常规数据的过敏源数据提取方法,其特征在于,包括以下步骤:s1、获取血常规数据,构建数据集,对数据集进行z-score标准化,对标准化后的数据集进行划分,得到训练集、验证集和测试集;s2、基于全连接神经网络构建预测模型;s3,基于训练集对预测模型进行训练,通过类别加权,对数据集进行阴阳平衡,通过五折交叉验证,提高模型的稳定性;s4、输入待检测数据,得到模型预测结果。2.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,所述预测模型为多种,包括由3层全连接层和3层dropout层构成,以及4层全连接层和4层dropout层构成。3.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,所述数据集的划分方式为,训练集∶验证集∶测试集=6∶2∶2。4.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,基于数据集的原始均值和和标准差进行数据的标准化,z-score标准化的转换公式:其中,x为样本观测值,μ为总体数据均值,σ为总体数据的标准,使经标准化后的数据的均值为0,标准差为1。5.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,所述预测模型为y=x
×
w+b,其中,x为输入,代表年龄、性别以及22项血常规指标,y为隐藏层输出,即提取的特征向量,w为模型隐藏层权重,b为偏置项。6.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,所述类别加权为当“0”类样本数量多于“1”类样本数量时,通过调高“1”类权重达到平衡。7.根据权利要求1所述的一种基于血常规数据的过敏源数据提取方法,其特征在于,所述五折交叉验证为进行5次随机抽取,每次抽取后完成一次训练测试,得到5次的训练结果和测试结果,对其求均值得到最终模型的训练结果和测试结果。
技术总结
本发明公开了一种基于血常规数据的过敏源数据提取方法,包括以下步骤:S1、获取血常规数据,构建数据集,对数据集进行Z-Score标准化,对标准化后的数据集进行划分,得到训练集、验证集和测试集;S2、基于全连接神经网络构建预测模型;S3,基于训练集对预测模型进行训练,通过类别加权,对数据集进行阴阳平衡,通过五折交叉验证,提高模型的稳定性;S4、输入待检测数据,得到模型预测结果。得到模型预测结果。得到模型预测结果。
技术研发人员:陈超 宋彪 王亚楠
受保护的技术使用者:内蒙古卫数数据科技有限公司
技术研发日:2022.11.02
技术公布日:2023/1/19