非正态纵向高维数据下基于伪估计量的快速变量选择方法

文档序号：36712163发布日期：2024-01-16 12:08阅读：来源：国知局

技术特征：

1.非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤2中公式(1)、(2)的连接函数g()和v()，分别是根据样本数据响应变量观测值的特征在广义线性混合模型中确定的作用于期望和方差的连接函数。

3.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤4中，固定效应中的待估参数β的初始估计值设为零向量，随机效应中待估参数d的初始估计值设为单位对角矩阵，离散度参数φ的初始估计值设为1，随机效应中,随机项bi的初始估计值设为零向量。

4.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤4中，惩罚函数采用scad惩罚函数。

5.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤4中，惩罚函数采用lasso惩罚函数。

6.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤4中，迭代的两步正则算法的收敛条件为迭代次数达到预设阈值。

7.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法，其特征在于，步骤4中，迭代的两步正则算法的收敛条件为最新一次迭代与其相邻的上一次迭代得到的待估参数β、d的近似最大似然估计值的差值的2范数小于预设阈值。

技术总结
本发明公开了一种非正态纵向高维数据下基于伪估计量的快速变量选择方法，基于获取的样本数据中的数据和相应的广义线性混合模型，建立非正态响应变量的数学期望、方差和固定效应、随机效应中高维协变量的关系，在此基础上引入伪估计量，并基于伪估计量进行两步正则算法最小化估计的多次迭代运算，由此对固定效应、随机效应进行变量选择。本发明方法不仅便于计算机实现，计算效率更高，而且能够更具稳定性和计算精度。

技术研发人员：俞童慧,向黎明,王青山
受保护的技术使用者：合肥工业大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2