1.非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤2中公式(1)、(2)的连接函数g()和v(),分别是根据样本数据响应变量观测值的特征在广义线性混合模型中确定的作用于期望和方差的连接函数。
3.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤4中,固定效应中的待估参数β的初始估计值设为零向量,随机效应中待估参数d的初始估计值设为单位对角矩阵,离散度参数φ的初始估计值设为1,随机效应中,随机项bi的初始估计值设为零向量。
4.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤4中,惩罚函数采用scad惩罚函数。
5.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤4中,惩罚函数采用lasso惩罚函数。
6.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤4中,迭代的两步正则算法的收敛条件为迭代次数达到预设阈值。
7.根据权利要求1所述的非正态纵向高维数据下基于伪估计量的快速变量选择方法,其特征在于,步骤4中,迭代的两步正则算法的收敛条件为最新一次迭代与其相邻的上一次迭代得到的待估参数β、d的近似最大似然估计值的差值的2范数小于预设阈值。