基于社交网络的学生风险预警模型建立技术的制作方法

文档序号:23946153发布日期:2021-02-18 13:33阅读:57来源:国知局
基于社交网络的学生风险预警模型建立技术的制作方法

[0001]
本发明涉及数据挖掘处理技术领域,尤其涉及基于社交网络的学生风险预警模型建立技术。


背景技术:

[0002]
高校教育者每年都会因学生出现的学业表现不佳以及由于心理疾病而导致的自杀等风险行为而感到困惑并寻找其中的内在因素来进行防范。这些风险行为在很大程度上影响学生的毕业,求职,甚至未来的发展。有一些传统方法可以根据不同来源的信息来预测学生的学习成绩以及心理疾病,例如学生的自我报告,从智能手机获得的行为数据、调查问卷等。其中学生的心理以及行为表现是导致这些风险行为的关键。然而,很少有研究考虑社交影响对学业表现以及社交与心理因素之间的交互影响。
[0003]
而我们利用学生在校的共现关系来建立社交网络可以挖掘社交影响的内在因素,其中共现关系的强弱正好可以代表社交关系的强弱,弥补了无法以社交媒体建立学生社交网络的不足。通过对在校大学生的校园一卡通数据(学业、生活、心理)进行挖掘,研究学生的学业表现与行为活动(社交)之间的关联,建立学生的学生画像,为高校提供学生的学业成绩预警、学习生活指导与建议、心理辅导等服务,可以帮助老师更好的了解学生。


技术实现要素:

[0004]
本发明的目的在于提供基于社交网络的学生风险预警模型建立技术,实现挖掘出心理特征是否与社交关系共同影响学业成绩,因为心理特征属于学生的内在表现(静态因素),社交行为属于外在表现(动态因素),从而得出心理因素能够影响学生的社交行为从而影响学生最后的学业表现,并通过学生的心理测评指标来进行学生的各个心理维度(焦虑、自卑、社交攻击、社交退缩、偏执、冲动等)与抑郁之间的相关性证明,来挖掘抑郁症学生背后的患病因素,从而指导高校工作者对学生进行及时的心理疏导。
[0005]
为了实现上述目的,本发明采用了如下技术方案:基于社交网络的学生风险预警模型建立技术,包括以下步骤:
[0006]
s101:获取学生的行为及心理数据,并进行数据预处理和特征提取;
[0007]
s102:对提取特征后的数据进行划分,建立学生的共现网络;
[0008]
s103:在共现网络中进行特征融合,得到学生风险预警模型的输入;
[0009]
s104:将共现网络与时间循环神经网络进行融合,进行学生风险预警。
[0010]
作为上述技术方案的进一步描述:
[0011]
所述步骤s101获取学生的行为及心理数据,并进行数据预处理和特征提取的具体方法包括以下步骤:
[0012]
s1.1:采集一个学期内的学生在校一卡通数据并对id进行加密,同时根据学生的刷卡地点对数据集进行分类;
[0013]
s1.2:采集学生在校时的班级、宿舍等心理来作为社交关系的特征;
[0014]
s1.3:采集一学期内学生的心理测评数据,提取学生心理特征。
[0015]
作为上述技术方案的进一步描述:
[0016]
所述学生心理特征有:焦虑、抑郁、自卑、偏执、强迫、依赖、社交攻击、社交退缩等共33个维度。
[0017]
作为上述技术方案的进一步描述:
[0018]
所述所述步骤s102对提取特征后的数据进行划分,建立学生的共现网络,具体方法为:
[0019]
将步骤s101获取的三个数据集提取到的特征进行融合并将其中三分之二的数据用作训练集,且按照共现地点的数量建立不同地点的共现网络,其中共现网络的权重按照当前地点学生的共现频率来计算,同时建立一个随机共现网络来对学生的共现权重进行筛选,最终得到能够代表真实社交关系的共现网络。
[0020]
作为上述技术方案的进一步描述:
[0021]
所述步骤s103在共现网络中进行特征融合,得到学生风险预警模型的输入,具体方法为:
[0022]
融合学生的行为信息以及心理特征并利用一个多层的图卷积神经网络,每一个卷积层仅处理一阶邻域信息,通过叠加若干卷积层可以实现多阶邻域的信息传递,最终得到后续模型的输入。
[0023]
作为上述技术方案的进一步描述:
[0024]
所述步骤s104将共现网络与时间循环神经网络进行融合,进行学生风险预警,具体方法为:
[0025]
利用基于attention机制的长短期人工记忆神经网络进行最后的学生学业预测以及心理健康预测,最终来进行学生风险预测,并对高校教育者发出预警信息,为高校提供学生的学业成绩预警、学习生活指导与建议、心理辅导等服务,可以帮助老师更好的了解学生的学校生活状况。
[0026]
本发明提供了基于社交网络的学生风险预警模型建立技术。具备以下有益效果:
[0027]
该基于社交网络的学生风险预警模型建立技术首先对获取学生的行为及心理数据进行预处理和特征提取;然后将得到的数据集的三分之二进行预训练,得到共现网络;其次在共现网络中进行特征融合,利用图表示学习算法得到到学生风险预警模型的输入;最后将共现网络与时间循环神经网络进行融合,并加入attention机制来分析社交关系以及心理因素对于学生异常行为的影响程度,提高了学生风险预警的可解释性,为高校教育工作者的决策提供了更好的指导。
附图说明
[0028]
图1为本发明提出的基于社交网络的学生风险预警模型建立技术的步骤示意图;
[0029]
图2为本发明中共现网络架构示意图;
[0030]
图3为本发明中学生风险预警模型架构示意图。
具体实施方式
[0031]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0032]
参照图1-3,基于社交网络的学生风险预警模型建立技术,包括:
[0033]
s101:获取学生的行为及心理数据,并进行数据预处理和特征提取。
[0034]
具体的,采集一个学期内的学生在校一卡通数据并对id进行加密,同时根据学生的刷卡地点对数据集进行分类,因为要保护隐私性,所以先对学生的个人id进行加密,其次数据集中包含的特征较多我们需要提取建立共现网络需要的特征,例如id、、pos号、刷卡次数、刷卡部门、刷卡起始时间、刷卡结束时间。其次,针对于刷pos号进行独热编码来代表学生去过的地点,最后计算出刷卡时间差即可得到当前学生在某个地点滞留的时间;采集一学期内学生的心理测评数据,其中提取心理特征有:焦虑、抑郁、自卑、偏执、强迫、依赖、社交攻击、社交退缩等共33个维度,这些测评指标的分数由0-100不等并根据心理测评问卷给出,除此之外还包含当前测评学生的基础信息,例如家庭所在地(农村、城镇、城市),因为考虑到学生的生活环境也会影响其行为,我们对其进行独热编码并纳入学生风险计算的特征当中;采集学生在校时的院系、专业、班级来作为社交关系的特征,因为这些可以直接体现学生之间的社交联系,其次也将学生的家庭年收入纳入特征当中。最终对上述三个数据集进行完特征提取按照学生进行特征拼接,方便之后共现网络的建立。
[0035]
s102:对提取特征后的数据进行划分,建立学生的共现网络。
[0036]
具体的,将上述三个数据集提取到的特征进行融合并将其中三分之二的数据用作训练集,根据学生常去的地点划分为不同的共现网络(食堂、宿舍、图书馆、教学楼、超市、浴室),在不同地点的共现关系强弱所体现的社交关系对于学生的学业表现和心理健康的影响都不一样,所以给每个地点都赋予一个权重系数α,通过学习得到。其中共现频率的计算间隔设定为1min,首先在建立共现网络时首先随机打乱时间戳来计算一个随机共现网络,然后取学生之间共现关系的阈值为随机情况的平均共现频率加二倍标准差来筛选真实数据的共现频率来建立最终的共现网络,此做法能保证我们建立的共现网络能够保留真实的朋友关系,从而剔除随机情况下的伪朋友关系。在共现网络中,学生i与学生j之间的社交关系强弱系数(网络边数)定义为l为地点的数量,n(i)为学生i在地点k的朋友(存在边的关系),为学生i和学生j在地点k的共现频率。
[0037]
s103:在共现网络中进行特征融合,得到学生风险预警模型的输入。
[0038]
具体的,如图2所提供的共现网络架构图所示,因为我们要体现现实生活中的社交关系,所以图中的学生节点还包含多个属性信息,如心理信息,所以我们利用gcn算法,可以通过多层的图卷积神经网络,每一个卷积层仅处理一阶邻域信息,通过叠加若干卷积层可以实现多阶邻域的信息传递,来实现对共现网络中的节点进行游走采样进而学习到图中的顶点的相似性,来达到对网络的拓扑结构进行向量表示的目的,首先在进行信息传播的时候顶点自身的特征信息也得到保留,在共现网络中的邻接矩阵加入自连接(单位矩阵i
n
),即其次为了在信息传递过程中保持特征矩阵h的原有分布,方式一些度数高的顶点和度数低的顶点在特征分布上产生较大的差异,要对邻接矩阵进行归一化操作
其中是的度矩阵,即最终我们定义每一个卷积层的传播规则为:h
(l)
是第i层的单元激活矩阵,即h
(0)
=x,w
(l)
是每一层的参数矩阵,gcn的每一层通过邻接矩阵a和特征矩阵h
(l)
相乘得到每个顶点邻居特征的汇总,然后再与参数最后加矩阵上激活w
(l)
相乘并最后加上激活函数σ做一次非线性变换得到聚合邻接顶点特征的矩阵h
(l+1)
。得到共现网络中顶点的向量表示以后,我们对学生的特征编码为behavior vector进行特征融合,最终得到学生风险预警模型的输入。
[0039]
s104:将共现网络与时间循环神经网络进行融合,进行学生风险预警。
[0040]
具体的,如图3所提供的风险预警模型架构图所示,利用基于attention机制的长短期人工记忆神经网络进行最后的学生学业预测以及心理健康预测,选取一个学生在不同共现网络中的向量表示并与behavior vector融合后的向量x
it
=bs
it
,t∈[1,l],其中b表示behavior vector形成的特征矩阵,l表示共现网络的个数,最终得到模型的输入。得到模型输入后首先使用长短期人工记忆神经网络编码每个输入s
it
的隐含向量:之后通过在长短期人工记忆神经网络后加入一个多层感知机来获取隐含表示:u
it
=tanh(w
w
h
it
+b
w
),并通过一个softmax函数获取归一化的权重来实现attention:最终通过每个输入获取的隐含表示与对应权重α
it
相乘,得到输出向量用于预测目标并进行学生风险行为因素的分析。
[0041]
在做学业预警分析时,考虑到社交因素对于学业成绩的影响性,我们认为社交关系较强的朋友之间也会相护影响学业表现,最终根据我们的预测结果,我们计算朋友之间和非朋友之间学业表现的相似性来检验社会影响对学习成绩的显著影响,针对于一个共现网络来说,我们定义某个学生i在当前网络n中学业表现的相似性为:其中sim(i,j)=|p
i-p
j
|用来计算学生i与学生j之间的学业表现相似性,针对于每个学生i,计算两种相似性s
f
(i)和s
nf
(i),分别代表学生i与其朋友之间的相似性以及与非朋友(在共现网络中进行bootstrap sample)之间的相似性,其中当p-value<0.0001表示当前学生在其社交网络中社交关系对于学业表现具有较高的影响。
[0042]
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0043]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1