基于生成对抗网络的新增学习情境识别方法

文档序号:35875210发布日期:2023-10-28 12:27阅读:28来源:国知局
基于生成对抗网络的新增学习情境识别方法

本发明属于计算机,具体涉及到新增学习情境识别方法。


背景技术:

1、移动学习(m-learning)是学习者利用移动设备,通过无线技术获取学习资料和资源,实现随时随地参与学习活动的一种学习形式,因其移动性、泛在性、普及性、灵活性、及时性等特点,广泛受到国内外教育领域专家的关注。现在对移动学习开展的相关研究工作大致分为:学习者移动行为的识别、学习者移动地点的预测以及学习情境的感知与分类等。学习者的学习行为和效率都受到学习情境的影响,因此移动学习情境的识别和相应学习情境下学习内容的推荐是研究的一个重要课题,它提供适合学习者的教育需求和特定环境的教育资源,从而提高学习者的学习质量。

2、近几年来,学习情境的感知识别相关工作逐渐受到关注,主要任务是通过移动设备传感器对学习情境相关信息进行收集,利用训练好的神经网络对信息进行分类,继而实现适合当前学习情境的学习资源推荐。如识别到学习者目前在自习室,就会向其推荐视频或习题,而当识别到学习者在室外(田径场等),可以推荐音频作为学习资料。但由于分类问题标签设置的局限性,无法收集所有学习者可能到达的地点进行整理分类,学习者也不可能只在设置好的地点学习,当面临不存在于分类中的新的学习场景时,系统可能无法识别或识别错误,这给学习情境的感知识别任务带来了困难。

3、全连接神经网络(dnn)在许多分类任务中表现出了不错的性能,但传统的dnn模型往往会遇到置信度过高的问题,面临模型已知分布外的样本或生成的随机噪声时也会给出置信度较高的分类结果,这使无法得知网络的预测结果什么时候是可靠的,面临新增样本时无法直接使用dnn进行分类。

4、生成对抗网络(generative adversarial networks,gan)是一个生成与对抗并存的神经网络,包括个判别器和个生成器,生成器用来生成越来越接近真实样本的数据,判别器用来判断输入的数据是生成器的生成结果(输出为0)还是真实样本(输出为1),两者通过对抗学习相互提升、生成更接近真实样本的数据。通过gan与损失函数联合训练,可以得到接近未知学习情境样本的数据,从而可以先将输入的数据分为已知或未知学习情境,若为已知,直接用dnn分类,若为未知,则使用零样本学习达到对未知样本进行分类的目的。因此,gan网络可以被应用于新增学习情境的识别任务中。


技术实现思路

1、本发明所要解决技术问题在于克服上述现有技术的缺点和不足,提供一种网络构建简单、网络性能较好、使用范围广泛的基于生成对抗网络的新增学习情境识别方法。

2、解决上述技术问题所采用的技术方案是由下述步骤组成:

3、(1)预处理数据

4、数据集来源于50位志愿者使用数据采集app在不同地点收集到的学习情境数据集l,学习情境特征集合x如下:

5、x={x1,x2,…,xn}

6、其中,xn表示第n条学习情境的特征,1≤n≤n,n表示所有的学习者数量,n取值至少为30000。

7、学习情境特征对应的标签集合y如下:

8、y={y1,y2,...,yn}

9、其中,yn表示第n条学习情境特征对应的标签。

10、对学习情境数据集l进行预处理如下:

11、1)填充缺失值

12、对数据集中的缺失值用0进行填充。

13、2)归一化处理向量

14、按式(1)归一化处理向量

15、

16、

17、其中,xi表示x中的向量,1≤i≤n。

18、3)转换标签

19、标签集合y中含有9类标签,用数字0~8表示,0表示教室,1表示实验室,2表示宿舍,3表示图书馆,4表示餐厅,5表示体育馆,6表示户外,7表示超市,8代表示体育场,用独热编码将标签转换为一维向量。

20、4)划分数据集

21、将学习情境数据集l划分为训练时使用的可见类别7类和训练时模型不可见的类别2类,标签为0~6的数据作为可见类别,标签为7和8的数据作为不可见类别,从可见类别中取80%作为训练集,其余20%和不可见的2类数据一起作为测试集。

22、(2)构建组合神经网络

23、组合神经网络由生成对抗网络与内外分布检测神经网络、内分布分类神经网络、零样本学习神经网络构成;生成对抗网络的输出端与内外分布检测神经网络的输入端相连,内外分布检测神经网络的输出端一路与内分布分类神经网络的输入端相连、另一路与零样本学习神经网络的输入端相连。

24、(3)训练组合神经网络

25、按下式构建损失函数loss(ood):

26、

27、

28、其中,fin(x)表示内分布,fg(x)表示生成器拟合的新分布,表示fout(x)表示外分布,d1和d2表示两个判别器,h(x)表示分类器分类结果,为一维向量,y表示分布对应的标签,在向量h(x)中对应不同的维度,h(y∣x)表示向量中的第y维度,u表示均匀分布,kl表示计算散度,ω、δ、α1和α2为超参数。

29、将训练集输入到组合神经网络中进行训练,训练批量大小为[16,128],学习率为0.0002,权重衰减为0.0,训练至损失函数收敛。

30、(4)测试组合神经网络

31、将测试集输入到训练好的组合神经网络,输出新增学习情境识别结果。

32、(5)组合神经网络性能评估

33、使用神经网络中误分类和偏离分布样例检测的基线检测器来评估训练好的组合神经网络在测试集上的效果。

34、在本发明的步骤(2)构建组合神经网络中,所述的生成对抗网络由生成器与并联的判别器1、判别器2串联构成。本发明的生成器由全连接层1与激活函数层1、随机失活层1、全连接层2、激活函数层2、随机失活层2、全连接层3、激活函数层3、随机失活层3、输出层1、激活函数层4依次串联构成。本发明的判别器1由全连接层4与激活函数层5、随机失活层4、全连接层5、激活函数层6、随机失活层5、全连接层6、激活函数层7、随机失活层6、输出层2、激活函数层8依次串联构成;判别器2的结构与判别器1的结构相同。

35、本发明的生成器的全连接层1有128个神经元,全连接层2有218个神经元,全连接层3有256个神经元,输出层1有218个神经元,激活函数层1、激活函数层2、激活函数层3均为leakyrelu函数,激活函数层4为sigmoid函数,随机失活层1、随机失活层2、随机失活层3的随机失活率均为0.5。本发明的判别器1的全连接层4有256个神经元,全连接层5有218个神经元,全连接层6有128个神经元,输出层2有1个神经元,激活函数层5、激活函数层6、激活函数层7均为leakyrelu函数,激活函数层8为sigmoid函数,随机失活层4、随机失活层5、随机失活层6的随机率均为0.5。

36、在本发明的步骤(2)构建组合神经网络中,所述的内外分布检测神经网络由全连接层7与激活函数层9、随机失活层7、全连接层8、激活函数层10、随机失活层8、全连接层9、激活函数层11、随机失活层9、输出层3、激活函数层12依次串联构成。

37、本发明的全连接层7、全连接层8、全连接层9均有218个神经元,输出层3有2个神经元,激活函数层9、激活函数层10、激活函数层11均为leakyrelu函数,激活函数层12为softmax函数,随机失活层7、随机失活层8、随机失活层9的随机失活率均为0.5。

38、在本发明的步骤(2)构建组合神经网络中,所述的内分布分类神经网络由全连接层10与随机失活层10、激活函数层13、全连接层11、随机失活层11、激活函数层14、全连接层12、随机失活层12、激活函数层15、输出层4依次串联构成。

39、本发明的全连接层10有320个神经元,全连接层11有218个神经元,全连接层12有128个神经元,输出层4有7个神经元,激活函数层13、激活函数层14、激活函数层15均为relu函数,随机失活层10、随机失活层11、随机失活层12的随机失活率均为0.5。

40、在步骤(2)构建组合神经网络中,所述的零样本学习神经网络由全连接层13与激活函数层16、随机失活层13、全连接层14、激活函数层17、随机失活层14、全连接层15、激活函数层18、随机失活层15、输出层5、激活函数层19依次串联构成。

41、本发明的全连接层13有128个神经元,全连接层14有640个神经元,全连接层15有1024个神经元,输出层5有1个神经元,激活函数层16、激活函数层17、激活函数层18均为relu函数,激活函数层19为sigmoid函数,随机失活层13、随机失活层14、随机失活层15的随机失活率均为0.5。

42、本发明与现有技术相比具有以下优点:

43、由于本发明采用了数据预处理步骤,通过对数据进行独热编码转换,使得数据便于后续神经网络的训练;对数据进行数值处理和数据集划分,有助于规范数据便于网络训练。

44、本发明使用了生成对抗网络,使网络模型产生对抗关系,交替迭代参数,共同得到优化,生成最符合预期的数据,更有利于后续网络的训练和优化,使模型得到较好的结果。

45、本发明使用了零样本学习的方法,使模型能够识别训练时未知的样本,提高了内分布分类神经网络的泛用性,在应用中表现出更好的性能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1