一种基于人工智能的数据采集分析方法及系统与流程

文档序号:31197644发布日期:2022-08-20 00:58阅读:228来源:国知局
一种基于人工智能的数据采集分析方法及系统与流程

1.本发明涉及人工智能教学技术领域,尤其涉及一种基于人工智能的数据采集分析方法及系统。


背景技术:

2.随着我国学校信息化的快速发展,教育大数据成为研究热点,学生基础数据、行为数据、消费数据、成绩数据作为教育大数据的重要组成部分,能够全面、系统地反映出学生的多维度特征。如何从海量的学生校园数据提取出隐含的、有价值的信息,改变传统的对这些数据的简单查询与统计,为学生管理工作提供高效客观的决策信息,是各校亟待解决的问题。利用多种校园数据对学生的综合分析,形成学生行为画像,对学生的生活、学习情况进行预警,并将消息及时推送给辅导员和相关任课教师,有助于学校把握学生的学习动态,表扬鼓励积极向上的学生行为,对不良行为习惯进行及时纠正,引导学生向正确的、积极健康的行为活动发展,丰富学生网络思想政治教育方法,提升学生工作管理水平,进而促进学生健康成长成才。
3.现有技术未能对学生的各种信息进行有效挖掘分析,零散的记录信息无法得到学生的准确画像。


技术实现要素:

4.为解决现有技术中存在的问题,本技术提出一种基于人工智能的数据采集分析方法:包含以下步骤:
5.步骤1:获取一定数量的学生样本,所述学生样本带有多维度数据信息及标签信息,所述多维度数据信息包括所述学生的基础信息、消费信息、成绩信息、行为信息;所述标签信息包括学生的基础标签、消费标签、成绩标签及行为标签;
6.步骤2:基于学生样本的多维度数据信息及标签信息训练所构建的学生画像模型,得到训练后的学生画像模型;
7.步骤3:将待分析的学生信息输入至训练后的学生画像模型,获得学生画像。
8.可选的,所述步骤1中的基础信息包括学号、姓名、性别、出生日期、班级信息;所述消费信息包括校园卡月度消费总金额、单次最大消费金额、月度消费次数;所述成绩信息包括参加的课程信息、参加的比赛信息、获得的奖励信息、课堂表现信息、各课程的分数或等级信息;所述行为信息包括图书借阅信息,所述图书借阅信息包括图书馆中的图书借阅频次、借阅的数目种类、借阅的时长。
9.可选的,所述消费标签包括超高消费、高消费、普通消费、低消费;所述成绩标签包括成绩优异、成绩良好、成绩合格、成绩不合格;所述行为标签包括图书借阅标签,所述图书借阅标签包括学术深耕、涉猎广泛、基础借阅、低频借阅。
10.可选的,所述学生画像模型为深度学习网络模型。
11.对应的,本技术还提出了一种基于人工智能的数据采集分析系统,其特征在于:包
含以下模块:
12.信息获取模块,用于获取一定数量的学生样本,所述学生样本带有多维度数据信息及标签信息,所述多维度数据信息包括所述学生的基础信息、消费信息、成绩信息、行为信息;所述标签信息包括学生的基础标签、消费标签、成绩标签及行为标签;
13.学生画像模型构建及训练模块,用于基于学生样本的多维度数据信息及标签信息训练所构建的学生画像模型,得到训练后的学生画像模型;
14.学生画像生成模块,用于将待分析的学生信息输入至训练后的学生画像模型,获得学生画像。
15.可选的,所述基础信息包括学号、姓名、性别、出生日期、班级信息;所述消费信息包括校园卡月度消费总金额、单次最大消费金额、月度消费次数;所述成绩信息包括参加的课程信息、参加的比赛信息、获得的奖励信息、课堂表现信息、各课程的分数或等级信息;所述行为信息包括图书借阅信息,所述图书借阅信息包括图书馆中的图书借阅频次、借阅的数目种类、借阅的时长。
16.可选的,所述消费标签包括超高消费、高消费、普通消费、低消费;所述成绩标签包括成绩优异、成绩良好、成绩合格、成绩不合格;所述行为标签包括图书借阅标签,所述图书借阅标签包括学术深耕、涉猎广泛、基础借阅、低频借阅。
17.可选的,所述学生画像模型为深度学习网络模型。
18.对应的,本技术还提出一种基于人工智能的数据采集分析装置,所述装置包括存储器及处理器,所述存储器包含有计算机程序,所述计算机程序用于上述任一项所述的方法。
19.对应的,本技术还提出一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序用于执行权利要上述权利要求任一项所述的方法。
20.本技术的创造性贡献在于:
21.1.通过包括学生的基础信息、消费信息、成绩信息、行为信息等多维度数据信息;建立包括学生的基础标签、消费标签、成绩标签及行为标签等标签信息,维度丰富,能够全面反应学生的画像。
22.2.构造了不同于现有技术的学生画像模型,该学生画像模型为深度神经网络,设计了适用于该模型的激励函数和损失函数,提高学生画像模型的精度。
附图说明
23.图1为本发明的主要逻辑结构图。
具体实施方式
24.本技术提出一种基于人工智能的数据采集分析方法:包含以下步骤:
25.步骤1:获取一定数量的学生样本,所述学生样本带有多维度数据信息及标签信息,所述多维度数据信息包括所述学生的基础信息、消费信息、成绩信息、行为信息;所述标签信息包括学生的基础标签、消费标签、成绩标签及行为标签;
26.步骤2:基于学生样本的多维度数据信息及标签信息训练所构建的学生画像模型,得到训练后的学生画像模型;
27.步骤3:将待分析的学生信息输入至训练后的学生画像模型,获得学生画像。
28.可选的,所述步骤1中的基础信息包括学号、姓名、性别、出生日期、班级信息;所述消费信息包括校园卡月度消费总金额、单次最大消费金额、月度消费次数;所述成绩信息包括参加的课程信息、参加的比赛信息、获得的奖励信息、课堂表现信息、各课程的分数或等级信息;所述行为信息包括图书借阅信息,所述图书借阅信息包括图书馆中的图书借阅频次、借阅的数目种类、借阅的时长。
29.可选的,所述消费标签包括超高消费、高消费、普通消费、低消费;所述成绩标签包括成绩优异、成绩良好、成绩合格、成绩不合格;所述行为标签包括图书借阅标签,所述图书借阅标签包括学术深耕、涉猎广泛、基础借阅、低频借阅。
30.可选的,所述学生画像模型为深度学习网络模型。
31.可选的,所述深度学习网络模型包括输入层、多个隐含层、以及一个输出层,所述输入层在训练时接收学生样本数据,也可以用于接收待分析的学生信息;所述多个隐含层包括多个卷积层、一个或多个池化层以及一个全连接层;所述输出层输出学生的用户画像。
32.可选的,深度学习网络模型池化层采用如下池化方法如下:
33.xe=f(ue)
[0034][0035]
其中,xe表示当前层的输出,we表示当前层的权重,φ表示损失函数,x
e-1
表示下一层的输出,be表示偏置,δ表示一预设常数;
[0036][0037]
n表示学生样本数据集的大小,i取值1~n;q
yi
表示学生样本xi在其标签yi处的权重,m
yi
表示学生样本xi在其标签yi处的偏差,mj表示输出节点j处的偏差;θ
j,i
为学生样本xi与其对应标签yi的向量夹角。
[0038]
激励函数rl为:
[0039][0040]
n表示学生样本数据集的大小;w
yi
表示学生样本特征向量xi在其标签yi处的权重。
[0041]
可选的,深度学习网络模型所采用的损失函数为:
[0042]
式中,ψ(θ
j,i
)=(-1)kcos(mθ
j,i
)-2k,m为预设参数,1≤m≤4;
[0043]
k=abs(sign(cosθ
j,i
))-(abs(sign(cos2θ
j,i
))-sign(cosθ
j,i
))/2。
[0044]
对应的,本技术还提出了一种基于人工智能的数据采集分析系统,其特征在于:包含以下模块:
[0045]
信息获取模块,用于获取一定数量的学生样本,所述学生样本带有多维度数据信息及标签信息,所述多维度数据信息包括所述学生的基础信息、消费信息、成绩信息、行为信息;所述标签信息包括学生的基础标签、消费标签、成绩标签及行为标签;
[0046]
学生画像模型构建及训练模块,用于基于学生样本的多维度数据信息及标签信息训练所构建的学生画像模型,得到训练后的学生画像模型;
[0047]
学生画像生成模块,用于将待分析的学生信息输入至训练后的学生画像模型,获得学生画像。
[0048]
可选的,所述基础信息包括学号、姓名、性别、出生日期、班级信息;所述消费信息包括校园卡月度消费总金额、单次最大消费金额、月度消费次数;所述成绩信息包括参加的课程信息、参加的比赛信息、获得的奖励信息、课堂表现信息、各课程的分数或等级信息;所述行为信息包括图书借阅信息,所述图书借阅信息包括图书馆中的图书借阅频次、借阅的数目种类、借阅的时长。
[0049]
可选的,所述消费标签包括超高消费、高消费、普通消费、低消费;所述成绩标签包括成绩优异、成绩良好、成绩合格、成绩不合格;所述行为标签包括图书借阅标签,所述图书借阅标签包括学术深耕、涉猎广泛、基础借阅、低频借阅。
[0050]
可选的,所述学生画像模型为深度学习网络模型。
[0051]
可选的,所述深度学习网络模型包括输入层、多个隐含层、以及一个输出层,所述输入层在训练时接收学生样本数据,也可以用于接收待分析的学生信息;所述多个隐含层包括多个卷积层、一个或多个池化层以及一个全连接层;所述输出层输出学生的用户画像。
[0052]
可选的,深度学习网络模型池化层采用如下池化方法如下:
[0053]
xe=f(ue)
[0054][0055]
其中,xe表示当前层的输出,we表示当前层的权重,φ表示损失函数,x
e-1
表示下一层的输出,be表示偏置,δ表示一预设常数;
[0056][0057]
n表示学生样本数据集的大小,i取值1~n;q
yi
表示学生样本xi在其标签yi处的权重,m
yi
表示学生样本xi在其标签yi处的偏差,mj表示输出节点j处的偏差;θ
j,i
为学生样本xi与其对应标签yi的向量夹角。
[0058]
激励函数rl为:
[0059][0060]
n表示学生样本数据集的大小;w
yi
表示学生样本特征向量xi在其标签yi处的权重。
[0061]
可选的,深度学习网络模型所采用的损失函数为:
[0062]
式中,ψ(θ
j,i
)=(-1)kcos(mθ
j,i
)-2k,m为预设参数,1≤m≤4;
[0063]
k=abs(sign(cosθ
j,i
))-(abs(sign(cos2θ
j,i
))-sign(cosθ
j,i
))/2。
[0064]
对应的,本技术还提出一种基于人工智能的数据采集分析装置,所述装置包括存储器及处理器,所述存储器包含有计算机程序,所述计算机程序用于上述任一项所述的方
法。
[0065]
对应的,本技术还提出一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序用于执行权利要上述权利要求任一项所述的方法。
[0066]
需要特别说明的是,以上各种实施例或进一步限定,在不冲突的情况下可自行组合使用,都构成本发明的实际公开范围,限于篇幅,不予一一列举,但各种组合方式均落入本技术的保护范围。
[0067]
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。
[0068]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1