本发明属于数据处理技术领域,涉及教育软件数据处理技术,具体为基于大数据的教育软件数据处理方法。
背景技术:
随着计算机技术在教育领域的广泛应用,网络教育应运而生,由此涌现出众多的网络教育软件,如学生网络教育软件、成人网络教育软件、游戏类网络教育软件等等,它突破了传统教室教学的时间和空间限制,其灵活快捷和交互性强等特点受到广大教育者和学习者的青睐。但现在的网络教育软件大多功能比较单一、智能化水平低。以学生网络教育软件为例来说,一方面目前学生网络教育软件其提供的学习功能和测评功能是分开的,没有根据学生学习课程的测评数据进行深入挖掘,从而得到学生所擅长和薄弱的课程类别;另一方面目前学生网络教育软件其向学生推荐课程时只是针对学生喜爱的课程类别进行推荐,没有深入考虑到学生喜爱的课程教师和学生能够接受的课程时长,使得推荐的课程过于片面化,与学生的偏好匹配度低、推荐效果差,导致学生需要花费大量时间自己搜索筛选,降低了学生的使用体验感。因此目前的学生网络教育软件无法满足用户的智能化使用需求。
技术实现要素:
为了克服上述不足,本发明提出一种基于大数据的教育软件数据处理方法,通过对学生用户在教育软件上的历史学习记录进行深入挖掘处理,能够有效弥补目前的学生网络教育软件功能比较单一和智能化水平低的弊端。
本发明的目的可以通过以下技术方案来实现:
基于大数据的教育软件数据处理方法,包括以下步骤;
s1.教育软件课程类别分类标记:对教育软件上存在的课程类别进行统计,并对统计的各课程类别按照预设的顺序进行编号,依次标记为1,2...i...n,同时对各课程类别对应的所有课程名称进行统计,进而构成各课程类别对应的课程名称集合,并获取各课程名称对应的课程教师,以此将各课程类别中各课程名称对应的课程教师进行对比,统计各课程类别中包含的课程教师数量,由此得到各课程类别中各课程教师对应的课程数量及每个课程对应的课程名称,从而对应存储在各课程类别中各课程教师对应的课程数据库中;
s2.用户基本信息获取及历史学习记录筛选:根据学生用户在该教育软件的登录账号,获取该学生用户的基本信息和该学生用户监护人的基本信息,同时根据该学生用户在该教育软件的登录账号筛选预设时间段内的各条历史学习记录,并对筛选的预设时间段内的各条历史学习记录按照学习时间的先后顺序进行编号,分别标记为1,2...j...m;
s3.学习参数集合构建:对筛选的预设时间段内的各条历史学习记录获取其对应的学习参数,并将获取的预设时间段内的各条历史学习记录对应的学习参数构成学习参数集合gw(gw1,gw2,...,gwj,...,gwm),gwj表示为预设时间段内第j条历史学习记录的第w个学习参数对应的数值,w表示为学习参数,w=r1,r2,r3,r4,r1,r2,r3,r4分别表示为课程名称,学习时长,课程时长,测试分数;
s4.各候选课程类别学习参数集合构建:从学习参数集合中提取各条历史学习记录对应的课程名称,进而将其与各课程类别对应的课程名称集合进行对比,筛选各条历史学习记录对应的课程类别,可记为f1,f2...fj...fm,以此将各条历史学习记录对应的课程类别进行相互对比,分析是否存在相同的课程类别,若存在相同的课程类别,则统计相同课程类别的数量,各相同课程类别记为候选课程类别,此时对各候选课程类别进行编号,分别标记为a,b...i...n,并对各候选课程类别统计其对应的历史学习记录总条数及各条历史学习记录对应的编号,其中各历史学习记录对应的编号可记为1,2...a...z,由此根据各候选课程类别对应的各条历史学习记录编号从学习参数集合中提取各条历史学习记录编号对应的学习参数,从而构成各候选课程类别学习参数集合pwm(pwm1,pwm2,...,pwma,...,pwmz),pwma表示为第m个候选课程类别对应的第a条历史学习记录的第w个学习参数对应的数值,m表示为候选课程类别,m=a,b...i...n;
s5.用户偏好课程类别分析:从各候选课程类别学习参数集合中提取各候选课程类别中各条历史学习记录对应的学习时长和课程时长,统计各候选课程类别中各条历史学习记录对应的学习专注力系数,进而根据各候选课程类别中各条历史学习记录对应的学习时长和学习专注力系数以及各候选课程类别对应的历史学习记录总条数统计各候选课程类别对应的偏好系数,此时将各候选课程类别按照其对应的偏好系数由大到小进行排序,得到各候选课程类别对应的排序结果,进而从排序结果中筛选排在第一位的候选课程类别作为该学生用户的偏好课程类别;
s6.用户偏好课程类别的偏好学习时长分析:根据筛选的偏好课程类别从各候选课程类别学习参数集合中提取该偏课程类别中各条历史学习记录对应的学习参数,并从中获取该偏课程类别中各条历史学习记录对应的学习时长,进而进行相互对比,分析是否存在相同的学习时长,若存在相同的学习时长,则统计相同学习时长的数量,各相同学习时长记为候选学习时长,进而统计各候选学习时长在该偏课程类别中各条历史学习记录对应的学习时长内出现的频次,以此筛选出现频次最高的候选学习时长作为该学习用户对该偏好课程类别对应的偏好学习时长;
s7.用户偏好课程类别的偏好课程教师分析:根据筛选的偏好课程类别从各候选课程类别学习参数集合中提取该偏课程类别中各条历史学习记录对应的课程教师,进而进行相互对比,分析是否存在相同的课程教师,若存在相同的课程教师,则统计相同课程教师的数量,各相同课程教师记为候选课程教师,进而统计各候选课程教师在该偏课程类别中各条历史学习记录对应的课程教师内出现的频次,以此筛选出现频次最高的候选课程教师作为该学习用户对该偏好课程类别对应的偏好课程教师;
s8.偏好课程筛选并推荐:根据得到的该学生用户对应的偏好课程类别和对应的偏好课程教师,从各课程类别中各课程教师对应的课程数据库中提取该偏好课程类别对应该偏好课程教师对应的各个课程名称,并获取各个课程名称对应的课程时长,进而将获取的各个课程名称对应的课程时长与该学生用户对应的偏好学习时长进行对比,从中筛选出与学生用户偏好学习时长相同的课程名称,由此将筛选出的课程名称推荐给该学生用户;
s9.擅长课程类别和薄弱课程类别分析:根据s4获取的各条历史学习记录对应的课程类别,由此统计出在所有历史学习记录中对应的课程类别数量,并获取各课程类别对应的历史学习记录总条数和各条历史学习记录编号,同时根据各课程类别对应的各条历史学习记录编号从学习参数集合中提取各条历史学习记录对应的测试分数,由此统计该学生用户学习的各课程类别中各条历史学习记录对应的测试成绩优异系数,进而计算该学生用户学习的各课程类别对应的平均测试成绩优异系数,以此将该学生用户学习的各课程类别按照其对应的平均测试成绩优异系数由大到小进行排序,得到该学生用户学习的各课程类别的排序结果,从而从各课程类别的排序结果中提取平均测试成绩优异系数最大的课程类别和平均测试成绩优异系数最小的课程类别,其中平均测试成绩优异系数最大的课程类别记为擅长课程类别,平均测试成绩优异系数最小的课程类别记为薄弱课程类别,此时从该学生用户的基本信息中提取该学生用户的联系方式,从该学生用户监护人的基本信息中提取该学生用户监护人的联系方式,进而将该学生用户的擅长课程类别和薄弱课程类别分别发送给该学生用户和该学生用户监护人。
优选地,所述该学生用户的基本信息包括学生姓名、年龄、年级和联系方式,该学生用户监护人的基本信息包括监护人姓名、与学生关系和联系方式。
优选地,所述s2中根据该学生用户在该教育软件的登录账号筛选预设时间段内各条历史学习记录的具体筛选方法执行以下步骤:
h1:根据该学生用户在该教育软件的登录账号,获取该登录账号下的所有历史学习记录;
h2:统计该登录账号下的所有历史学习记录对应的学习时间;
h3:将统计的所有历史学习记录对应的学习时间与预设的时间段进行匹配,若某条历史学习记录对应的学习时间处于预设的时间段内,则匹配成功,并保留该条历史学习记录,若某条历史学习记录对应的学习时间不处于预设的时间段内,则匹配失败,则放弃该条历史学习记录,由此保留下的各条历史学习记录即为预设时间段内各条历史学习记录。
优选地,所述学习参数包括课程名称、学习时长、课程时长和测试分数。
优选地,所述各候选课程类别中各条历史学习记录对应的学习专注力系数的计算公式为
优选地,所述各候选课程类别对应的偏好系数的计算公式为
优选地,所述该学生用户学习的各课程类别中各条历史学习记录对应的测试成绩优异系数的计算方法为将各条历史学习记录对应的测试分数除以该条历史学习记录对应的测试满分分数。
优选地,所述该学生用户学习的各课程类别对应的平均测试成绩优异系数的计算方法为将该学生用户学习的各课程类别中各条历史学习记录对应的测试成绩优异系数累加并除以该课程类别对应的历史学习记录总条数。
本发明的有益效果如下:
(1)本发明通过将教育软件上的所有课程进行分类标记,并根据学生用户在该教育软件的登录账号筛选预设时间段内的各条历史学习记录,并获取对应的学习参数构建学习参数集合,进而分析该学生用户的偏好课程类别、偏好学习时长和偏好课程教师,以此从教育软件上筛选符合该学生用户偏好的课程进行推荐,同时将该学生用户的学习与测试情况结合起来,根据筛选的预设时间段内的各条历史学习记录对应的测试分数,获取该学生用户学习的各课程类别对应的平均测试成绩优异系数,以此分析该学生用户的擅长课程类别和薄弱课程类别,综合以上通过对学生用户在该教育软件上的学习数据进行分析处理,弥补了目前的学生网络教育软件功能比较单一和智能化水平低的弊端,完善了网络教育软件的功能,满足了用户的智能化使用需求。
(2)本发明在向学生用户推荐课程时充分考虑了该学生用户的偏好课程类别以及对于该偏好课程类别的偏好学习时长、偏好课程教师,克服了目前学生网络教育软件课程推荐功能只针对学生喜爱的课程类别进行推荐造成的推荐过于片面化、与学生用户偏好匹配度低、推荐效果差的不足,体现了课程推荐的全面综合化,提高了偏好匹配度,大大减少了学生用户搜索符合自己偏好课程的时间,增强了学生用户的使用体验感。
(3)本发明在分析出该学生用户的擅长课程类别和薄弱课程类别时,将其分别发送给该学生用户自身和该学生用户的监护人,便于该学生用户及其监护人及时了解该学生用户的擅长课程和薄弱课程,进而能够针对薄弱课程及时采取相应措施进行处理。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的方法实施步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,基于大数据的教育软件数据处理方法,包括以下步骤;
s1.教育软件课程类别分类标记:对教育软件上存在的课程类别进行统计,并对统计的各课程类别按照预设的顺序进行编号,依次标记为1,2...i...n,同时对各课程类别对应的所有课程名称进行统计,进而构成各课程类别对应的课程名称集合,并获取各课程名称对应的课程教师,以此将各课程类别中各课程名称对应的课程教师进行对比,统计各课程类别中包含的课程教师数量,由此得到各课程类别中各课程教师对应的课程数量及每个课程对应的课程名称,从而对应存储在各课程类别中各课程教师对应的课程数据库中;
本实施例通过对教育软件上存在的课程进行分类标记,为后续根据分析出的学生用户偏好从中筛选出符合学生用户偏好的课程提供方便;
s2.用户基本信息获取及历史学习记录筛选:根据学生用户在该教育软件的登录账号,获取该学生用户的基本信息和该学生用户监护人的基本信息,其中该学生用户的基本信息包括学生姓名、年龄、年级和联系方式,该学生用户监护人的基本信息包括监护人姓名、与学生关系和联系方式,同时根据该学生用户在该教育软件的登录账号筛选预设时间段内的各条历史学习记录,其具体筛选方法执行以下步骤:
h1:根据该学生用户在该教育软件的登录账号,获取该登录账号下的所有历史学习记录;
h2:统计该登录账号下的所有历史学习记录对应的学习时间;
h3:将统计的所有历史学习记录对应的学习时间与预设的时间段进行匹配,若某条历史学习记录对应的学习时间处于预设的时间段内,则匹配成功,并保留该条历史学习记录,若某条历史学习记录对应的学习时间不处于预设的时间段内,则匹配失败,则放弃该条历史学习记录,由此保留下的各条历史学习记录即为预设时间段内各条历史学习记录,并对筛选的预设时间段内的各条历史学习记录按照学习时间的先后顺序进行编号,分别标记为1,2...j...m;
s3.学习参数集合构建:对筛选的预设时间段内的各条历史学习记录获取其对应的学习参数,其中学习参数包括课程名称、学习时长、课程时长和测试分数,并将获取的预设时间段内的各条历史学习记录对应的学习参数构成学习参数集合gw(gw1,gw2,...,gwj,...,gwm),gwj表示为预设时间段内第j条历史学习记录的第w个学习参数对应的数值,w表示为学习参数,w=r1,r2,r3,r4,r1,r2,r3,r4分别表示为课程名称,学习时长,课程时长,测试分数,本实施例构建的学习参数集合为后面构建各候选课程类别学习参数集合奠定基础;
s4.各候选课程类别学习参数集合构建:从学习参数集合中提取各条历史学习记录对应的课程名称,进而将其与各课程类别对应的课程名称集合进行对比,筛选各条历史学习记录对应的课程类别,可记为f1,f2...fj...fm,以此将各条历史学习记录对应的课程类别进行相互对比,分析是否存在相同的课程类别,若存在相同的课程类别,则统计相同课程类别的数量,各相同课程类别记为候选课程类别,此时对各候选课程类别进行编号,分别标记为a,b...i...n,并对各候选课程类别统计其对应的历史学习记录总条数及各条历史学习记录对应的编号,其中各历史学习记录对应的编号可记为1,2...a...z,由此根据各候选课程类别对应的各条历史学习记录编号从学习参数集合中提取各条历史学习记录编号对应的学习参数,从而构成各候选课程类别学习参数集合pwm(pwm1,pwm2,...,pwma,...,pwmz),pwma表示为第m个候选课程类别对应的第a条历史学习记录的第w个学习参数对应的数值,m表示为候选课程类别,m=a,b...i...n;
s5.用户偏好课程类别分析:从各候选课程类别学习参数集合中提取各候选课程类别中各条历史学习记录对应的学习时长和课程时长,统计各候选课程类别中各条历史学习记录对应的学习专注力系数
本实施例统计的各候选课程类别的偏好系数,综合了各候选课程类别的学习总时长、综合学习专注力和学习总频次,以此分析出的偏好课程类别更符合该学生用户的偏好,提高了偏好课程类别分析的准确度,避免单纯只根据候选课程类别的学习总时长或学习总频次来分析用户偏好课程造成的分析准确度低的问题;
s6.用户偏好课程类别的偏好学习时长分析:根据筛选的偏好课程类别从各候选课程类别学习参数集合中提取该偏课程类别中各条历史学习记录对应的学习参数,并从中获取该偏课程类别中各条历史学习记录对应的学习时长,进而进行相互对比,分析是否存在相同的学习时长,若存在相同的学习时长,则统计相同学习时长的数量,各相同学习时长记为候选学习时长,进而统计各候选学习时长在该偏课程类别中各条历史学习记录对应的学习时长内出现的频次,以此筛选出现频次最高的候选学习时长作为该学习用户对该偏好课程类别对应的偏好学习时长;
s7.用户偏好课程类别的偏好课程教师分析:根据筛选的偏好课程类别从各候选课程类别学习参数集合中提取该偏课程类别中各条历史学习记录对应的课程教师,进而进行相互对比,分析是否存在相同的课程教师,若存在相同的课程教师,则统计相同课程教师的数量,各相同课程教师记为候选课程教师,进而统计各候选课程教师在该偏课程类别中各条历史学习记录对应的课程教师内出现的频次,以此筛选出现频次最高的候选课程教师作为该学习用户对该偏好课程类别对应的偏好课程教师;
本实施例在向学生用户推荐课程时充分考虑了该学生用户的偏好课程类别以及对于该偏好课程类别的偏好学习时长、偏好课程教师,克服了目前学生网络教育软件课程推荐功能只针对学生喜爱的课程类别进行推荐造成的推荐过于片面化、与学生用户偏好匹配度低、推荐效果差的不足,体现了课程推荐的全面综合化,提高了偏好匹配度,大大减少了学生用户搜索符合自己偏好课程的时间,增强了学生用户的使用体验感;
s8.偏好课程筛选并推荐:根据得到的该学生用户对应的偏好课程类别和对应的偏好课程教师,从各课程类别中各课程教师对应的课程数据库中提取该偏好课程类别对应该偏好课程教师对应的各个课程名称,并获取各个课程名称对应的课程时长,进而将获取的各个课程名称对应的课程时长与该学生用户对应的偏好学习时长进行对比,从中筛选出与学生用户偏好学习时长相同的课程名称,由此将筛选出的课程名称推荐给该学生用户;
s9.擅长课程类别和薄弱课程类别分析:根据s4获取的各条历史学习记录对应的课程类别,由此统计出在所有历史学习记录中对应的课程类别数量,并获取各课程类别对应的历史学习记录总条数和各条历史学习记录编号,同时根据各课程类别对应的各条历史学习记录编号从学习参数集合中提取各条历史学习记录对应的测试分数,由此统计该学生用户学习的各课程类别中各条历史学习记录对应的测试成绩优异系数,其计算方法为将各条历史学习记录对应的测试分数除以该条历史学习记录对应的测试满分分数,本实施例统计的各条历史学习记录的测试成绩优异系数,直观展示了该学生用户每次学习的学习效果情况,其测试分数越高,测试成绩优异系数也就越高,表明该学生用户该次学习的学习效果越好,进而计算该学生用户学习的各课程类别对应的平均测试成绩优异系数,其计算方法为将该学生用户学习的各课程类别中各条历史学习记录对应的测试成绩优异系数累加并除以该课程类别对应的历史学习记录总条数,本实施例统计的各课程类别对应的平均测试成绩优异系数,能够直观反映各课程类别的平均学习效果状况,进而为后续筛选出该学生用户的擅长课程类别和薄弱课程类别提供可靠的参考依据,某课程类别的平均测试成绩优异系数越高,表明该课程类别的平均学习效果越好,间接表明该学生用户擅长该课程类别,以此将该学生用户学习的各课程类别按照其对应的平均测试成绩优异系数由大到小进行排序,得到该学生用户学习的各课程类别的排序结果,从而从各课程类别的排序结果中提取平均测试成绩优异系数最大的课程类别和平均测试成绩优异系数最小的课程类别,其中平均测试成绩优异系数最大的课程类别记为擅长课程类别,平均测试成绩优异系数最小的课程类别记为薄弱课程类别,此时从该学生用户的基本信息中提取该学生用户的联系方式,从该学生用户监护人的基本信息中提取该学生用户监护人的联系方式,进而将该学生用户的擅长课程类别和薄弱课程类别分别发送给该学生用户和该学生用户监护人。
本实施例在进行学生用户偏好课程推荐的同时,还能够根据该学生用户各条历史学习记录对应的测试分数分析该学生用户的擅长课程类别和薄弱课程类别,充分将学生在教育软件上的学习与测试结合起来,弥补了目前学生网络教育软件其提供的学习功能和测评功能分开的弊端,同时将分析得到的该学生用户的擅长课程类别和薄弱课程类别分别发送给该学生用户自身和该学生用户的监护人,便于该学生用户及其监护人及时了解该学生用户的擅长课程和薄弱课程,进而能够针对薄弱课程及时采取相应措施进行处理。
本发明通过对学生用户在该教育软件上的学习数据处理,有效利用挖掘了学生用户的历史学习数据,从而完善了教育软件的课程智能推荐功能,并实现了对学生用户擅长课程和薄弱课程的分析捕捉功能,提高了教育软件上的学习数据利用率,弥补了目前的学生网络教育软件功能比较单一和智能化水平低的弊端,满足了用户的智能化使用需求。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。