一种网络教学资源的个性化推荐系统和推荐方法
【专利摘要】本发明公开了一种网络教学资源推荐系统及方法。该系统包括:数据构建模块,其构建教师行为数据、教师模型数据、课程模型数据、资源模型数据;离线数据处理模块,其用于初始化和调整课程模型数据和资源模型数据,并利用教师行为数据推断教师身份,根据教师行为数据计算资源之间的关联度,根据资源模型数据计算资源之间的相似度,根据资源模型数据和课程模型数据计算课程与资源之间的关联度;在线推荐模块,其利用资源之间的关联度、资源之间的相似度、课程与资源的关联度、教师的动态描述在线推荐资源,还根据教师对推荐资源的反馈推荐资源标签,并通过UI交互,将教师的行为数据传输到数据构建模块的教师行为数据中。
【专利说明】一种网络教学资源的个性化推荐系统和推荐方法
【技术领域】
[0001]本发明涉及计算机互联网【技术领域】,具体来说涉及一种在网络化教学资源方面的个性化推荐系统及其实现方法。
【背景技术】
[0002]随着E-Learning的崛起,网络教学资源也在以迅猛的方式增长,信息的超载给教学组织者和学习者带来了许多挑战,他们不得不花费大量的时间和精力,才能筛选出符合自己需求的教学资源,因此,在商业领域大放异彩的推荐系统,也开始逐渐应用到教育领域,其利用用户的历史行为数据,进行个性化计算,发现用户兴趣点,引导用户逐渐发现需求信息或资源,这在很大程度上,提高了用户的工作和学习效率。
[0003]当前比较流行的推荐算法有协同过滤推荐(Collaborative filtering,简称CF)、基于内容的推荐(Content-based recommendation,简称CB)、基于知识的推荐(Knowledge-based recommendation)和混合推荐(Hybrid recommendation)算法。协同过滤算法是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品;基于内容的推荐,主要来源于信息检索领域,其原理是通过分析用户过去选择物品的内容,提取文本特征,在未选择的物品中,根据文本特征,计算物品相似性,实现推荐;基于知识的推荐通过与用户之间的交互,如限定购买价格区间、品牌、功能等条件,来不断逼近用户的心理预期;混合推荐算法是通过不同的方式将以上三种方法进行融合,优势互补,实现推荐。
[0004]结合商业领域的推荐方法,研究人员提出了多种在E-Learning中的推荐系统,包括在推荐系统中融入本体结构,CB、CF和数据挖掘混合方法等。在正式的中小学教学过程中,教师需要准备大量的教学素材和资料,来为授课做准备,且在国内中小学教学中,存在着学生用书地域性差异、教师水平层次不齐等问题。目前很多推荐系统推荐精度偏低,直接使用协同过滤方法,缺乏对课程内容的了解认识,造成推荐资源的过时,推荐结果与所准备课程任务的关联度偏低的问题,且系统在初始运行时,新用户或新资源的加入,缺少历史行为记录,因此易造成用户历史行为数据稀疏,以及冷启动等问题;本体是通过特定领域词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延规则的形式化表达,通常需要该领域的专家来进行构建和维护,在推荐系统中采用本体结构,需要很大的人力物力投入,因此,需要一种能够基于课程内容,能节省人工成本,推荐相关教学资源的个性化推荐系统。
【发明内容】
[0005](一 )要解决的技术问题
[0006]本发明欲解决的技术问题是在正式教学中,如何充分挖掘课程内容,分析教学资源内容和资源之间的关联关系,以及如何将课程、教学资源和教师行为相结合,实现基于标签集和教师行为的网络教学资源推荐。
[0007]( 二 )技术方案[0008]本发明提供了一利网络教学资源推荐系统,其特征在于,包括:
[0009]数据构建模块,其构建教师行为数据、教师模型数据、课程模型数据、资源模型数据;
[0010]离线数据处理模块,其用于初始化和调整课程模型数据和资源模型数据,并利用教师行为数据推断教师身份,根据教师行为数据计算资源之间的关联度,根据资源模型数据计算资源之间的相似度,根据资源模型数据和课程模型数据计算课程与资源之间的关联度;
[0011]在线推荐模块,其利用资源之间的关联度、资源之间的相似度、课程与资源的关联度、教师的动态描述在线推荐资源,还根据教师对推荐资源的反馈推荐资源标签,并将教师产生的行为数据发送给数据构建模块,以更新教师行为数据。
[0012]本发明还提供了一种网络教学资源推荐方法,其特征在于,包括:
[0013]数据构建步骤,其构建教师行为数据、教师模型数据、课程模型数据、资源模型数据;
[0014]离线数据处理步骤,其用于初始化和调整课程模型数据和资源模型数据,并利用教师行为数据推断教师身份,根据教师行为数据计算资源之间的关联度,根据资源模型数据计算资源之间的相似度,根据资源模型数据和课程模型数据计算课程与资源之间的关联度;
[0015]在线推荐步骤,其利用资源之间的关联度、资源之间的相似度、课程与资源的关联度、教师的动态描述在线推荐资源,还根据教师对推荐资源的反馈推荐资源标签,并根据教师产生的行为数据更新教师行为数据。
[0016](三)有益效果
[0017]从上述技术方案可以看出,本发明具有以下有益效果:
[0018]针对教师用户的特性和需求,从海量资源库中筛选适于教师的教学资源,克服网络资源库信息过载的问题。
[0019]1、本发明采用知识决策树结构,是依据教学使用书籍的编排结构,进行设计,同时,使用决策树中的一条路径,来表示教师模型的动态描述,在此树状结构下筛选相关网络资源,可以提高推荐的精度和质量。
[0020]2、本发明采用基于内容和标签的推荐方法,可以有效避免冷启动和数据稀疏问题,给推荐系统带来的影响。
[0021]3、本发明使用关联规则挖掘方法,是基于同一教师在短时间内的操作具有目的连续性的假设,将其转化为可以使用关联规则挖掘方法处理的问题,计算教学资源之间的关联度,降低数据稀疏情况下,使用协同过滤算法寻找近邻困难的影响。
[0022]4、本发明使用潜在语义分析、统计、聚类等方法,通过教师行为记录,对课程标签和资源标签进行过滤扩展,随着行为记录的增加,系统中的课程标签和资源标签会变得越来越稳定和准确,有效降低基于内容推荐方法在提取关键词的不准确性。
【专利附图】
【附图说明】
[0023]图1是本发明中网络教学资源推荐系统的结构框图;
[0024]图2是本发明中教师模型模块的数据结构示意图;[0025]图3(a)是本发明中课程模型模块的数据结构示意图;
[0026]图3(b)是图3(a)符号的说明示意图;
[0027]图4是本发明中资源模型模块的数据结构示意图;
[0028]图5(a)是本发明中网络爬虫模块的工作流程示意图;
[0029]图5(b)是本发明中文本分析模块的工作流程示意图;
[0030]图6是本发明中资源混合推荐模块的工作流程示意图;
[0031]图7是本发明中网络教学资源的推荐方法中离线处理部分的方法流程图;
[0032]图8(a)示出了本发明网络教学资源的推荐方法中在线处理部分的方法流程图;
[0033]图8(b)示出了本发明中在线处理部分中课程选择的详细流程示意图。
【具体实施方式】
[0034]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
[0035]如图1所示,本发明公开了一种网络教学资源的推荐系统,该系统分为数据构建模块、离线数据处理模块和在线推荐模块,由教师行为记录模块101、教师模型102、课程模型103、资源模型104、教师动态描述推理模块105、资源关联度计算模块110、课程标签调整模块106和107、资源标签调整模块108和109、课程资源关联度计算模块111、资源相似性计算模块112、资源混合推荐模块113、标签推荐模块114和UI交互模块115,共15个模块构成。其中,教师行为记录模块101、教师模型102、课程模型103和资源模型104构成数据构建模块,是系统的数据基础;教师动态描述推理模块105、课程标签调整模块106和107、资源标签调整模块108和109、资源关联度计算模块110、课程资源关联度计算模块111、资源相似性计算模块112构成离线数据处理模块,离线数据处理模块从数据构建模块获取相应的数据,进行分析计算;资源混合推荐模块113、标签推荐模块114和Π交互模块115构成在线推荐模块,在线推荐模块在离线模块分析的基础上,针对教师在UI界面中的不同行为,搜索资源和资源标签,并将这些行为收集到数据构建模块的教师行为记录数据库中。下面分别对这些模块进行介绍。
[0036]教师行为记录101,用于记录教师在系统平台上,进行的各种操作,为个性化推荐提供数据基础。根据教师的不同行为,可将教师行为记录分为教师资源行为记录、教师教学任务记录和教师标签行为记录。教师资源行为记录是记录教师在Π交互模块115中,对资源的操作行为,包括下载、评分、收藏、浏览,如表I所示,每个教师具有一个教师ID,每个资源也具有资源ID,教师资源行为记录中关联存储教师对资源的行为、教师ID、资源ID和操作时间;教师教学任务记录是指教师在Π交互模块115中,进行的教学设计和备课操作,如表2所示,其中关联存储教师ID、课程ID和教学任务内容以及操作时间;教师标签行为记录是指Π交互模块115中,教师对推荐的资源标签进行的操作,包括选择、修改、删除,如表3所示,其中关联存储教师ID、资源ID、推荐标签、操作后标签和操作时间。
[0037]表I教师资源行为记录
【权利要求】
1.一种网络教学资源推荐系统,其特征在于,包括: 数据构建模块,其构建教师行为数据、教师模型数据、课程模型数据、资源模型数据; 离线数据处理模块,其用于初始化和调整课程模型数据和资源模型数据,并利用教师行为数据推断教师身份,根据教师行为数据计算资源之间的关联度,根据资源模型数据计算资源之间的相似度,根据资源模型数据和课程模型数据计算课程与资源之间的关联度; 在线推荐模块,其利用资源之间的关联度、资源之间的相似度、课程与资源的关联度、教师的动态描述在线推荐资源,还根据教师对推荐资源的反馈推荐资源标签,并将教师产生的行为数据发送给数据构建模块,以更新教师行为数据。
2.如权利要求1所述的系统,其特征在于, 所述教师行为数据包括:教师资源行为记录、教师教学任务记录和教师标签行为记录,其中教师资源行为记录包括教师对资源的行为,教师教学任务记录包括教师进行的教学设计和备课操作,教师标签行为记录包括教师对资源标签的操作; 所述教师模型数据包括教师的静态描述和动态描述,静态描述指教师的基本信息,动态描述包括教师所教课程的属性; 所述课程模型数据包括知识树和课程标签;所述知识树采用决策树结构,为根据教学书籍中课程属性排成的树状结构。 所述资源模型包括资源属性和资源标签。
3.如权利要求1所述的系统,其特征在于,所述离线数据处理模块包括: 教师动态描述推理模块,使用协同推理方法和基于知识树的资源内容推理方法,根据k近邻教师的动态描述、教师对资源的`操作行为记录数据中涉及到的资源标签和课程标签之间的关联度,推理教师的动态描述; 资源关联度计算模块,根据同一教师在预定时间内对资源的操作行为计算资源之间的关联度; 课程标签调整模块,根据课程模型数据中课程名称从网页爬取课程相关网页,并从中提取课程关键词作为课程标签初始化所述课程模型数据;根据教师教学任务记录中教师教学任务内容特征,使用聚类方法、标签活跃度倒排法和潜在语义分析对课程标签进行过滤和扩展; 资源标签调整模块,根据资源模型数据中资源内容提取资源标签,以初始化所述资源模型数据;对从教师标签行为记录获取的资源标签利用标签活跃度倒排、潜在语义分析和聚类方法统计,过滤和扩展资源标签; 课程资源关联度计算模块,使用距离度量方法计算课程标签和资源标签的关联度,并使用k近邻方法或者设定距离阈值过滤关联度较低的资源,最终输出资源和课程之间的关联度; 资源相似性计算模块,使用距离度量方法计算资源标签之间的距离,使用k近邻方法或者设定距离阈值过滤相似度较低的资源,最终输出资源以及资源之间的相似度。
4.如权利要求1所述的方法,其中,在线推荐模块包括: 资源混合推荐模块,根据教师输入的查询词,通过匹配资源标签获得资源列表,或者根据教师模型数据中的教师动态描述,得到与该教师动态描述关联度较高的资源得到资源列表,然后根据资源列表中的资源计算与其关联度和相似性高于预定关联度值和相似度值的关联及相似资源,根据预设的权值对所获得的关联及相似资源进行加权运算,得到相关资源列表,将相关资源列表中权重值高于预定权重值的资源推荐给教师; 标签推荐模块,根据教师对所推荐资源的操作行为为其反馈该推荐资源的资源标签;教师行为记录模块,用于将教师产生的行为数据发送给数据构建模块,以更新教师行为数据。
5.—种网络教学资源推荐方法,其特征在于,包括: 数据构建步骤,其构建教师行为数据、教师模型数据、课程模型数据、资源模型数据;离线数据处理步骤,其用于初始化和调整课程模型数据和资源模型数据,并利用教师行为数据推断教师身份,根据教师行为数据计算资源之间的关联度,根据资源模型数据计算资源之间的相似度,根据资源模型数据和课程模型数据计算课程与资源之间的关联度;在线推荐步骤,其利用资源之间的关联度、资源之间的相似度、课程与资源的关联度、教师的动态描述在线推荐资源,还根据教师对推荐资源的反馈推荐资源标签,并根据教师产生的行为数据更新教师行为数据。
6.如权利要求5所述的方法,其特征在于, 所述教师行为数据包括:教师资源行为记录、教师教学任务记录和教师标签行为记录,其中教师资源行为记录 包括教师对资源的行为,教师教学任务记录包括教师进行的教学设计和备课操作,教师标签行为记录包括教师对资源标签的操作; 所述教师模型数据包括教师的静态描述和动态描述,静态描述指教师的基本信息,动态描述包括教师所教课程的属性; 所述课程模型数据包括知识树和课程标签;所述知识树采用决策树结构,为根据教学书籍中课程属性排成的树状结构。 所述资源模型包括资源属性和资源标签。
7.如权利要求5所述的方法,其中,离线数据处理步骤包括: 使用协同推理方法和基于知识树的资源内容推理方法,根据k近邻教师的动态描述、教师资源行为记录中涉及到的资源标签和课程标签之间的关联度,推理教师的动态描述;并根据同一教师在预定时间内对资源的操作行为计算资源之问的关联度; 根据课程模型数据中课程名称从网页爬取课程相关网页,并从中提取课程关键词作为课程标签初始化所述课程模型数据;根据教师教学任务记录中教师教学任务内容特征,使用聚类方法、标签活跃度倒排法和潜在语义分析对课程标签进行过滤和扩展; 根据资源模型数据中资源内容提取资源标签,以初始化所述资源模型数据;对从教师标签行为记录获取的资源标签利用标签活跃度倒排、潜在语义分析和聚类方法统计,过滤和扩展资源标签; 使用距离度量方法计算课程标签和资源标签的关联度,并使用k近邻方法或者设定距离阈值过滤关联度较低的资源,最终输出资源和课程之间的关联度: 使用距离度量方法计算资源标签之间的距离,使用k近邻方法或者设定距离阈值过滤相似度较低的资源,最终输出资源以及资源之间的相似度。
8.如权利要求5所述的方法,其中,在线推荐步骤包括: 根据教师输入的查询词,通过匹配资源标签获得资源列表,或者根据教师模型数据中的教师动态描述,得到与该教师动态描述关联度较高的资源得到资源列表,然后根据资源列表中的资源计算与其关联度和相似性高于预定关联度值和相似度值的关联及相似资源,根据预设的权值对所获得的关联及相似资源进行加权运算,得到相关资源列表,将相关资源列表中权重值高于预定权重值的资源推荐给教师; 根据教师对所推荐资源的操作行为反馈该推荐资源的资源标签。 根据教师产生的行为数据更新教师行为`数据。
【文档编号】G06F17/30GK103886054SQ201410093793
【公开日】2014年6月25日 申请日期:2014年3月13日 优先权日:2014年3月13日
【发明者】倪晚成, 张海东, 樊立斌 申请人:中国科学院自动化研究所, 北京鸿合盛视数字媒体技术有限公司