一种基于知识图谱的线上教育个性化推送方法及系统与流程

文档序号:18642584发布日期:2019-09-11 23:41阅读:503来源:国知局
本发明涉及智能教育
技术领域
,特别是一种基于知识图谱的线上教育个性化推送方法及其应用该方法的系统。
背景技术
:线上教育即e-learning,或称远程教育、在线学习,通过应用信息科技和互联网技术进行内容传播和快速学习的方法。在信息化爆发式发展的趋势下,线上教育越来越凸显出优势:1、线上教育可以突破时间和空间的限制,提升了学习效率;2、线上教育可以跨越因地域等方面造成的教育资源不平等分配,使教育资源共享化,降低了学习的门槛。基于线上教育的特点和优势,网络学校受到越来越多人的认可,各类新兴的网校、线上教育平台、教学app也不断涌现。但是,传统的线上教育,中国线上教育的模式依然只是停留在"一头热"阶段:单纯地把线下学习模式下的课表、教材搬上互联网,对所有的学习者进行毫无差异性的单向填鸭式教学。并且,现有的线上教育自适应学习主要是通过对导入的手工构建的知识图谱(知识点)进行固定学习流程的设计,其获取用户学习反馈的唯一渠道是练习做题,根据做题结果来分析需要强化的知识点,然后针对该需要强化的知识点推送相应的强化题目。采用上述推送方式,虽然对提分有一定的效果,但只单纯是以大量刷题训练形式来提分,而不是培养学生批判性思维习惯的教育。技术实现要素:本发明为解决上述问题,提供了一种基于知识图谱的线上教育个性化推送方法及系统,其通过知识图谱实体标签技术,对用户的学习行为信息和/或学习反馈信息进行学习偏好或学习掌握程度的分析,从而根据分析结果进行教材信息的个性化推送,教学效果更好。为实现上述目的,本发明采用的技术方案为:一种基于知识图谱的线上教育个性化推送方法,其包括以下步骤:a.根据教材信息中的实体以及实体之间的关系进行构建知识图谱;b.根据所述知识图谱对所述教材信息进行自动标注,得到实体标签信息;c.获取用户的学习行为信息和/或学习反馈信息;d.根据所述学习行为信息和/或学习反馈信息得到当前学习对象所对应的教材信息,并将该对应的教材信息所标注的实体标签信息作为待分析标签信息;e.根据所述学习行为信息或其待分析标签信息进行学习偏好的分析,和/或,根据所述学习反馈信息或其待分析标签信息进行学习掌握程度的分析;f.根据所述学习偏好和/或所述学习掌握程度进行教材信息的个性化推送。优选的,所述的步骤a中,是通过对所述教材信息进行数据结构化处理,并根据得到的结构化数据进行构建知识图谱;其中,所述教材信息的形式包括以下任一种或者两种以上的结合:文档教材、图像教材、视频教材、音频教材、教材习题。优选的,所述对所述教材信息进行数据结构化处理,进一步包括以下步骤:信息抽取:根据rdf框架对所述教材信息进行实体抽取、关系抽取、属性抽取,得到所述教材信息的章节内容、章节知识点、知识点关联的问答信息;信息融合:通过自然语义解析技术引入第三方知识库对抽取的实体进行共指解析和实体消歧,得到初步rdf数据;质量评估:通过机器评估和/或专家人工评估的方法对所述rdf数据进行监督和调试,得到清洁的结构化的rdf数据。优选的,所述的步骤b中,所述实体标签信息包括以下任一项或者两项以上的表现形式的rdf三元组内容标签:行为数据内容、实体文本标注的形式表示、rdf三元组向量化表示、一阶逻辑表示。优选的,所述的步骤c中,所述学习行为信息包括以下任一项或者两项以上的结合:用户的访问内容、用户的访问时间、用户的提问内容、用户的评论内容;所述的学习反馈信息包括用户的做题反馈信息。优选的,所述的步骤c中,获取用户的学习行为信息和学习反馈信息,是将所述实体标签信息作为api触发点,通过识别用户在应用程序场景中触发的api内容获取用户的学习行为信息和学习反馈信息,以及该学习行为信息和学习反馈信息对应的教材信息所标注的实体标签信息。优选的,所述的步骤e中,是通过对所述学习行为信息或所述学习反馈信息或所述待分析标签信息进行视觉化处理,得到统计图表;然后根据所述统计图表进行分析学习偏好或分析学习掌握程度。优选的,所述的步骤e中,还包括将用户和对应的待分析标签信息组成的数据矩阵导入模糊聚类算法,从而对所述用户进行聚类处理,得到不同学习偏好类型的用户群或者不同学习掌握程度的用户簇。或者,所述的步骤e中,还包括将用户及其对应的教材信息的形式和对应的待分析标签信息组成的数据矩阵导入模糊聚类算法,从而对所述用户进行聚类处理,得到不同学习偏好类型的用户群或者不同学习掌握程度的用户簇。对应的,本发明还提供一种基于知识图谱的线上教育个性化推送系统,其包括:知识图谱构建模块,其根据教材信息中的实体以及实体之间的关系进行构建知识图谱;自动标注模块,其根据所述知识图谱对所述教材信息进行自动标注,得到实体标签信息;行为识别模块,用于获取用户的学习行为信息和/或学习反馈信息;信息分析模块,其根据所述学习行为信息和/或学习反馈信息得到当前学习对象所对应的教材信息,并将该对应的教材信息所标注的实体标签信息作为待分析标签信息;根据所述学习行为信息或其待分析标签信息进行学习偏好的分析,和/或,根据所述学习反馈信息或其待分析标签信息进行学习掌握程度的分析;个性化推送模块,其根据所述学习偏好和/或所述学习掌握程度进行教材信息的个性化推送。本发明的有益效果是:(1)本发明通过知识图谱实体标签技术,对用户的学习行为信息和/或学习反馈信息进行学习偏好或学习掌握程度的分析,从而根据分析结果进行教材信息的个性化推送,教学效果更好;(2)本发明将所述实体标签信息作为api触发点,通过识别用户在应用程序场景中触发的api内容获取用户的学习行为信息和学习反馈信息以及该学习行为信息对应的实体标签信息,能在复杂环境下收集更完整的用户行为数据,从而获得大规模的完整标注数据,容易与深度学习算法相结合以及能够基于知识图谱将实体标签信息进行向量化,使得算法更准确;(3)本发明通过对所述学习行为信息或所述学习反馈信息或所述待分析标签信息进行视觉化处理,得到统计图表;然后根据所述统计图表进行分析学习偏好或分析学习掌握程度,更加直观和准确;(4)本发明通过构建一个底层的完整知识图谱实体语义网络,在该知识图谱的基础上进行分析学生对知识点的学习偏好和掌握程度,再根据用户的学习偏好或掌握程度推送知识点对应的教材信息,使得学生的知识体系更完善。具体实施方式为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合具体实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明的一种基于知识图谱的线上教育个性化推送方法,是基于数据驱动+知识引导的自适应学习的隐式用户反馈形式,可以不需要通过大量的刷题就可以做到个性化教学的目的。收集的数据特点:可以基于知识图谱实体为api触发点收集学生在平台上的所有数据,即学生在学习平台对每个点的教材信息的学习情况和反馈都可以以标注数据完整地收集到。基于这些信息维度和计算能力更强的数据做自适应学习模型的处理。这样就可以模拟一个具有丰富教学经验的时刻观察学生行为的老师来一对一指导规范学生的学习行为,并根据不同学生的学习行为信息和学习反馈信息通过模糊聚类算法对不同学习偏好、不同知识概念掌握度进行针对性推送,提高教学效率。具体包括以下步骤:a.根据教材信息中的实体以及实体之间的关系进行构建知识图谱;b.根据所述知识图谱对所述教材信息进行自动标注,得到实体标签信息;c.获取用户的学习行为信息和/或学习反馈信息;d.根据所述学习行为信息和/或学习反馈信息得到当前学习对象所对应的教材信息,并将该对应的教材信息所标注的实体标签信息作为待分析标签信息;e.根据所述学习行为信息或其待分析标签信息进行学习偏好的分析,和/或,根据所述学习反馈信息或其待分析标签信息进行学习掌握程度的分析;f.根据所述学习偏好和/或所述学习掌握程度进行教材信息的个性化推送。其中,所述学习偏好是指对所述教材信息的不同形式的偏好,所述教材信息的形式包括以下任一种或者两种以上的结合:文档教材、图像教材、视频教材、音频教材、教材习题。不同的学生对不同的教材形式有不同的学习效率,可根据不同学习偏好的分析结果进行个性化推送,例如,有的学生看视频吸收知识较快,则优先对该类学生推送视频教材;有的学生阅读文档吸收知识较快,则优先对该类学生推送文档教材;有的学生做习题吸收知识较快,则优先对该类学生推送教材习题。同理不同的学生对不同知识点的理解速度也不尽相同。所述的步骤a中,是通过对所述教材信息进行数据结构化处理,并根据得到的结构化数据进行构建知识图谱;本实施例通过将线上教育个性化推送软件或诊断平台线上教育平台相对接,对线上教育平台的数据库中的教材信息进行结构化处理从而构建知识图谱。本实施例中,所述对所述教材信息进行数据结构化处理,进一步包括以下步骤:信息抽取:根据rdf框架对所述教材信息进行实体抽取、关系抽取、属性抽取,得到所述教材信息的章节内容、章节知识点、知识点关联的问答信息;本实施例中,进一步加入了知识纲要信息进行辅助抽取,即除了自然语义识别教材信息之外,还可以通过知识纲要以及提问、评论的属性对实体进行登记的分类,从而构建出围绕学科教学纲要关联延伸出的章节内容、章节知识点、知识点的具体实用案例问答;信息融合:通过自然语义解析技术引入第三方知识库对抽取的实体进行共指解析和实体消歧,得到初步rdf数据;该步骤主要是针对多个词汇表达同一个实体的情况,通过自然语义解析(nlp)技术引入第三方知识库(维基、百度、以及对应学术库等)对多种实体指一种概念和同名实体产生歧义的做法;初期在构建的时候需要专家手动操作部分概念进行合并和清理,在整理出框架之后,系统后续可自动在框架内自动添加内容,不需要专家在岗监督;质量评估:通过机器评估和/或专家人工评估的方法对所述rdf数据进行监督和调试,得到清洁的结构化的rdf数据。所述的信息抽取步骤中,还进一步对所述教材信息相关联的问答信息进行信息抽取。具体的,可直接从课程级别的阅读教材、视频(例如ppt+教师声音解读)、练习以及每一个资料下延伸出的讨论提问内容进行拉取。其中,提问以阅读教材选中文字知识点为单位粒度、以视频时段为单位粒度、以单位练习题为单位粒度。抽取之后通过自然语义识别技术导出成基础rdf或同类数据库语言(nlp2rdf过程)进行信息融合,最后通过质量评估得到最终的rdf数据,与教材信息的结构化处理过程相类似,在此不进行赘述。所述的步骤b中,所述实体标签信息包括以下任一项或者两项以上的表现形式的rdf三元组内容标签:行为数据内容、实体文本标注的形式表示、rdf三元组向量化表示、一阶逻辑表示。所述的步骤c中,所述学习行为信息即用户的学习行为api信息,所述api带有实体(entity)的维度信息,以表示用户在不同场景下对不同实体的反应程度。本实施例中,所述学习行为信息包括以下任一项或者两项以上的结合:用户的访问内容、用户的访问时间、用户的提问内容、用户的评论内容;所述的学习反馈信息包括用户的做题反馈信息。获取用户的学习行为信息和学习反馈信息,是将所述实体标签信息作为api触发点,通过识别用户在应用程序场景中触发的api内容获取用户的学习行为信息和学习反馈信息,以及该学习行为信息和学习反馈信息对应的教材信息所标注的实体标签信息。所述的步骤e中,是通过对所述学习行为信息或所述学习反馈信息或所述待分析标签信息进行视觉化处理,得到统计图表;然后根据所述统计图表进行分析学习偏好或分析学习掌握程度。本实施例中,还进一步对用户进行聚类处理,聚类方法可采用以下任一种:(1)将用户和对应的待分析标签信息组成的数据矩阵导入模糊聚类算法,从而对所述用户进行聚类处理,得到不同学习偏好类型的用户群或者不同学习掌握程度的用户簇。(2)将用户及其对应的教材信息的形式和对应的待分析标签信息组成的数据矩阵导入模糊聚类算法,从而对所述用户进行聚类处理,得到不同学习偏好类型的用户群或者不同学习掌握程度的用户簇。聚类处理过程主要包括以下步骤:首先,将输入的矩阵数据通过绝对值减数法转化为模糊相似矩阵r,其中,这里的4是针对xy矩阵y=4的情况,0.1是c的取值。得到所述相似矩阵r后,通过传递闭包算法进行个聚类分析。本实施例中,通过如下公式对λ的测试得到r的不同取值对比:通过模糊聚类算法就能够判断不同的学生对不同的教材形式的偏好度和不同的知识点的掌握程度;最后,再针对模型训练的用户特征以不同的教材形式推送含有对应实体标签信息的教材内容;优选的,还通过含有对应知识点的习题对用户进行测试,作为一个反馈测试,以评估推送效果。举例如下:用户\实体标签e1e2e3e4e5e6p1425031p2413125p3221424p4412524p5224130如上表格是一个5个学生(p1、p2、p3、p4、p5)对6个知识点/实体标签(e1、e2、e3、e4、e5、e6)的矩阵,经过模糊聚类算法中的传递闭包法进行处理,在λ从大到小测试的过程中可以发现聚类最为平均的组合情况如{p1,p5}{p3}{p3,p4};因此,学生p1和p5通过聚类为一组,学生p3和p4聚类为一组。学生p1和p5在知识点e3表现得相对学生p3、p4要好,学生p1和p5在知识点e4表现得相对学生p3、p4要差。则通过这样的排列判断学生p1和p5这个聚类在知识点e3的掌握度会比一般水平要高,学生p3和p4在知识点e3掌握度会比一般水平要低。学生p1和p5在知识点e4的掌握度会比平均水平要低,学生p3和p4在知识点e4掌握度会比一般水平要高。根据上述分析结果,相对应的对学生p1和p5这个聚类推送e4对应的教学信息,对学生p3和p4这个聚类推送e3对应的教学信息。另外,与所述的线上教育个性化推送方法相对应的,本发明还提供一种基于知识图谱的线上教育个性化推送系统,其包括:知识图谱构建模块,其根据教材信息中的实体以及实体之间的关系进行构建知识图谱;自动标注模块,其根据所述知识图谱对所述教材信息进行自动标注,得到实体标签信息;行为识别模块,用于获取用户的学习行为信息和/或学习反馈信息;信息分析模块,其根据所述学习行为信息和/或学习反馈信息得到当前学习对象所对应的教材信息,并将该对应的教材信息所标注的实体标签信息作为待分析标签信息;根据所述学习行为信息或其待分析标签信息进行学习偏好的分析,和/或,根据所述学习反馈信息或其待分析标签信息进行学习掌握程度的分析;个性化推送模块,其根据所述学习偏好和/或所述学习掌握程度进行教材信息的个性化推送。需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1