基于网络爬虫的题库生成系统及应用方法与流程

文档序号:24131649发布日期:2021-03-02 18:18阅读:来源:国知局

技术特征:
1.一种基于网络爬虫的题库生成系统,其特征在于:该系统包括系统开发框架模块、数据库模块以及服务器,系统开发框架模块连接数据库模块,系统开发框架模块和数据库模块搭建在服务器上;系统开发框架模块内嵌套有爬虫模块、题库管理模块和智能组卷算法模块,三个模块各自分离又相互配合;爬虫模块用于抓取网页当中的试题内容,并通过管理员对试题内容进行初步标记将各类试题存储到源试题资源库模块中;题库管理模块用于将爬虫模块动态搜集的网络习题资源按照知识点存储到试题资源库中,为智能组卷模块提供试题题源;智能组卷算法模块用于以知识点为基础对试题进行碎片化管理,并在组卷时对试题进行筛选组成一套完整的试卷;数据库模块包括源试题资源库模块和用户试题资源库模块;源试题资源库模块用于存储初标记后的试题资源信息,该模块为任课教师创建试题资源库提供题源;用户试题资源库模块用于存储用户自定义的课程信息、用户收录的试题资源以及用户已经生成的试卷资源。2.根据权利要求1所述的基于网络爬虫的题库生成系统,其特征在于:服务器为flask框架自带的wsgi服务器。3.一种如权利要求1所述的基于网络爬虫的题库生成系统的应用方法,其特征在于:包括以下步骤:1)试题收集、更新:包括爬虫模块抓取的试题和用户编写的试题,将收集的试题存储至源试题资源库模块中;2) 创建提纲:将根据用户自身需求自定义课程大纲保存至用户试题资源库模块;3)试题筛选:对用户试题资源库模块中抽取的试题,标记试题的分值和难易程度级别,并保存至用户试题资源库模块,重复的试题不进行保存;4)试卷生成:智能组卷算法模块从用户试题资源库模块中保存的试题中抽取试题,组成试卷。4.根据权利要求3所述的基于网络爬虫的题库生成系统的应用方法,其特征在于:步骤1)中爬虫模块抓取url爬取到网页中的试题资源,并对抓取的试题资源进行试题类型的标记,最后存储至源试题资源库模块中。5.根据权利要求3所述的基于网络爬虫的题库生成系统的应用方法,其特征在于:步骤4)智能组卷算法模块的智能组卷算法包括:step1通过对知识点和试题的分析,将每门课程内的试题进行量化,获得碎片化试题;step2通过对碎片化试题之间相互关联关系进行梳理,确定智能组卷的约束条件;step3采用弹性捜索引擎检索,并对不同的索引关键字添加权重,最后组卷。6.根据权利要求5所述的基于网络爬虫的题库生成系统的应用方法,其特征在于:约束条件包括:条件1:试卷的分数试卷中试题i的分数,n为试卷试题总数,试卷的分数要达到满分;条件2:试卷的平均难度试卷中试题 i的难度值,n为试卷试题总数,试卷的难度根据用
户的要求确定;条件3:试卷中试题i的曝光度<对应章节中对应题型的试题平均曝光度;条件4:试题的近期被选过的标志位为false,保证相邻两次试卷所选试题的重复率低。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1