一种智能面向国际汉语教学的句子难度等级在线测定系统的制作方法

文档序号:23653874发布日期:2021-01-15 13:50阅读:78来源:国知局
一种智能面向国际汉语教学的句子难度等级在线测定系统的制作方法

本发明实施例涉及句子难度等级测定技术领域,具体涉及一种智能面向国际汉语教学的句子难度等级在线测定系统。



背景技术:

随着学习汉语的热潮席卷了世界,对外汉语教学的各个方面的成果层出不穷,其中,有部分学者把目光投向了对外汉语教材的编写上面,毋庸置疑,对外汉语教材的质量对于对外汉语教学的效果起到了一个很重要的作用。而教材质量的一个重要参数——教材难度是否合适又成了近年来学者们研究的一个热点,如果阅读材料与读者的阅读能力不匹配,就会引发各种矛盾:太难的阅读材料会超出人的信息加工系统能力,使阅读者丧失成就动机,太简单的材料则会使读者感觉乏味,没有继续阅读的兴趣,所以需要对文章的难度等级进行测定,使其能够符合人们的阅读能力。

但是现有技术中对一篇文章难度等级的判断多从篇幅级别入手的,而缺少对语句难度的测定,而且句子是构成一篇文章的主要结构,所以通过合理的判定一个语句的难度等级,也能够评判出一篇文章的难度,而且当存在复杂的语句时人们还是很难以理解该篇文章的主要内容,从而容易增加汉语教学的难度,可见通过篇幅判定容易存在误差,所以需要一种智能面向国际汉语教学的句子难度等级在线测定系统以句子为单位进行测定,以减少存在的误差。



技术实现要素:

为此,本发明实施例提供一种智能面向国际汉语教学的句子难度等级在线测定系统,通过对语句中的词语进行划分、判别,并加以对生僻字的判别和分析,从而能够测定出语句的难度等级,以避免判定误差的存在,从而能够合理的测定出一篇文章的难度等级,进而能够为汉语教学提供方便,以解决现有技术中由于篇幅判定存在误差导致的不利于汉语教学的问题。

为了实现上述目的,本发明实施例提供如下技术方案:一种智能面向国际汉语教学的句子难度等级在线测定系统,包括语句输入模块,所述语句输入模块输出端设有词数统计模块,所述词数统计模块,所述词数统计模块输入端设有第一词库模块,所述词数统计模块输出端设有生僻字统计模块,所述生僻字统计模块输入端设有第二词库模块,所述生僻字统计模块输出端设有测定模块。

进一步地,所述第一词库模块包括常用词词库和非常用词词库,所述常用词词库和非常用词词库均设在第一词库模块内部。

进一步地,所述第二词库模块包括生僻字字库,所述生僻字字库设在第二词库模块内部,所述生僻字字库包含在非常用词词库内部。

本发明还包括该智能面向国际汉语教学的句子难度等级在线测定方法,具体步骤如下:

步骤一:先挑选出一个句子,以该句子为测定对象;

步骤二:然后对该句子中所含有的词语的数量进行统计,以确定词语的总数;

步骤三:确定好词语数量后,根据常用词词库和非常用词词库对词语的种类进行划分,以将其划分为常用词和非常用词两种,并分别统计二者的数量;

步骤四:当存在非常用词时,还需要根据生僻字字库筛选出非常用词中的生僻字,同时还需要统计出非常用词中生僻字的数量;

步骤五:对划分出的常用词、非常用词以及生僻字进行占比分析,并通过该占比分析确定该句子的难度等级,当全部为常用词时,可以确定该句子的难度等级为“易”;当存在非常用词且非常用词的数量少于常用词时,还需要分析生僻字在非常用词中的占比,当生僻字的数量在非常用词的总数中的占比少于50%时,可以确定该句子的难度等级为“中易”,当生僻字的数量在非常用词的总数中的占比多于50%时,可以确定该句子的难度等级为“中”;当存在非常用词且非常用词的数量多于常用词时,同样需要分析生僻字在非常用词中的占比,当生僻字的数量在非常用词的总数中的占比少于50%时,可以确定该句子的难度等级为“中难”,当生僻字的数量在非常用词的总数中的占比多于50%时,可以确定该句子的难度等级为“难”,从而能够准确地测定出一个句子的难度等级。

本发明实施例具有如下优点:

1、本发明通过对一个句子中词语的数量进行统计,以确定所要测定的句子的长度,并将词语的类型划分为常用词和非常用词,通过对比常用词和非常用词的数量,当全部为常用词时,可以确定该句子的难度等级为易,存在常用词时,并在非常用词内部及进行生僻字查找,以确定生僻字的字数,当常用词多于非常用词时,且生僻字在非常用词的占比少于50%时可以确定该句子的难度等级为中易,当生僻字在非常用词的占比多于50%时可以确定该句子的难度等级为中,当常用词数量少于非常用词,且生僻字在非常用词总字数的占比少于50%时可以确定该句子的难度等级为中难,当生僻字在非常用词总字数的占比多于50%时可以确定该句子的难度等级为难,从而能够合理地对句子的难度等级进行测定,与现有技术相比,能够合理的测定每个句子的难度等级,以减少篇幅测定所存在的误差,从而能够为汉语教学提供方便;

2、本发明通过利用常用词词库、非常用词库和生僻字字库对一个句子的中的词语成分进行划分,从而能够准确的筛选出一个句子中的常用词、非常用词以及非常用词中的生僻字,与现有技术相比,能够为词语的划分提供依据,从而能够提高句子划分的准确度。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。

本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。

图1为本发明提供的模块图;

图2为本发明提供的句子等级测定流程图。

图中:1语句输入模块、2词数统计模块、3生僻字统计模块、4测定模块、5第一词库模块、6第二词库模块、7常用词词库、8非常用词词库、9生僻字字库。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

参照说明书附图1-2,该实施例的一种智能面向国际汉语教学的句子难度等级在线测定系统,包括语句输入模块1,所述语句输入模块1输出端设有词数统计模块2,所述词数统计模块2,所述词数统计模块2输入端设有第一词库模块5,所述词数统计模块2输出端设有生僻字统计模块3,所述生僻字统计模块3输入端设有第二词库模块6,所述生僻字统计模块3输出端设有测定模块4。

进一步地,所述第一词库模块5包括常用词词库7和非常用词词库8,所述常用词词库7和非常用词词库8均设在第一词库模块5内部,便于为词语的划分提供依据,从而能够准确地将词语划分为常用词和非常用词两种。

进一步地,所述第二词库模块6包括生僻字字库9,所述生僻字字库9设在第二词库模块6内部,所述生僻字字库9包含在非常用词词库8内部,便于为非常用词中生僻字的筛选提供依据,从而能够准确的筛选出非常用词中生僻字,并且能够确定生僻字的数量。

本发明还包括该智能面向国际汉语教学的句子难度等级在线测定方法,具体步骤如下:

步骤一:先挑选出一个句子,以该句子为测定对象;

步骤二:然后对该句子中所含有的词语的数量进行统计,以确定词语的总数;

步骤三:确定好词语数量后,根据常用词词库7和非常用词词库8对词语的种类进行划分,以将其划分为常用词和非常用词两种,并分别统计二者的数量;

步骤四:当存在非常用词时,还需要根据生僻字字库9筛选出非常用词中的生僻字,同时还需要统计出非常用词中生僻字的数量;

步骤五:对划分出的常用词、非常用词以及生僻字进行占比分析,并通过该占比分析确定该句子的难度等级,当全部为常用词时,可以确定该句子的难度等级为“易”;当存在非常用词且非常用词的数量少于常用词时,还需要分析生僻字在非常用词中的占比,当生僻字的数量在非常用词的总数中的占比少于50%时,可以确定该句子的难度等级为“中易”,当生僻字的数量在非常用词的总数中的占比多于50%时,可以确定该句子的难度等级为“中”;当存在非常用词且非常用词的数量多于常用词时,同样需要分析生僻字在非常用词中的占比,当生僻字的数量在非常用词的总数中的占比少于50%时,可以确定该句子的难度等级为“中难”,当生僻字的数量在非常用词的总数中的占比多于50%时,可以确定该句子的难度等级为“难”,从而能够准确地测定出一个句子的难度等级。

实施例2:

以句子“他性格乖张、面如饕餮,终究是个难对付的人”作为研究对象,进行测定等级;

步骤一、确定语句为:他性格乖张、面如饕餮,终究是个难对付的人;

步骤二、词语计数:性格、难对付、乖张、终究、饕餮,总共有5个词语;

步骤三、根据常用词词库7可以确定该句子中的常用词有:性格、难对付,共有2个;根据非常用词词库8可以确定该句子中的非常用词有:乖张、终究、饕餮,共有3个;

步骤四、根据生僻字字库9可以确定3个非常用词中存在2个生僻字:饕餮,但是这两个生僻字能够组成一个词语,所以可以按照一个生僻字词语进行计算;

步骤五、由上述步骤可知:常用词有2个,非常用词共有5个,其中有1个生僻字组成的词组,所以可以确定非常用词的数量大于常用词的数量,其中,生僻字占比为五分之一,换算为百分比为20%,而20%小于50%,根据“易、中易、中、中难和难”等级划分,可以确定测定对象的难度等级为“中难”。

实施例3:

以句子“她的眼睛里氤氲着水汽,像秋雨一样惹人怜爱”作为研究对象,进行测定等级;

步骤一、确定语句为:她的眼睛里氤氲着水汽,像秋雨一样惹人怜爱;

步骤二、词语计数:眼睛、氤氲、水汽、秋雨、一样、惹人怜爱,共有6个词语;

步骤三、根据常用词词库7可以确定该句子中的常用词有:眼睛、水汽、秋雨、一样、惹人怜爱,共有5个;根据非常用词词库8可以确定该句子中的非常用词有:氤氲,共有1个;

步骤四、对比生僻字字库9可以确定步骤三中的非常用词内部不包含有生僻字,所以生僻字的数量为0个;

步骤五、由上述步骤可知:常用词的数量为5个,非常用词的数量为1个,生僻字的数量为0个,其中5大于1,可知常用词的数量多于非常用词的数量,而且非常用词中并不含有生僻字,所以,根据“易、中易、中、中难和难”的等级划分,可以确定该测定对象的难度等级为“中易”。

虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1