基于网页日志的网页考评作弊检测方法、装置及电子设备与流程

文档序号:30949106发布日期:2022-07-30 06:38阅读:85来源:国知局
基于网页日志的网页考评作弊检测方法、装置及电子设备与流程

1.本发明涉及人工智能技术领域,具体涉及一种基于网页日志的网页考评作弊检测方法、装置及电子设备。


背景技术:

2.目前,通过线上网页考评技术可以极大的减轻考评双方的成本和压力,给考评双方都带来了良好的体验。但是,线上网页考评不同于线下考评,存在考生分散、环境多样、无法监督等一系列问题,导致存在一定的作弊风险。因此,为了保证考评的公正性,目前亟需一种高精度的线上网页考评的作弊检测方法。


技术实现要素:

3.为了解决现有技术中存在的上述问题,本技术实施方式提供了一种基于网页日志的网页考评作弊检测方法、装置及电子设备,可以通过考评人进行网页考评时浏览器生成的日志文件,对考评人是否存在作弊行为进行高精度的判定。
4.第一方面,本技术的实施方式提供了一种基于网页日志的网页考评作弊检测方法,该方法可以应用于网页考评作弊检测装置,具体包括:
5.获取当前考题和第一日志文件,其中,当前考题为网页考评答题装置当前时间展示给考评人的试题,第一日志文件为日志文件序列中最后一个日志文件,日志文件序列用于存储网页考评答题装置生成的日志文件,且日志文件序列中的至少一个日志文件按照生成时间的先后顺序依次排列;
6.根据当前考题,确定等待时间阈值;
7.对当前时间和第一日志文件的生成时间进行求差处理,得到第一时间差值;
8.根据等待时间阈值和第一时间差值,确定考评人的第一作弊概率;
9.获取第二日志文件,其中,第二日志文件为日志文件序列中位于第一日志文件前一位的日志文件;
10.计算第一日志文件与第二日志文件的差异率;
11.根据差异率,确定考评人的第二作弊概率;
12.根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
13.第二方面,本技术的实施方式提供了一种基于网页日志的网页考评作弊检测装置,包括:
14.获取模块,用于获取当前考题和第一日志文件,其中,当前考题为网页考评答题装置当前时间展示给考评人的试题,第一日志文件为日志文件序列中最后一个日志文件,日志文件序列用于存储网页考评答题装置生成的日志文件,且日志文件序列中的至少一个日志文件按照生成时间的先后顺序依次排列;
15.分析模块,用于根据当前考题,确定等待时间阈值,对当前时间和第一日志文件的生成时间进行求差处理,得到第一时间差值,根据等待时间阈值和第一时间差值,确定考评
人的第一作弊概率;
16.获取模块,还用于获取第二日志文件,其中,第二日志文件为日志文件序列中位于第一日志文件前一位的日志文件;
17.分析模块,还用于计算第一日志文件与第二日志文件的差异率,根据差异率,确定考评人的第二作弊概率;
18.检测模块,用于根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
19.第三方面,本技术实施方式提供一种电子设备,包括:处理器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。
20.第四方面,本技术实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。
21.第五方面,本技术实施方式提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。
22.实施本技术实施方式,具有如下有益效果:
23.在本技术实施方式中,通过获取考评人当前时间正在进行回答的考题,即当前考题,确定该考评人在该考题上花费的等待时间阈值。同时,获取浏览器生成的最新的日志文件,即第一日志文件,该日志文件是由于考评人对浏览器显示的页面进行了一定的操作而触发生成的,当有新的日志文件生成时,即说明考评人开始进行答题操作。此时,通过计算当前时间和第一日志文件的生成时间的差值,即可得到该考评人的实际等待时间。基于此,可以根据等待时间阈值和实际等待时间的差值,即第一时间差值,确定考评人的第一作弊概率。同时,获取第一日志文件的上一个日志文件,即第二日志文件,通过计算第一日志文件与第二日志文件的差异率,可以得到网页的变化幅度,继而确定考评人的第二作弊概率。最后,根据第一作弊概率和第二作弊概率,确定该考评人是否存在作弊行为。由此,通过考评人进行网页考评时浏览器生成的日志文件,对考评人是否存在作弊行为进行高精度的判定。同时,根据用户答题时的特征和当前回答的考题,动态实时的计算相应的等待时间阈值,继而针对不同考评人和不同的考题,制定不同的时间阈值,进一步的提高网页作弊检测的精确度。
附图说明
24.为了更清楚地说明本技术实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1为本技术实施方式提供的一种基于网页日志的网页考评作弊检测装置的硬件结构示意图;
26.图2为本技术实施方式提供的一种基于网页日志的网页考评作弊检测方法的系统框架图;
27.图3为本技术实施方式提供的一种基于网页日志的网页考评作弊检测方法的流程示意图;
28.图4为本技术实施方式提供的一种日志文件序列的示意图;
29.图5为本技术实施方式提供的一种根据当前考题,确定等待时间阈值的方法的流程示意图;
30.图6为本技术实施方式提供的一种切分当前考题的示意图;
31.图7为本技术实施方式提供的一种审题时间和思考时间交叠的示意图;
32.图8为本技术实施方式提供的一种基于网页日志的网页考评作弊检测装置的功能模块组成框图;
33.图9为本技术实施方式提供的一种电子设备的结构示意图。
具体实施方式
34.下面将结合本技术实施方式中的附图,对本技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本技术一部分实施方式,而不是全部的实施方式。基于本技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本技术保护的范围。
35.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
36.在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本技术的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。
37.首先,参阅图1,图1为本技术实施方式提供的一种基于网页日志的网页考评作弊检测装置的硬件结构示意图。该基于网页日志的网页考评作弊检测装置100包括至少一个处理器101,通信线路102,存储器103以及至少一个通信接口104。
38.在本实施方式中,处理器101,可以是一个通用中央处理器(central processing unit,cpu),微处理器,特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本技术方案程序执行的集成电路。
39.通信线路102,可以包括一通路,在上述组件之间传送信息。
40.通信接口104,可以是任何收发器一类的装置(如天线等),用于与其他设备或通信网络通信,例如以太网,ran,无线局域网(wireless local area networks,wlan)等。
41.存储器103,可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光
碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
42.在本实施方式中,存储器103可以独立存在,通过通信线路102与处理器101相连接。存储器103也可以和处理器101集成在一起。本技术实施方式提供的存储器103通常可以具有非易失性。其中,存储器103用于存储执行本技术方案的计算机执行指令,并由处理器101来控制执行。处理器101用于执行存储器103中存储的计算机执行指令,从而实现本技术下述实施方式中提供的方法。
43.在可选的实施方式中,计算机执行指令也可以称之为应用程序代码,本技术对此不作具体限定。
44.在可选的实施方式中,处理器101可以包括一个或多个cpu,例如图1中的cpu0和cpu1。
45.在可选的实施方式中,该基于网页日志的网页考评作弊检测装置100可以包括多个处理器,例如图1中的处理器101和处理器107。这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
46.在可选的实施方式中,若基于网页日志的网页考评作弊检测装置100为服务器,例如,可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。则基于网页日志的网页考评作弊检测装置100还可以包括输出设备105和输入设备106。输出设备105和处理器101通信,可以以多种方式来显示信息。例如,输出设备105可以是液晶显示器(liquid crystal display,lcd),发光二级管(light emitting diode,led)显示设备,阴极射线管(cathode ray tube,crt)显示设备,或投影仪(projector)等。输入设备106和处理器101通信,可以以多种方式接收用户的输入。例如,输入设备106可以是鼠标、键盘、触摸屏设备或传感设备等。
47.上述的基于网页日志的网页考评作弊检测装置100可以是一个通用设备或者是一个专用设备。本技术实施方式不限定基于网页日志的网页考评作弊检测装置100的类型。
48.其次,需要说明的是,本技术所提供的一种基于网页日志的网页考评作弊检测方法可以适用于宠物医师考评、教师职称考评等各类职称考评或工作水平考评场景。在本实施方式中,将以宠物医师的基于网页日志的网页考评作弊检测场景为例,对本技术所提供的一种基于网页日志的网页考评作弊检测方法进行说明,其他场景下的基于网页日志的网页考评作弊检测方法与宠物医师的基于网页日志的网页考评作弊检测场景下的基于网页日志的网页考评作弊检测方法相似,在此不再赘述。
49.最后,图2为本技术实施方式提供的一种在宠物医师的基于网页日志的网页考评作弊检测场景下的,基于网页日志的网页考评作弊检测方法的系统框架图。具体而言,该系统可以包括:网页考评答题装置201和网页考评作弊检测装置202,其中,网页考评答题装置201可以是智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices,简称:mid)等,用于显示
考评试题,接收宠物医师根据显示的考评试题所输入的答案,以及根据宠物医师的操作生成相应的日志文件。网页考评作弊检测装置202可以是服务器,用于获取网页考评答题装置201生成的日志文件,继而对宠物医师是否存在作弊行为进行判定。
50.在本实施方式中,网页考评作弊检测装置202可以在正式考评前,预先根据确定出的考评试题,确定每道考评试题的等待时间阈值,继而在正式考评时,直接进行调用,以提升效率。在正式考评时,网页考评作弊检测装置202可以定期获取网页考评答题装置201生成的最新日志文件,即第一日志文件,以及网页考评答题装置201当前显示的考题,即当前考题。由于日志文件用于记录考评人对浏览器的操作,因此,若考评人无操作则不会生成日志文件。由此,通过第一日志文件的生成时间,即可确定考评人上一次对浏览器进行操作的时间。继而,该第一日志文件的生成时间与当前时间之间的第一时间差值,即为考评人无操作的时间长度,可以理解为考评人对当前考题的审题和思考时间。同时,通过当前考题确定出该考题的等待时间阈值,然后,网页考评作弊检测装置202可以根据等待时间阈值和第一时间差值,确定考评人的第一作弊概率。通常而言,第一时间差值和等待时间阈值之间的差距越大,则作弊的嫌疑就越大。此外,网页考评作弊检测装置202还可以从网页考评答题装置201处获取第一日志文件的上一个日志文件,即第二日志文件,通过比对第一日志文件与第二日志文件的差异率,即可确定浏览器当前网页的变化率,从而根据差异率,确定考评人的第二作弊概率。通常而言,差异率越大,则作弊的嫌疑就越大。最后,网页考评作弊检测装置202综合第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
51.在本实施方式中,通过考评人进行网页考评时浏览器生成的日志文件,对考评人是否存在作弊行为进行高精度的判定。同时,根据用户答题时的特征和当前回答的考题,动态实时的计算相应的等待时间阈值,继而针对不同考评人和不同的考题,制定不同的时间阈值,进一步的提高网页作弊检测的精确度。
52.以下,将以宠物医师的基于网页日志的网页考评作弊检测场景为例,对本技术所公开的基于网页日志的网页考评作弊检测方法进行说明:
53.参阅图3,图3为本技术实施方式提供的一种基于网页日志的网页考评作弊检测方法的流程示意图。该基于网页日志的网页考评作弊检测方法可以应用于网页考评作弊检测装置202,具体包括以下步骤:
54.301:获取当前考题和第一日志文件。
55.在本实施方式中,当前考题为网页考评答题装置201当前时间展示给考评人的试题,第一日志文件为日志文件序列中最后一个日志文件,日志文件序列用于存储网页考评答题装置生成的日志文件,且日志文件序列中的至少一个日志文件按照生成时间的先后顺序依次排列。简而言之,如图4所示,网页考评答题装置201会维护一个日志文件序列用于存储其生成的日志文件,新的日志文件生成后会直接排列在日志文件序列的末尾。同时,该日志文件序列会设置一个存储文件上限,当存储的日志文件的数量达到上限时,在新的文件进入时,会自动将序列开头相应数量的日志文件进行删除或另存,以防止占用内存过高,影响其他计算的效率。
56.302:根据当前考题,确定等待时间阈值。
57.在本实施方式中,首先,可以确定当前考题的难度评分。具体而言,该难度评分可以指当前考题相对于考评人的难度评分,可以通过计算当前考题所考知识的难度等级和考
评人掌握的知识的难度等级的差值,得到该难度等级。其中,考评人掌握的知识的难度等级可以通过考评人的学历和工作来确定。
58.然后,可以根据难度评分确定考评人的思考时间阈值。具体而言,在本实施方式中,可以维护一个思考时间数据库,其中存储了通过大数据分析得到的不同难度评分下,考评者的平均思考时间。基于此,通过上述得到的难度评分对该思考时间数据库进行查询,即可得到此昂因的平均思考时间作为该思考时间阈值。
59.然后,可以根据当前考题的题干和考评人的审题速率,确定审题时间阈值。具体而言,审题速率用于标识考评人读题的平均速率,在本实施方式中,可以在正式考评前向考评人依次展示若干测试题,该若干测试题的难度很低,但均拥有一定长度的题干文本。由此,可以获取考评人完成每道测试题所用的时间,同时,通过记录考评人在每道测试题中进行输入操作的时间,即可得到考评人回答每道测试题用的审题时间。然后,结合每道测试题的题干长度,即可得到考评人回答每道测试题时的实际审题速率。最后,将所有测试题对应的实际审题速率的平均值作为该考评人的审题速率。
60.然后,可以根据当前考题的题干确定思考时间阈值和审题时间阈值之间的交叠率。在本实施方式中,提供了一种交叠率的确定方法,如图5所示,该方法包括:
61.501:对当前考题的题干进行拆分,得到至少一个关键词。
62.在本实施方式中,可以采用n-gram分割法对当前考题的题干进行拆分,同时,为了避免漏词等情况,拆分时的元数可以分别取2、3和4。具体而言,n-gram分割法是一种将句子分割成若干个分别由n个字符组成的片段序列的方法,其中,n即为元数,可自定义其取值,分割出的每个片段称作一个n-gram。示例性的,在当元数n取1时,n-gram分割法可以称作uni-gram(一元gram),在当元数n取2时,n-gram分割法可以称作bi-gram(二元gram),在当元数n取3时,n-gram分割法可以称作tri-gram(三元gram)。示例性的,如图7所示,如果使用bi-gram去分割当前考题“简述小动物膀胱穿刺的操作技术”,那么可以得到字段“简述”、“述小”、“小动”、“动物”、“物膀”、“膀胱”、“胱穿”、“穿刺”、“刺的”、“的操”、“操作”、“作技”和“技术”。
63.由此,在本实施方式中,得到分割结果后,可以对分割结果进行过滤清洗,滤除没有意义的分割结果,例如:“述小”、“小动”、“物膀”、“胱穿”、“刺的”、“的操”和“作技”,保留包含一定语义的分割结果,例如:“简述”、“动物”、“膀胱”、“穿刺”、“操作”和“技术”作为关键词。
64.502:根据当前考题的考评内容在至少一个关键词中,确定目标关键词。
65.在本实施方式中,目标关键词指与考评内容之间的关联度最高的关键词。具体而言可以通过分析当前考题的整体语义,从而计算语义向量与各个关键词的向量之间的关联度来确定。示例性的,对于当前考题“简述小动物膀胱穿刺的操作技术”,经过计算后,通过四元gram分割出的关键词“膀胱穿刺”与考题语义的关联度最高,基于此,关键词“膀胱穿刺”即为目标关键词。
66.503:根据目标关键词在题干中的位置,将题干切分为第一文本和第二文本。
67.具体而言,第一文本位于第二文本前方,目标关键词位于第二文本的首端。示例性的,如图6所示,对于当前考题“简述小动物膀胱穿刺的操作技术”,其目标关键词为“膀胱穿刺”,则切分后的第一文本为“简述小动物”,第二文本为“膀胱穿刺的操作技术”。
68.504:根据第二文本的长度,确定思考时间阈值和审题时间阈值之间的交叠率。
69.在实际考评中,并不是完全读完一道题的题干后才会进入思考,而是在读取到关键信息后,便开始进行思考。基于此,在本实施方式中,将考评人思考时间的起点,设置于题干中目标关键词出现后的时刻。基于此,在目标关键词出现后,考评人的审题时间和思考时间便出现了交叠,如图7所示。
70.基于此,在本实施方式中,将第二文本的长度在当前考题的题干的长度中所占的比例,作为思考时间阈值和审题时间阈值之间的交叠率。
71.505:根据思考时间阈值、审题时间阈值和交叠率确定等待时间阈值。
72.在本实施方式中,首先,可以根据交叠率和难度评分,确定思考时间误差值。具体而言,可以根据难度评分,确定思考审题速率,其中,思考审题速率用于标识考评人在思考状态下审题的平均速率。其获取方式与步骤302中定考评人的审题速率的方式相似,在此不再赘述。然后,根据交叠率和当前考题的题干的长度,确定思考题干的长度,从而将思考题干的长度和思考审题速率的商,作为思考时间误差值。
73.然后,根据思考时间阈值、审题时间阈值、交叠率和思考时间误差值,确定等待时间阈值。具体而言,该等待时间阈值可以通过公式

进行表示:
74.t=(1-a)
×
t1+t2+b.........

75.其中,t表示等待时间阈值,t1表示审题时间阈值,t2表示思考时间阈值,a表示交叠率,b表示思考时间误差值。
76.303:对当前时间和第一日志文件的生成时间进行求差处理,得到第一时间差值。
77.在本实施方式中,由于日志文件用于记录考评人对浏览器的操作,因此,若考评人无操作则不会生成日志文件。由此,通过第一日志文件的生成时间,即可确定考评人上一次对浏览器进行操作的时间。继而,该第一日志文件的生成时间与当前时间之间的第一时间差值,即为考评人无操作的时间长度,可以理解为考评人对当前考题的实际审题和思考的时间和。
78.304:根据等待时间阈值和第一时间差值,确定考评人的第一作弊概率。
79.在本实施方式中,第一时间差值与标准时间差值的差距越大,无论是第一时间差值远大于等待时间阈值,还是第一时间差值远小于等待时间阈值的情况,均说明出现了非正常情况,且差距越大,作弊的可能性越高。具体而言,第一作弊概率可以通过公式

进行表示:
[0080][0081]
其中,p1表示第一作弊概率,tc表示第一时间差值。
[0082]
305:获取第二日志文件。
[0083]
在本实施方式中,第二日志文件为日志文件序列中位于第一日志文件前一位的日志文件。
[0084]
306:计算第一日志文件与第二日志文件的差异率。
[0085]
在本实施方式中,第一日志文件与第二日志文件的差异率,可以体现出浏览器页面的变化,其变化幅度越大,则说明出现网页切换的可能性越大,则考评人开启其他网页或切屏检索答案的可能性越高,即作弊的可能性越高。
[0086]
基于此,在本实施方式中,可以通过计算第一日志文件的特征向量与第二日志文件的特征向量之间的相似度,确定第一日志文件与第二日志文件的差异率。具体而言,可以通过点积计算第一日志文件的特征向量与第二日志文件的特征向量之间的夹角余弦值,并用1与该夹角余弦值的差值作为第一日志文件的特征向量与第二日志文件的特征向量之间的差异率。
[0087]
307:根据差异率,确定考评人的第二作弊概率。
[0088]
在本实施方式中,如步骤306中所述,差异率越大,则说明出现网页切换的可能性越大,则考评人开启其他网页或切屏检索答案的可能性越高,即作弊的可能性越高。具体而言,第二作弊概率可以通过公式

进行表示:
[0089][0090]
其中,p2表示第二作弊概率,g表示差异率。
[0091]
308:根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
[0092]
在本实施方式中,可以获取第一作弊概率和第二作弊概率的权重,继而根据第一作弊概率和第二作弊概率的权重,对第一作弊概率和第二作弊概率进行加权,得到第三作弊概率。并在第三作弊概率大于预设的阈值时,确定考评人存在作弊行为。
[0093]
综上所述,本发明所提供的基于网页日志的网页考评作弊检测方法中,通过获取考评人当前时间正在进行回答的考题,即当前考题,确定该考评人在该考题上花费的等待时间阈值。同时,获取浏览器生成的最新的日志文件,即第一日志文件,该日志文件是由于考评人对浏览器显示的页面进行了一定的操作而触发生成的,当有新的日志文件生成时,即说明考评人开始进行答题操作。此时,通过计算当前时间和第一日志文件的生成时间的差值,即可得到该考评人的实际等待时间。基于此,可以根据等待时间阈值和实际等待时间的差值,即第一时间差值,确定考评人的第一作弊概率。同时,获取第一日志文件的上一个日志文件,即第二日志文件,通过计算第一日志文件与第二日志文件的差异率,可以得到网页的变化幅度,继而确定考评人的第二作弊概率。最后,根据第一作弊概率和第二作弊概率,确定该考评人是否存在作弊行为。由此,通过考评人进行网页考评时浏览器生成的日志文件,对考评人是否存在作弊行为进行高精度的判定。同时,根据用户答题时的特征和当前回答的考题,动态实时的计算相应的等待时间阈值,继而针对不同考评人和不同的考题,制定不同的时间阈值,进一步的提高网页作弊检测的精确度。
[0094]
参阅图8,图8为本技术实施方式提供的一种基于网页日志的网页考评作弊检测装置的功能模块组成框图。如图8所示,该基于网页日志的网页考评作弊检测装置800包括:
[0095]
获取模块801,用于获取当前考题和第一日志文件,其中,当前考题为网页考评答题装置当前时间展示给考评人的试题,第一日志文件为日志文件序列中最后一个日志文件,日志文件序列用于存储网页考评答题装置生成的日志文件,且日志文件序列中的至少一个日志文件按照生成时间的先后顺序依次排列;
[0096]
分析模块802,用于根据当前考题,确定等待时间阈值,对当前时间和第一日志文件的生成时间进行求差处理,得到第一时间差值,根据等待时间阈值和第一时间差值,确定考评人的第一作弊概率;
[0097]
获取模块801,还用于获取第二日志文件,其中,第二日志文件为日志文件序列中
位于第一日志文件前一位的日志文件;
[0098]
分析模块802,还用于计算第一日志文件与第二日志文件的差异率,根据差异率,确定考评人的第二作弊概率;
[0099]
检测模块803,用于根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
[0100]
在本发明的实施方式中,在根据当前考题,确定等待时间阈值方面,分析模块802,具体用于:
[0101]
确定当前考题的难度评分;
[0102]
根据难度评分确定考评人的思考时间阈值;
[0103]
根据当前考题的题干和考评人的审题速率,确定审题时间阈值;
[0104]
根据当前考题的题干确定思考时间阈值和审题时间阈值之间的交叠率;
[0105]
根据思考时间阈值、审题时间阈值和交叠率确定等待时间阈值。
[0106]
在本发明的实施方式中,在根据当前考题的题干确定思考时间阈值和审题时间阈值之间的交叠率方面,分析模块802,具体用于:
[0107]
对当前考题的题干进行拆分,得到至少一个关键词;
[0108]
根据当前考题的考评内容在至少一个关键词中,确定目标关键词,其中,目标关键词与考评内容之间的关联度最高;
[0109]
根据目标关键词在题干中的位置,将题干切分为第一文本和第二文本,其中,第一文本位于第二文本前方,目标关键词位于第二文本的首端;
[0110]
根据第二文本的长度,确定思考时间阈值和审题时间阈值之间的交叠率。
[0111]
在本发明的实施方式中,在根据思考时间阈值、审题时间阈值和交叠率确定等待时间阈值方面,分析模块802,具体用于:
[0112]
根据交叠率和难度评分,确定思考时间误差值;
[0113]
根据思考时间阈值、审题时间阈值、交叠率和思考时间误差值,确定等待时间阈值;其中,等待时间阈值可以通过公式

进行表示:
[0114]
t=(1-a)
×
t1+t2+b.........

[0115]
其中,t表示等待时间阈值,t1表示审题时间阈值,t2表示思考时间阈值,a表示交叠率,b表示思考时间误差值。
[0116]
在本发明的实施方式中,在根据交叠率和难度评分,确定思考时间误差值方面,分析模块802,具体用于:
[0117]
根据难度评分,确定思考审题速率,其中,思考审题速率用于标识考评人在思考状态下审题的平均速率;
[0118]
根据交叠率和当前考题的题干的长度,确定思考题干的长度;
[0119]
将思考题干的长度和思考审题速率的商,作为思考时间误差值。
[0120]
在本发明的实施方式中,在根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为方面,检测模块803,具体用于:
[0121]
获取第一作弊概率和第二作弊概率的权重;
[0122]
根据第一作弊概率和第二作弊概率的权重,对第一作弊概率和第二作弊概率进行加权,得到第三作弊概率;
[0123]
当第三作弊概率大于预设的阈值时,确定考评人存在作弊行为。
[0124]
参阅图9,图9为本技术实施方式提供的一种电子设备的结构示意图。如图9所示,电子设备900包括收发器901、处理器902和存储器903。它们之间通过总线904连接。存储器903用于存储计算机程序和数据,并可以将存储器903存储的数据传输给处理器902。
[0125]
处理器902用于读取存储器903中的计算机程序执行以下操作:
[0126]
获取当前考题和第一日志文件,其中,当前考题为网页考评答题装置当前时间展示给考评人的试题,第一日志文件为日志文件序列中最后一个日志文件,日志文件序列用于存储网页考评答题装置生成的日志文件,且日志文件序列中的至少一个日志文件按照生成时间的先后顺序依次排列;
[0127]
根据当前考题,确定等待时间阈值;
[0128]
对当前时间和第一日志文件的生成时间进行求差处理,得到第一时间差值;
[0129]
根据等待时间阈值和第一时间差值,确定考评人的第一作弊概率;
[0130]
获取第二日志文件,其中,第二日志文件为日志文件序列中位于第一日志文件前一位的日志文件;
[0131]
计算第一日志文件与第二日志文件的差异率;
[0132]
根据差异率,确定考评人的第二作弊概率;
[0133]
根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为。
[0134]
在本发明的实施方式中,在根据当前考题,确定等待时间阈值方面,处理器902,具体用于执行以下操作:
[0135]
确定当前考题的难度评分;
[0136]
根据难度评分确定考评人的思考时间阈值;
[0137]
根据当前考题的题干和考评人的审题速率,确定审题时间阈值;
[0138]
根据当前考题的题干确定思考时间阈值和审题时间阈值之间的交叠率;
[0139]
根据思考时间阈值、审题时间阈值和交叠率确定等待时间阈值。
[0140]
在本发明的实施方式中,在根据当前考题的题干确定思考时间阈值和审题时间阈值之间的交叠率方面,处理器902,具体用于执行以下操作:
[0141]
对当前考题的题干进行拆分,得到至少一个关键词;
[0142]
根据当前考题的考评内容在至少一个关键词中,确定目标关键词,其中,目标关键词与考评内容之间的关联度最高;
[0143]
根据目标关键词在题干中的位置,将题干切分为第一文本和第二文本,其中,第一文本位于第二文本前方,目标关键词位于第二文本的首端;
[0144]
根据第二文本的长度,确定思考时间阈值和审题时间阈值之间的交叠率。
[0145]
在本发明的实施方式中,在根据思考时间阈值、审题时间阈值和交叠率确定等待时间阈值方面,处理器902,具体用于执行以下操作:
[0146]
根据交叠率和难度评分,确定思考时间误差值;
[0147]
根据思考时间阈值、审题时间阈值、交叠率和思考时间误差值,确定等待时间阈值;其中,等待时间阈值可以通过公式

进行表示:
[0148]
t=(1-a)
×
t1+t2+b.........

[0149]
其中,t表示等待时间阈值,t1表示审题时间阈值,t2表示思考时间阈值,a表示交叠
率,b表示思考时间误差值。
[0150]
在本发明的实施方式中,在根据交叠率和难度评分,确定思考时间误差值方面,处理器902,具体用于执行以下操作:
[0151]
根据难度评分,确定思考审题速率,其中,思考审题速率用于标识考评人在思考状态下审题的平均速率;
[0152]
根据交叠率和当前考题的题干的长度,确定思考题干的长度;
[0153]
将思考题干的长度和思考审题速率的商,作为思考时间误差值。
[0154]
在本发明的实施方式中,在根据第一作弊概率和第二作弊概率,确定考评人是否存在作弊行为方面,处理器902,具体用于执行以下操作:
[0155]
获取第一作弊概率和第二作弊概率的权重;
[0156]
根据第一作弊概率和第二作弊概率的权重,对第一作弊概率和第二作弊概率进行加权,得到第三作弊概率;
[0157]
当第三作弊概率大于预设的阈值时,确定考评人存在作弊行为。
[0158]
应理解,本技术中的基于网页日志的网页考评作弊检测装置可以包括智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices,简称:mid)、机器人或穿戴式设备等。上述基于网页日志的网页考评作弊检测装置仅是举例,而非穷举,包含但不限于上述基于网页日志的网页考评作弊检测装置。在实际应用中,上述基于网页日志的网页考评作弊检测装置还可以包括:智能车载终端、计算机设备等等。
[0159]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
[0160]
因此,本技术实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施方式中记载的任何一种基于网页日志的网页考评作弊检测方法的部分或全部步骤。例如,所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
[0161]
本技术实施方式还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施方式中记载的任何一种基于网页日志的网页考评作弊检测方法的部分或全部步骤。
[0162]
需要说明的是,对于前述的各方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于可选的实施方式,所涉及的动作和模块并不一定是本技术所必须的。
[0163]
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详
述的部分,可以参见其他实施方式的相关描述。
[0164]
在本技术所提供的几个实施方式中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0165]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0166]
另外,在本技术各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
[0167]
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施方式所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0168]
本领域普通技术人员可以理解上述实施方式的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0169]
以上对本技术实施方式进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1