一种识别试卷中包含AI生成文字的方法、介质及系统与流程

文档序号:36227078发布日期:2023-11-30 13:24阅读:来源:国知局

技术特征:

1.一种识别试卷中包含ai生成文字的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述对输入的答题文本进行词频统计,得到答题文本的词性分布向量,所述词性为答题文本中的名词、动词、形容词、副词,具体包括以下步骤:

3.根据权利要求2所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述统计答题文本中句子的字数分布情况,得到句长特征向量,具体包括以下步骤:

4.根据权利要求3所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述计算答题文本中相邻单词、相邻句子之间的重复率、相似率,得到词与词、句与句的逻辑关系向量,具体包括以下步骤:

5.根据权利要求4所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述基于多个大语言基座模型,分别对答题文本进行编码,得到多组语言模型的语义特征矩阵,具体包括以下步骤:

6.根据权利要求5所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述将上述得到的词性分布向量、句长特征向量、逻辑关系向量以及语义特征矩阵,输入到对应的大语言基座模型作为基础的微调ai文本判别模型中,得到每个微调ai文本判别模型输出的ai特征矩阵中,通过构建多个神经网络判别模型得到每个模型对试卷中语义特征的ai生成概率。

7.根据权利要求6所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述根据每个微调ai文本判别模型输出的ai特征矩阵整合计算得到ai生成文字概率中,是通过模型集成和多层级概率计算得到最终ai生成文字概率。

8.根据权利要求7所述的一种识别试卷中包含ai生成文字的方法,其特征在于,所述将ai生成文字概率与预设阈值进行比较,若大于阈值则判定答题文本包含ai生成文字,否则判定答题文本不包含ai生成文字,具体包括以下步骤:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行权利要求1-8任一项所述的一种识别试卷中包含ai生成文字的方法。

10.一种识别试卷中包含ai生成文字的系统,其特征在于,包括通讯设备、存储设备,所述存储设备中包含有如权利要求9所述的计算机可读存储介质。


技术总结
本发明提供了一种识别试卷中包含AI生成文字的方法、介质及系统,包括对输入的答题文本进行词频统计,得到答题文本的词性分布向量;统计答题文本中句子的字数分布情况,得到句长特征向量;计算答题文本中相邻单词、相邻句子之间的重复率、相似率,得到词与词、句与句的逻辑关系向量;对答题文本进行编码,得到多组语言模型的语义特征矩阵;将得到的各向量以及语义特征矩阵,输入到对应的大语言基座模型,得到AI特征矩阵;根据AI特征矩阵整合计算得到AI生成文字概率;设定阈值,判定答题文本是否为AI生成;本发明能够识别一篇文本是否包含AI生成的内容,降低判别难度。

技术研发人员:廖梦一,张武,臧国成,白春秀,贾鹏程,张鹏飞,王海瑞,王刚,梁世权,马国光
受保护的技术使用者:北京信诺软通信息技术有限公司
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1