高等院校学位论文格式智能检测系统及方法与流程

文档序号:34609771发布日期:2023-06-29 06:02阅读:46来源:国知局
高等院校学位论文格式智能检测系统及方法与流程

本发明属于智能检测,尤其涉及高等院校学位论文格式智能检测系统及方法。


背景技术:

1、在当代,论文是一种描述各领域学术研究成果的文章,是探讨学术问题、进行学术研究的一种方式,也是体现作者所从事研究工作成果的主要表现,是作者申请学位的重要依据。各院校及社会机构对于论文的撰写都有着严格的要求,特别是论文的格式要严格遵守规范,文章的查重率需要在特定的范围之内。作者在撰写论文的过程中,往往会注重于对研究结果、技术核心等的描述而忽略对格式上的规范处理,为了写出的论文符合要求,需要在最后对论文的格式进行检查修正处理。

2、但论文往往是一篇篇幅较长、内容结构较为复杂的文章,涉及的格式要求很多,光靠作者人工检查难免会产生疏忽,因此需要一个智能检测系统来对文章进行自动检测。如专利号为cn111488724a的技术公开了一种论文格式检测方法,从字体、字号、是否对齐、段前距、段后距、行间距等来检查论文的格式,但检测内容不全面,忽略了对论文其他格式的检测,如图、表、标题、摘要等部分;如专利号为cn114386400a的技术则公开了一种基于有限状态机的毕业论文格式检测方法,相较于专利cn111488724a的技术则实现了更详细的检测内容,但检测部分仍旧不够细致,且该技术基于有限状态机的方式运行,即按顺序对各检测模块进行检测,无法实现并行处理,效率交低。另外,还存在一种论文格式检测网站,需要用户将论文提交到远程服务器检测,可能存在安全问题,导致未公开的论文泄露、查重率升高等情况。

3、因此,亟须提供高等院校学位论文格式智能检测系统及方法,实现对论文格式更细致完整的检测、且检测效率更高、更安全。


技术实现思路

1、针对现有技术存在的问题,本发明提供了高等院校学位论文格式智能检测系统及方法,可以对更安全、更细致、完整地检测论文格式是否符合要求,且有效提高检测效率。

2、本发明的技术方案是这样实现的:

3、高等院校学位论文格式智能检测系统,包括论文解析服务模块、论文格式检测主服务模块和若干个子模块;

4、所述论文解析服务模块用于读取并解析论文文件,生成论文格式中间文件;

5、所述论文格式检测主服务模块根据得到的论文格式中间文件,将论文文件的不同格式内容分别输入对应的子模块检测,并接收、汇总各子模块的检测结果,生成论文格式自查表,论文格式自查表可以向作者展示论文的格式检查结果,帮助作者实现论文格式自查及修改;

6、所述子模块包括封面检测模块、摘要检测模块、标题检测模块、论文结构检测模块、页眉页脚检测模块、段落检测模块、公式图标检测模块、图检测模块、表格检测模块、算法检测模块和参考文献检测模块中的一种或多种。

7、作为以上方案的进一步优化,所述封面检测模块中,检测项及合格标准为:题目居中对齐;若题目长度超过一行,每一行都需要加下划线且各行的下划线等齐;横线处填写的作者姓名、指导教师姓名等内容需居中对齐;论文的封面和扉页上的指导教师姓名和职称信息准确且一致;即对于论文中关于作者等信息下方都设有下划线,下划线上方的文字居中对齐,且封面上和扉页上的内容要对应一致;

8、所述摘要检测模块中,检测项及合格标准为:摘要中包含各章节的关键问题、研究方法;英文缩写规范;关键词数量;关键词以逗号或分号分开,且最后一个关键词后无标点符号;

9、所述标题检测模块中,检测项及合格标准为:标题行无标点符号;标题都为名词或名词短语,而不是带主谓语的句子;标题无中文简称或英文缩写;论文的题目和章、节、小节标题之间无前后矛盾、重复或混乱;

10、所述论文结构检测模块中,检测项及合格标准为:不存在只有一个分条目的章或节;不存在篇幅太短的章或节,即章节的字数不能小于预设的最小篇幅阈值;依据毕业论文要求分级编码序号;序号标点使用正确;子标题在父标题的正文内容之后;

11、所述页眉页脚检测模块中,检测项及合格标准为:页面包含页眉、页脚和页码且各页面采用同一格式;

12、所述段落检测模块中,检测项及合格标准为:段落字数不能超过预设定的值;不存在一段文字作为一小节;不存在一个字占据一行;缩进、正文字体和段落文字的行距的使用都符合现行论文标准规范;

13、所述公式图标检测模块中,检测项及合格标准为:论文中的同一个符号都为正体或都为斜体;每个公式都按章编号;每个公式在正文中的引用方法为“如式(x-x)”;代码符号与数学符号无非法混用;

14、所述图检测模块中,检测项及合格标准为:每个图按章编号且拥有图标题;图标题的字号比正文小半号;每个图在正文中的引用方法为“如图x.x”;每个图都不跨页展示;图的前后无大片空白;多个图并列要分别标序号;坐标图的横、纵坐标及单位在图中准确标注;

15、所述表格检测模块中,检测项及合格标准为:每个表格按章编号且拥有表标题;表标题及表中的文字的字号比正文小半号;每个表格都不跨页展示;每个表格在正文中的引用方法为“如表x.x”;

16、所述算法检测模块中,检测项及合格标准为:每个算法都不跨页展示;算法中,除注释外,都为中文或伪代码;

17、所述参考文献检测模块中,检测项及合格标准为:参考文献的数量为30至50篇;近5年的论文和专著数量不少于参考文献总数的1/3;英文论文数量不少于参考文献总数的1/2;类型为专著([m])的参考文献不超过5本;卷期号页码齐全,卷期号页码格式统一;书、期刊、会议论文统一规范;分隔作者、题目、期刊会议名称、卷期号页码的标点的使用统一且符合规范;中英文英文期刊名的字体格式统一;作者名引用规范;参考文献在正文中都有引用,并按正文中出现的先后次序罗列;参考文献上标检测。

18、作为以上方案的进一步优化,所述图检测模块中,图的提取识别方法为基于vgg16神经网络模型进行的分类预测方法。

19、作为以上方案的进一步优化,所述表格检测模块中和所述图检测模块中,坐标及表格的识别方法为基于tesseract-ocr的文本识别技术。

20、作为以上方案的进一步优化,所述论文格式自查表为包含不同格式的检测结果的输出结果表,每个检测项在论文格式自查表上的信息包括检测项描述、检测结果、错误统计和整改建议。

21、本发明还公开了高等院校学位论文格式智能检测方法,应用了上述的高等院校学位论文格式智能检测系统,包括以下步骤:

22、s1、读取pdf格式或docx格式的论文文件,将文件输入论文解析服务模块;

23、s2、论文解析服务模块根据选择的文章检测粒度对论文文件进行解析,得到包含不同节点的论文格式中间文件;作者可以自由根据对论文格式的严格程度的需求,在开始论文检测之前预先设置系统的配置文件,选择不同的文章检测粒度。

24、s3、论文格式检测主服务模块从论文格式中间文件内提取不同节点信息,并分别输入对应的子模块进行检测;

25、s4、各子模块根据得到的节点信息,并发启动检测服务,即多个子模块可以同时开启检测任务,并将检测结果反馈回论文格式检测主服务模块;

26、s5、论文格式检测主服务模块接收各子模块的检测结果并汇总输出论文格式自查表。

27、作为以上方案的进一步优化,所述文章检测粒度为字粒度、词粒度、句粒度或段落粒度中的一种。

28、作为以上方案的进一步优化,所述论文格式中间文件为规范格式化的xml文件,包含多种类型的节点,包括文章节点、章节节点、段落节点、句节点和字节点,将论文解析为xml格式的中间文件后,方便论文格式检测主服务模块快速区分、查找论文中的不同内容并输入对应的子模块进行检测。

29、作为以上方案的进一步优化,步骤s4中,子模块会根据选择的文章检测粒度增加不同的检测项;

30、当选用的文章检测粒度为字粒度时,会进行错别字检测、标点符号误用检测、字体和字号检测;

31、当选用的文章检测粒度为词粒度时,会进行错误词检测、缩略词检测;

32、当选用的文章检测粒度为句粒度时,会进行病句检测、超长句检测、语言缺失系数检测;

33、当选用的文章检测粒度为段粒度时,会进行段落的前瞻性检测、摘要概括性检测、标题管理性检测。当选择了不同文章检测粒度,系统会根据选择对论文格式采取不同细致程度的监测。

34、与现有技术相比,本发明取得以下有益效果:

35、(1)本发明将检测系统划分为不同的多个检测子模块,将论文的内容提取并分别输入对应的各子模块进行检测,各个模块在检测过程中不相互依赖,且可以并行运行,有效提高了检测的速度;

36、(2)本发明提供的系统实现了对论文格式更完整更细致的检测项目,不仅实现了对论文基本格式,如字体字号等的检测,还实现了对论文内容的语法检测,如错误字词句、标点符合的检测,以及实现了对论文内容的结构性检测,能够判断论文的文章框架结构是否符合要求、前后文的关联引用是否一致或矛盾等;可以帮助作者对论文格式进行查找、修正,直至符合现行科研学术机构的要求;

37、(3)本发明在实现各子模块格式检测的基础上,提供了不同文章检测粒度的选择,让作者可以实现对论文不同程度的检测需求;

38、(4)本发明提供的系统可以在用户设备的本地运行,对论文进行检测,保证论文信息的安全性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1