本申请涉及人工智能,尤其涉及一种标准化文件的处理方法、装置、电子设备和存储介质。
背景技术:
1、标准化文件是“通过标准化活动制定的文件”。标准化文件属于规范性文件的一种,与其他规范性文件在形成过程上的主要区别在于它产生于标准化活动。
2、标准化文件的制定具有经验性,经验丰富的技术人员往往能够更好的提供编写内容,同时,标准化文件也存在一定的规范性,只有在规范框架与规范内容的指导下编写出的标准化文件,才称得上是一个好标准。
3、对于标准化文件的编写,相关技术采用一种基于word插件的标准化文件编写软件,该软件只针对于标准化文件的格式问题,即基础的字号大小、段落、排版等格式问题进行校正,无法对标准化文件文本内容进行编写。
4、因此,亟需一种能够生成标准化文件的方法。
技术实现思路
1、本申请提供了一种标准化文件的处理方法、装置、电子设备和存储介质,用以解决现有技术中,仅能对标准化文件的格式进行校正,而无法对标准化文件文本内容进行编写的问题。
2、第一方面,本申请实施例提供了一种标准化文件的处理方法,包括:
3、获取生成请求,所述生成请求中包括请求内容;
4、确定所述请求内容对应的目标文件模板;
5、将所述请求内容输入标准化文件生成模型中,得到输出结果,所述标准化文件生成模型是利用标准化文件作为训练样本训练得到的;
6、根据所述输出结果和所述目标文件模板,生成所述生成请求请求的目标标准化文件。
7、可选的,所述确定所述请求内容对应的目标文件模板,包括:
8、提取所述请求内容中的目标标准标识;
9、从预先建立的文件模板与标准标识的对应关系中,确定所述目标标准标识对应的所述目标文件模板。
10、可选的,所述标准化文件生成模型的训练过程,包括:
11、获取所述训练样本,所述训练样本中包括至少一种标准类型的所述标准化文件,以及每个所述标准化文件对应的标准标识,所述标准标识用于指示所述标准化文件的文件特征;
12、将所述标准标识依次输入初始网络模型中,通过所述初始网络模型生成编写文件内容,基于所述编写文件内容与所述标准化文件中的内容计算损失值,基于所述损失值训练得到所述标准化文件生成模型。
13、可选的,所述获取所述训练样本,包括:
14、利用python爬取标准化文件集合,得到所述训练样本,所述标准化文件集合中的所述标准化文件,按照所述标准类型的不同配置初始权重;
15、所述通过所述初始网络模型生成编写文件内容之后,还包括:
16、获取所述初始网络模型最近生成的预设个数的编写文件集合;
17、计算所述编写文件集合中每个所述标准类型的编写文件在所述编写文件集合中的占比;
18、基于所述占比调整所述初始权重,得到目标权重,并按照所述目标权重的标准化文件训练得到所述标准化文件生成模型。
19、可选的,还包括:
20、获取标准化文件集合,所述标准化文件集合中包括至少一种标准类型的所述标准化文件;
21、提取每个所述标准化文件的标准标识集合;
22、基于所述标准标识集合构建所述标准化文件间的知识图谱;
23、基于所述标准化文件集合和所述知识图谱构建标准文件库。
24、可选的,还包括:
25、获取查询请求,所述查询请求中包括查询内容;
26、从所述标准文件库中确定与所述查询内容匹配的标准化文件子集合,所述标准化文件子集合中包括至少一个候选标准化文件;
27、显示所述候选标准化文件的导航信息,所述导航信息包括所述候选标准化文件的数量、所述标准化文件子集合中具体内容的关键词知识图谱、每个所述标准化文件的范围信息、规范性引用文件信息、正文章节标题信息的导航内容。
28、可选的,还包括:
29、获取待核定文件;
30、确定所述待核定文件与所述标准化文件间的相似度;
31、若得到相似度大于第一预设值,确定核定结果为不建议编写;
32、若得到相似度小于第二预设值,确定核定结果为建议编写;
33、若得到相似度大于第二预设值且小于所述第一预设值,确定核定结果为建议修改。
34、第二方面,本申请实施例提供了一种标准化文件的处理装置,包括:
35、获取模块,用于获取生成请求,所述生成请求中包括请求内容;
36、确定模块,用于确定所述请求内容对应的目标文件模板;
37、输入模块,用于将所述请求内容输入标准化文件生成模型中,得到输出结果,所述标准化文件生成模型是利用标准化文件作为训练样本训练得到的;
38、生成模块,用于根据所述输出结果和所述目标文件模板,生成所述生成请求请求的目标标准化文件。
39、第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
40、所述存储器,用于存储计算机程序;
41、所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的标准化文件的处理方法。
42、第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的标准化文件的处理方法。
43、本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过获取生成请求,所述生成请求中包括请求内容;确定所述请求内容对应的目标文件模板;将所述请求内容输入标准化文件生成模型中,得到输出结果,所述标准化文件生成模型是利用标准化文件作为训练样本训练得到的;根据所述输出结果和所述目标文件模板生成目标标准化文件。如此,在用户需要生成新的标准化文件时,通过下发生成请求,便可以通过确定生成请求中的请求内容确定目标文件模板,然后,利用标准化文件生成模型生成的输出结果作为文件内容,基于目标文件模板和输出结果得到目标标准化文件,从而实现了对标准化文件内容的编写。
1.一种标准化文件的处理方法,其特征在于,包括:
2.根据权利要求1所述的标准化文件的处理方法,其特征在于,所述确定所述请求内容对应的目标文件模板,包括:
3.根据权利要求1所述的标准化文件的处理方法,其特征在于,所述标准化文件生成模型的训练过程,包括:
4.根据权利要求3所述的标准化文件的处理方法,其特征在于,所述获取所述训练样本,包括:
5.根据权利要求1所述的标准化文件的处理方法,其特征在于,还包括:
6.根据权利要求5所述的标准化文件的处理方法,其特征在于,还包括:
7.根据权利要求1所述的标准化文件的处理方法,其特征在于,还包括:
8.一种标准化文件的处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的标准化文件的处理方法。