本发明涉及文案生成,尤其涉及一种文案生成模型的训练方法及装置。
背景技术:
1、随着互联网及大数据时代的飞速发展,对文本数据进行广告文案匹配的需求也愈发增多。然而,实践表明,现有的广告文案匹配方式主要是人为且通过主观性地从现有的存储库中进行检索、匹配相关的广告文案素材,只能从存储库的现存储素材中挑选目标素材作为广告文案,存储库中的素材有限,并且对存储库的要求较高,需要存储库存储非常多的素材种类以供挑选,广告文案生成结果的准确性较低。因此,提供一种能够提高广告文案生成准确性的方式显得尤为重要。
技术实现思路
1、本
技术实现要素:
所要解决的技术问题在于,提供一种文案生成模型的训练方法及装置,能够提高文案生成准确性和可靠性。
2、为了解决上述技术问题,本发明第一方面公开了一种文案生成模型的训练方法,所述方法包括:
3、对第一初始文案生成模型执行嵌入参数配置操作,得到第二初始文案生成模型;
4、对所述第二初始文案生成模型执行参数处理操作,得到目标文案生成模型;
5、基于预先确定出的训练文本数据对所述目标文案生成模型进行训练,得到预测文案信息,并根据所述预测文案信息,判断所述目标文案生成模型是否满足预设的模型收敛条件;
6、当判断结果为是时,确定所述目标文案生成模型训练至收敛,收敛后的所述目标文案生成模型用于生成输入文本数据对应的适配文案。
7、作为一种可选的实施方式,在本发明第一方面中,所述对第一初始文案生成模型执行嵌入参数配置操作,得到第二初始文案生成模型,包括:
8、根据确定出的第一初始文案生成模型对应的参数筛选条件信息,确定需要进行嵌入参数配置的参数需求总量;所述参数筛选条件信息包括训练数据信息、模型硬件配置信息及模型部署情况信息中的一种或多种;
9、确定所述第一初始文案生成模型对应的层级训练影响信息,并根据所述层级训练影响信息及所述参数需求总量,从所述第一初始文案生成模型中筛选出需要配置嵌入参数的目标层;所述第一初始文案生成模型包括至少一个嵌入层和/或至少一个模型结构层;
10、对每一所述目标层执行嵌入参数配置操作,得到第二初始文案生成模型。
11、作为一种可选的实施方式,在本发明第一方面中,所述根据所述层级训练影响信息及所述参数需求总量,从所述第一初始文案生成模型中筛选出需要配置嵌入参数的目标层,包括:
12、根据所述层级训练影响信息,分析所述第一初始文案生成模型所包括的每一模型层对应的训练影响程度;
13、根据所有所述训练影响程度,确定所有所述模型层对应的训练优先级;
14、根据所述参数需求总量及所述训练优先级,从所述第一初始文案生成模型包括的所有所述模型层中筛选出需要配置嵌入参数的目标层。
15、作为一种可选的实施方式,在本发明第一方面中,所述对所述第二初始文案生成模型执行参数处理操作,得到目标文案生成模型,包括:
16、确定所述第二初始文案生成模型对应的参数初始化方式集合;
17、根据设定的随机初始化筛选方式,从所述参数初始化方式集合中筛选出目标参数初始化方式;
18、根据所述目标参数初始化方式,对所述第二初始文案生成模型中的每一目标层的嵌入参数执行参数初始化操作,得到目标文案生成模型。
19、作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
20、当判断出所述目标文案生成模型不满足所述模型收敛条件,对所述目标文案生成模型执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件;
21、以及,所述对所述目标文案生成模型执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件,包括:
22、根据确定出的所述目标文案生成模型对应的文案损失结果,确定所述目标文案生成模型中的每一目标层的参数更新信息;
23、对于每一所述目标层,根据该目标层的参数更新信息,对该目标层的嵌入参数执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件。
24、作为一种可选的实施方式,在本发明第一方面中,所述根据所述预测文案信息,判断所述目标文案生成模型是否满足预设的模型收敛条件,包括:
25、确定所述训练文本数据对应的预期文案信息,并根据所述预期文案信息及所述预测文案信息,确定文案损失结果;
26、根据所述文案损失结果,判断所述目标文案生成模型是否满足预设的模型应用训练条件;
27、当判断出所述目标文案生成模型满足所述模型应用训练条件时,确定所述目标文案生成模型满足预设的模型收敛条件;
28、当判断出所述目标文案生成模型不满足所述模型应用训练条件时,确定所述目标文案生成模型不满足预设的模型收敛条件。
29、作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
30、将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述目标文案生成模型对应的文案生成结果;
31、以及,在所述将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果之前,所述方法还包括:
32、判断待文案生成数据是否满足预设的基础数据清洗条件;
33、当判断出所述待文案生成数据不满足所述基础数据清洗条件时,执行所述的将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果的操作;
34、当判断出所述待文案生成数据满足所述基础数据清洗条件时,对所述待文案生成数据执行标点符号处理操作;根据所述待文案生成数据,分析所述待文案生成数据对应的文本含义;根据所述文本含义,对所述待文案生成数据执行异常字段处理操作,并执行所述的将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果的操作。
35、本发明第二方面公开了一种文案生成模型的训练装置,其特征在于,所述装置包括:
36、参数配置模块,用于对第一初始文案生成模型执行嵌入参数配置操作,得到第二初始文案生成模型;
37、参数处理模块,用于对所述第二初始文案生成模型执行参数处理操作,得到目标文案生成模型;
38、文案确定模块,用于基于预先确定出的训练文本数据对所述目标文案生成模型进行训练,得到预测文案信息;
39、判断模块,用于根据所述预测文案信息,判断所述目标文案生成模型是否满足预设的模型收敛条件;
40、确定模块,用于当所述判断模块判断出所述目标文案生成模型满足所述模型收敛条件时,确定所述目标文案生成模型训练至收敛,收敛后的所述目标文案生成模型用于生成输入文本数据对应的适配文案。
41、作为一种可选的实施方式,在本发明第二方面中,所述参数配置模块对第一初始文案生成模型执行嵌入参数配置操作,得到第二初始文案生成模型的方式具体包括:
42、根据确定出的第一初始文案生成模型对应的参数筛选条件信息,确定需要进行嵌入参数配置的参数需求总量;所述参数筛选条件信息包括训练数据信息、模型硬件配置信息及模型部署情况信息中的一种或多种;
43、确定所述第一初始文案生成模型对应的层级训练影响信息,并根据所述层级训练影响信息及所述参数需求总量,从所述第一初始文案生成模型中筛选出需要配置嵌入参数的目标层;所述第一初始文案生成模型包括至少一个嵌入层和/或至少一个模型结构层;
44、对每一所述目标层执行嵌入参数配置操作,得到第二初始文案生成模型。
45、作为一种可选的实施方式,在本发明第二方面中,所述参数配置模块根据所述层级训练影响信息及所述参数需求总量,从所述第一初始文案生成模型中筛选出需要配置嵌入参数的目标层的方式具体包括:
46、根据所述层级训练影响信息,分析所述第一初始文案生成模型所包括的每一模型层对应的训练影响程度;
47、根据所有所述训练影响程度,确定所有所述模型层对应的训练优先级;
48、根据所述参数需求总量及所述训练优先级,从所述第一初始文案生成模型包括的所有所述模型层中筛选出需要配置嵌入参数的目标层。
49、作为一种可选的实施方式,在本发明第二方面中,所述参数处理模块对所述第二初始文案生成模型执行参数处理操作,得到目标文案生成模型的方式具体包括:
50、确定所述第二初始文案生成模型对应的参数初始化方式集合;
51、根据设定的随机初始化筛选方式,从所述参数初始化方式集合中筛选出目标参数初始化方式;
52、根据所述目标参数初始化方式,对所述第二初始文案生成模型中的每一目标层的嵌入参数执行参数初始化操作,得到目标文案生成模型。
53、作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
54、参数更新模块,用于当所述判断模块判断出所述目标文案生成模型不满足所述模型收敛条件,对所述目标文案生成模型执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件;
55、以及,所述参数更新模块对所述目标文案生成模型执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件的方式具体包括:
56、根据确定出的所述目标文案生成模型对应的文案损失结果,确定所述目标文案生成模型中的每一目标层的参数更新信息;
57、对于每一所述目标层,根据该目标层的参数更新信息,对该目标层的嵌入参数执行参数更新操作,以使所述目标文案生成模型满足所述模型收敛条件。
58、作为一种可选的实施方式,在本发明第二方面中,所述判断模块根据所述预测文案信息,判断所述目标文案生成模型是否满足预设的模型收敛条件的方式具体包括:
59、确定所述训练文本数据对应的预期文案信息,并根据所述预期文案信息及所述预测文案信息,确定文案损失结果;
60、根据所述文案损失结果,判断所述目标文案生成模型是否满足预设的模型应用训练条件;
61、当判断出所述目标文案生成模型满足所述模型应用训练条件时,确定所述目标文案生成模型满足预设的模型收敛条件;
62、当判断出所述目标文案生成模型不满足所述模型应用训练条件时,确定所述目标文案生成模型不满足预设的模型收敛条件。
63、作为一种可选的实施方式,在本发明第二方面中,所述文案确定模块,还用于将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述目标文案生成模型对应的文案生成结果;
64、所述判断模块,还用于在所述文案确定模块将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果之前,判断待文案生成数据是否满足预设的基础数据清洗条件;当判断出所述待文案生成数据不满足所述基础数据清洗条件时,所述文案确定模块执行所述的将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果的操作;
65、以及,所述装置还包括:
66、数据处理模块,用于当所述判断模块判断出所述待文案生成数据满足所述基础数据清洗条件时,对所述待文案生成数据执行标点符号处理操作;根据所述待文案生成数据,分析所述待文案生成数据对应的文本含义;根据所述文本含义,对所述待文案生成数据执行异常字段处理操作,并触发所述文案确定模块执行所述的将待文案生成数据输入至训练收敛的所述目标文案生成模型中进行分析,得到所述待文案生成数据对应的文案生成结果的操作。
67、本发明第三方面公开了另一种文案生成模型的训练装置,所述装置包括:
68、存储有可执行程序代码的存储器;
69、与所述存储器耦合的处理器;
70、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的一种文案生成模型的训练方法。
71、本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的一种文案生成模型的训练方法。
72、与现有技术相比,本发明实施例具有以下有益效果:
73、本发明实施例中,对第一初始文案生成模型执行嵌入参数配置操作,得到第二初始文案生成模型;对该第二初始文案生成模型执行参数处理操作,得到目标文案生成模型;基于预先确定出的训练文本数据对该目标文案生成模型进行训练,得到预测文案信息,并根据该预测文案信息,判断该目标文案生成模型是否满足预设的模型收敛条件;当判断结果为是时,确定该目标文案生成模型训练至收敛,收敛后的该目标文案生成模型用于生成输入文本数据对应的适配文案。可见,本发明能够对初始文案生成模型分别执行嵌入参数配置操作及参数处理操作得到目标文案生成模型,基于训练文本数据对目标文案生成模型进行训练直至目标文案生成模型训练至收敛,收敛后的目标文案生成模型用于生成输入文本数据对应的适配文案,有利于提高文案生成模型训练方式的合理性和全面性,进而有利于提高文案生成模型的训练收敛可靠性和及时性,从而有利于提高训练收敛的文案生成模型的文案生成结果的准确性和可靠性,以及还有利于提高基于文案生成模型的文案生成效率和便捷性,此外,还有利于丰富大模型的智能化功能,以使大模型适配文案生成功能。