文本生成方法、装置及存储介质与流程

文档序号:40512642发布日期:2024-12-31 13:21阅读:17来源:国知局
文本生成方法、装置及存储介质与流程

本公开涉及计算机,尤其涉及一种文本生成方法及装置及存储介质。


背景技术:

1、新闻生成是一个非常具有挑战性的任务,因为它需要生成连贯、准确、可信、吸引人的新闻内容。然而,目前的模型往往是黑盒子,我们无法控制生成的内容,也无法保证生成的内容符合我们的期望。

2、在人工智能领域,提示指的是用于生成自然语言文本的输入提示或文本片段,它可以根据用户提供的初始文本和上下文信息生成相应的输出文本。以gpt-3(generativepre-trained transformer 3)为例,它是一种基于transformer架构的大规模语言模型,在接收到提示之后,利用已经学习到的知识和数据来生成符合条件的文本响应。提示是连接人类与计算机交互的重要纽带之一,它可以帮助减少人工编写代码或规则的工作量,尤其是在涉及到大规模数据和复杂场景的情况下。此外,提示还可以提高文本生成的质量和效率,使得计算机与人类之间的交互更加流畅和自然。

3、然而,如何写出较好的提示使模型生成符合用户预期的文本并不是一件容易的事。一种可行的方式是采用提示逆向工程。提示逆向工程是指通过对模型结果进行反推,以生成特定的文本内容。具体来说,它旨在破解语言模型中的隐藏规律和知识,通过分析特定文本的立意和结构,倒推出可实现文本生成的控制和定制的提示。这种方法可以用于生成虚假信息、欺诈性文本、恶意攻击等场景中,同时也可以作为评估和改进语言模型的方法之一。


技术实现思路

1、本公开提供一种文本生成方法、装置及存储介质。

2、本公开实施例第一方面提供一种文本生成方法,应用于电子设备中,所述方法包括:

3、获取用户输入的文本信息;其中,所述文本信息包括指令信息以及第一新闻文本;

4、将所述期望指令信息以及所述第一新闻文本输入至预训练语言模型,得到第一新闻属性和第一提示模板;

5、获取修改后的所述第一提示模板,得到第二提示模板;

6、将所述第二提示模板,输入至所述预训练语言模型进行扩充操作,得到第三提示模板;

7、将所述第一新闻属性和第三提示模板随机组合,得到第四提示模板;

8、将第四提示模板输入至所述预训练语言模型,得到模型生成的第二新闻文本;

9、将所述第四提示模板和所述模型生成的第二新闻文本,以及所述第一提示模板和所述第一新闻文本作为训练数据,输入至所述预训练语言模型,得到训练后的语言模型;

10、将用户输入的新闻属性和所述第三提示模板组合,输入至所述训练后的语言模型,得到期望的第三新闻文本。

11、基于上述方案,所述指令信息为:请分析以下新闻的主题、关键词、来源、情感、风格、语气和/或长度特点,并结合所述特点给出生成新闻的提示模板。

12、基于上述方案,所述第一提示模板的组成方式为:包含第一新闻属性的信息。

13、基于上述方案,所述第二提示模板为:请为【来源】写一篇【语气】的【风格】【长度】,主题是【主题】,包含【关键词】。

14、基于上述方案,所述第三提示模板为:写一篇与【主题】相关的新闻报道,包含以下关键词【关键词】,新闻来源于【来源】,情感【情感】,风格【风格】,语气【语气】,长度【长度】。

15、基于上述方案,所述第四提示模板包括:所述第一新闻属性中的所述主题、所述关键词、所述来源、所述情感、所述风格、所述语气以及所述长度的详细信息。

16、基于上述方案,所述将所述第四提示模板和所述模型生成的第二新闻文本以及所述第一提示模板和所述第一新闻文本作为训练数据,输入至所述预训练语言模型,得到训练后的语言模型,包括:

17、根据所述第四提示模板与所述模型生成的第二新闻文本、所属第一提示模板和所属第一新闻文本进行数据对混合;

18、将混合后的数据作为训练数据,训练所述语言模型,得到所述训练后的语言模型。

19、本公开实施例第二方面提供一种文本生成装置,其特征在于,应用于电子设备中,所述装置包括:

20、第一获取模块,用于获取用户输入的文本信息;其中,所述文本信息包括指令信息以及第一新闻文本;

21、第一生成模块,用于将所述指令信息以及所述第一新闻文本输入至预训练语言模型,得到第一新闻属性和第一提示模板;

22、第二获取模块,用于获取修改后的所述第一提示模板,得到第二提示模板;

23、第二生成模块,用于将所述第二提示模板,输入至所述预训练语言模型进行扩充操作,得到第三提示模板;

24、第三生成模块,用于将所述第一新闻属性和所述第三提示模板随机组合,得到第四提示模板;

25、第四生成模块,用于将所述第四提示模板输入至所述预训练语言模型,得到模型生成的第二新闻文本;

26、训练模块,用于将所述第四提示模板和所述模型生成的第二新闻文本,以及所述第一提示模板和所述第一新闻文本作为训练数据,输入至所述预训练语言模型,得到训练后的语言模型;

27、第五生成模块,用于将用户输入的新闻属性和所述第三提示模板组合,输入至训练后的语言模型,得到期望的第三新闻文本。

28、本公开实施例第三方面提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机的处理器执行时,使得计算机能够执行如上述任一项所述的文本生成方法。

29、本公开的实施例提供的技术方案可以包括以下有益效果:

30、本公开实施例提出了一种提高生成文本的质量的文本生成方法,与传统的生成模型不同,逆向提示将目标输出文本作为输入,可以更加精准地控制所生成的文本内容。这种方法可以避免生成出无意义或者与预期不符的文字。逆向提示可以根据用户的需求和输入数据来很好的定制所生成的文本,从而使生成出的文本更加贴近用户的实际需要和要求,具有更高的个性化和针对性。



技术特征:

1.一种文本生成方法,其特征在于,应用于电子设备中,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述指令信息为:请分析以下新闻的主题、关键词、来源、情感、风格、语气和/或长度特点,并结合所述特点给出生成新闻的提示模板。

3.根据权利要求1所述的方法,其特征在于,所述第一提示模板的组成方式为:包含第一新闻属性的信息。

4.根据权利要求1所述的方法,其特征在于,所述第二提示模板为:请为【来源】写一篇【语气】的【风格】【长度】,主题是【主题】,包含【关键词】。

5.根据权利要求1所述的方法,其特征在于,所述第三提示模板为:写一篇与【主题】相关的新闻报道,包含以下关键词【关键词】,新闻来源于【来源】,情感【情感】,风格【风格】,语气【语气】,长度【长度】。

6.根据权利要求5所述的方法,其特征在于,所述第四提示模板包括:所述第一新闻属性中的所述主题、所述关键词、所述来源、所述情感、所述风格、所述语气以及所述长度的详细信息。

7.根据权利要求1所述的方法,其特征在于,所述将所述第四提示模板和所述模型生成的第二新闻文本以及所述第一提示模板和所述第一新闻文本作为训练数据,输入至所述预训练语言模型,得到训练后的语言模型,包括:

8.一种文本生成装置,其特征在于,应用于电子设备中,所述装置包括:

9.一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机的处理器执行时,使得计算机能够执行如权利要求1至7中任一项所述的文本生成方法。


技术总结
本公开是关于一种文本生成方法、装置及存储介质。应用于电子设备中的文本生成方法包括:获取用户输入的文本信息;其中,所述文本信息包括指令信息以及第一新闻文本;将所述期望指令信息以及所述第一新闻文本输入至预训练语言模型,得到第一新闻属性和第一提示模板;获取修改后的所述第一提示模板,得到第二提示模板;将所述第二提示模板,输入至所述预训练语言模型进行扩充操作,得到第三提示模板;将所述第一新闻属性和第三提示模板随机组合,得到第四提示模板;将第四提示模板输入至所述预训练语言模型,得到模型生成的第二新闻文本;将所述第四提示模板和所述模型生成的第二新闻文本,以及所述第一提示模板和所述第一新闻文本作为训练数据,输入至所述预训练语言模型,得到训练后的语言模型;将用户输入的新闻属性和所述第三提示模板组合,输入至所述训练后的语言模型,得到期望的第三新闻文本。

技术研发人员:周玉,翟飞飞,刘宇宸
受保护的技术使用者:北京中科凡语科技有限公司
技术研发日:
技术公布日:2024/12/30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1