语句生成方法、装置及存储介质与流程

文档序号:36501426发布日期:2023-12-28 04:16阅读:39来源:国知局
语句生成方法与流程

本申请涉及人工智能(artificial intelligence,ai)领域,特别涉及一种语句生成方法、装置及存储介质。


背景技术:

1、当前,在自然语言处理领域,ai模型的训练和使用往往需要依赖包含有大量相似语句的语料库。例如,在基于检索式问答算法实现的自动问答系统中,可以利用语料库中大量相似语句对问句匹配模型进行训练。后续,在接收到用户输入的目标问句后,还可以通过训练好的问句匹配模型将语料库中的问句与目标问句进行匹配,进而将该目标问句的匹配问句对应的回答作为该目标问句的回答。其中,语料库中目标问句的相似问句越多,则在匹配过程中越容易获得准确率较高的匹配问句。

2、综上可见,自然语言处理领域的ai模型的训练和使用将受到语料库中包含的相似语句的数量和质量的影响。基于此,亟需提供一种能够自动生成高质量相似语句的方法,以此来扩充语料库,从而为ai模型的训练和使用提供数据支持。


技术实现思路

1、本申请实施例提供了一种语句生成方法、装置及存储介质,可以自动生成高质量的相似语句,以实现对语料库的有效扩充。所述技术方案如下:

2、第一方面,提供了一种语句生成方法,所述方法包括:基于参考语句,通过第一语句生成模型生成多个第一候选相似语句;基于用户针对至少一个第一候选相似语句的修改操作,生成至少一个第二候选相似语句,所述多个第一候选相似语句包括所述至少一个第一候选相似语句;利用所述至少一个第二候选相似语句对所述第一语句生成模型进行更新,得到第二语句生成模型。

3、在本申请实施例中,在通过第一语句生成模型生成参考语句的多个第一候选相似语句后,可以基于用户对至少一个第一候选相似语句的修改操作来获得至少一个第二候选相似语句,进而利用该至少一个第二候选相似语句来对第一语句生成模型进行更新。也即,本申请实施例可以通过用户修改后的候选相似语句来实时优化语句生成模型,在此基础上,基于优化后的语句生成模型和参考语句能够生成更多高质量的相似语句。这样,不仅实现了对语料库的有效扩充,还能够不断的提升语句生成模型的准确率。

4、可选地,上述的语句生成模型为人工智能模型。例如,该语句生成模型可以为神经网络模型或者是决策树模型等。例如,该语句生成模型可以为用于自然语言理解和生成的统一预训练语言模型unilm。

5、可选地,在基于参考语句生成多个第一候选相似语句后,所述方法还包括:向所述用户展示所述多个第一候选相似语句。这样,用户可以浏览该多个第一候选相似语句,并对每个第一候选相似语句进行修改、确认或删除。

6、可选地,在对第一语句生成模型进行更新得到第二语句生成模型之后,所述方法还包括:基于所述参考语句和所述第二语句生成模型,生成多个第三候选相似语句;向所述用户展示所述多个第三候选相似语句。

7、在基于用户修改后的第一候选相似语句对第一语句生成模型进行优化后,利用优化后的语句生成模型生成的多个第三候选相似语句将更为准确。在此基础上,继续向用户展示多个第三候选相似语句,这样,用户可以继续对展示的候选相似语句进行修改,从而继续对语句生成模型进行优化。如此,一方面能够使得语句生成模型的生成结果越来越准确,同时,还可以获得更多的相似语句,实现对语料库的扩充。

8、可选地,所述修改操作包括下述的一种或多种:添加字符操作、删除字符操作、交换字符操作、替换字符操作、重写语句操作。其中,添加字符操作、删除字符操作、交换字符操作、替换字符操作可以用于在语句存在词法问题的情况下对语句中的词进行修改,重写语句操作可以用于在语句存在语义问题的情况下对语句进行重写。

9、可选地,所述利用所述至少一个第二候选相似语句对所述第一语句生成模型进行更新,得到第二语句生成模型的实现过程可以包括:获取所述至少一个第一候选相似语句中的每个第一候选相似语句与对应的修改后的第二候选相似语句之间的差异信息;基于所述差异信息,对所述第一语句生成模型进行参数更新,得到所述第二语句生成模型。

10、第二方面,提供了一种语句生成装置,所述语句生成装置用于实现第一方面所述的语句生成方法。其中,该语句生成装置可以包括至少一个模块。示例性地,该至少一个模块可以包括生成模块、修改模块和更新模块。

11、其中,生成模块,用于基于参考语句,通过第一语句生成模型生成多个第一候选相似语句;修改模块,用于基于用户针对至少一个第一候选相似语句的修改操作,生成至少一个第二候选相似语句,所述多个第一候选相似语句包括所述至少一个第一候选相似语句;更新模块,用于利用所述至少一个第二候选相似语句对所述第一语句生成模型进行更新,得到第二语句生成模型。

12、可选地,所述语句生成模型为人工智能模型。

13、可选地,所述装置还包括:展示模块。其中,所述展示模块,用于向所述用户展示所述多个第一候选相似语句;所述生成模块,还用于基于所述参考语句和所述第二语句生成模型,生成多个第三候选相似语句;所述展示模块,还用于向所述用户展示所述多个第三候选相似语句。

14、可选地,所述修改操作包括添加字符操作、删除字符操作、交换字符操作、替换字符操作、重写语句操作中的一种或多种。

15、可选地,所述更新模块主要用于:获取所述至少一个第一候选相似语句中的每个第一候选相似语句与对应的修改后的第二候选相似语句之间的差异信息;基于所述差异信息,对所述第一语句生成模型进行参数更新,得到所述第二语句生成模型。

16、第三方面,提供了一种计算机设备,所述计算机设备的结构中包括处理器和存储器,所述存储器用于存储支持计算机设备执行上述第一方面所提供的语句生成方法的至少一条程序指令或代码,以及存储用于实现上述第一方面所提供的语句生成方法所涉及的数据。所述处理器被配置为用于执行所述存储器中存储的程序指令或代码。

17、第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当该指令在计算机设备上运行时,使得计算机设备执行上述第一方面所述的语句生成方法。

18、第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的语句生成方法。

19、上述第二方面、第三方面、第四方面和第五方面所获得的技术效果与第一方面中对应的技术手段获得的技术效果近似,在这里不再赘述。

20、本申请实施例提供的技术方案至少具有如下有益效果:

21、在本申请实施例中,在通过第一语句生成模型生成参考语句的多个第一候选相似语句后,可以基于用户对至少一个第一候选相似语句的修改操作来获得至少一个第二候选相似语句,进而利用该至少一个第二候选相似语句来对第一语句生成模型进行更新。也即,本申请实施例可以通过用户修改后的候选相似语句来实时优化语句生成模型,在此基础上,基于优化后的语句生成模型和参考语句能够生成更多高质量的相似语句,从而实现对语料库的有效扩充。



技术特征:

1.一种语句生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述语句生成模型为人工智能模型。

3.根据权利要求1或2所述的方法,其特征在于,所述生成多个第一候选相似语句后,所述方法还包括:

4.根据权利要求1至3中任一所述的方法,其特征在于,所述修改操作包括下述的一种或多种:

5.根据权利要求1至4中任一所述的方法,其特征在于,所述利用所述至少一个第二候选相似语句对所述第一语句生成模型进行更新,得到第二语句生成模型,包括:

6.一种语句生成装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述语句生成模型为人工智能模型。

8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:

9.根据权利要求6至8中任一所述的装置,其特征在于,所述修改操作包括下述的一种或多种:

10.根据权利要求6至9中任一所述的装置,其特征在于,所述更新模块主要用于:

11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序指令或代码,所述至少一条程序指令或代码由所述处理器加载并执行,以使所述计算机设备实现权利要求1-5中任一所述的语句生成方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在计算机设备上运行时,使得计算机设备执行权利要求1-5任一项所述的语句生成方法。


技术总结
本申请实施例公开了一种语句生成方法、装置及存储介质,属于人工智能技术领域。在本申请实施例中,在通过第一语句生成模型生成参考语句的多个第一候选相似语句后,可以基于用户对至少一个第一候选相似语句的修改操作来获得至少一个第二候选相似语句,进而利用该至少一个第二候选相似语句来对第一语句生成模型进行更新。也即,本申请实施例可以通过用户修改后的候选相似语句来实时优化语句生成模型,在此基础上,基于优化后的语句生成模型和参考语句能够生成更多高质量的相似语句,从而实现对语料库的有效扩充。

技术研发人员:蒋炜,段新宇,王喆锋,怀宝兴
受保护的技术使用者:华为云计算技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1