文本风格转换方法及装置与流程

文档序号:34228275发布日期:2023-05-24 10:53阅读:124来源:国知局
文本风格转换方法及装置与流程

本公开涉及语言处理,尤其涉及文本风格转换方法及装置。


背景技术:

1、现有的文本风格转换技术方案,主要是基于通用的模型进行文本转换。但是,目前在通过模型进行转换文本风格转换时,模型能够适用的语言场景较少,难以满足用户需求,并且在转换时可能将原文中的一些实体词转换掉,使得句子被过度改写,从而导致转换后和转换前相比出现较大的语义偏差。


技术实现思路

1、为了解决上述技术问题中的至少一个,本公开提供了文本风格转换方法及装置。

2、本公开第一方面提出了一种文本风格转换方法,包括:获取待转换文本;从所述待转换文本中识别出目标名词及其类型;对所述目标名词进行标记;将标记后的待转换文本输入训练好的文本风格转换模型,得到转换后的文本;其中,所述文本风格转换模型在对标记后的待转换文本进行处理时,对标记的内容进行识别,并保持识别出的所述标记的内容不变。

3、根据本公开的一个实施方式,所述目标名词的类型包括产品名称、组织名称、地名、人名中的一项或多项。

4、根据本公开的一个实施方式,对所述目标名词进行标记,包括:在所述目标名词的前端和后端插入预设的标识符,其中,所述标识符之间的内容为被标记的内容。

5、根据本公开的一个实施方式,在对所述目标名词进行标记时,不同类型的目标名词采用不同的标识符进行标记。

6、根据本公开的一个实施方式,所述文本风格转换模型被配置为输出的文本中不包含所述标识符。

7、根据本公开的一个实施方式,所述文本风格转换模型采用经过微调后的bart模型。

8、根据本公开的一个实施方式,在将标记后的待转换文本输入训练好的文本风格转换模型之前,所述方法还包括:依据目标转换风格选取相应的文本风格转换模型。

9、根据本公开的一个实施方式,所述目标转换风格为:小说风格、影视风格或写作风格。

10、根据本公开的一个实施方式,在得到转换后的文本之后,所述方法还包括:获取对所述转换后的文本的语法评估结果;在所述语法评估结果表征所述转换后的文本存在语法错误时,依据所述语法评估结果从所述待转换文本中确定出原始名词;将所述原始名词作为新的目标名词添加到目标名词表中。

11、本公开第二方面提出了一种文本风格转换装置,包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行任一实施方式所述的文本风格转换方法。



技术特征:

1.一种文本风格转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标名词的类型包括产品名称、组织名称、地名、人名中的一项或多项。

3.根据权利要求1或2所述的方法,其特征在于,对所述目标名词进行标记,包括:

4.根据权利要求3所述的方法,其特征在于,在对所述目标名词进行标记时,不同类型的目标名词采用不同的标识符进行标记。

5.根据权利要求3所述的方法,其特征在于,所述文本风格转换模型被配置为输出的文本中不包含所述标识符。

6.根据权利要求1或5所述的方法,其特征在于,所述文本风格转换模型采用经过微调后的bart模型。

7.根据权利要求1所述的方法,其特征在于,在将标记后的待转换文本输入训练好的文本风格转换模型之前,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述目标转换风格为:小说风格、影视风格或写作风格。

9.根据权利要求1所述的方法,其特征在于,在得到转换后的文本之后,所述方法还包括:

10.一种文本风格转换装置,其特征在于,包括:


技术总结
本公开提供了一种文本风格转换方法及装置,该方法首先获取待转换文本,从待转换文本中识别出目标名词及其类型,然后对目标名词进行标记,将标记后的待转换文本输入训练好的文本风格转换模型,得到转换后的文本,其中,文本风格转换模型在对标记后的待转换文本进行处理时,对标记的内容进行识别,并保持识别出的标记的内容不变,使得目标名词在模型进行风格转换的过程以及输出的转换后文本中保持不变,避免了文本在风格转换时被过度改写,实现了文本可控,转换后的文本与转换前的文本相比,既实现了风格转换,又避免了语义偏差,提高了文本润色效果。

技术研发人员:丁辉,丁叙
受保护的技术使用者:上海墨百意信息科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1