本公开涉及语言处理,尤其涉及文本风格转换方法及装置。
背景技术:
1、现有的文本风格转换技术方案,主要是基于通用的模型进行文本转换。但是,目前在通过模型进行转换文本风格转换时,模型能够适用的语言场景较少,难以满足用户需求,并且在转换时可能将原文中的一些实体词转换掉,使得句子被过度改写,从而导致转换后和转换前相比出现较大的语义偏差。
技术实现思路
1、为了解决上述技术问题中的至少一个,本公开提供了文本风格转换方法及装置。
2、本公开第一方面提出了一种文本风格转换方法,包括:获取待转换文本;从所述待转换文本中识别出目标名词及其类型;对所述目标名词进行标记;将标记后的待转换文本输入训练好的文本风格转换模型,得到转换后的文本;其中,所述文本风格转换模型在对标记后的待转换文本进行处理时,对标记的内容进行识别,并保持识别出的所述标记的内容不变。
3、根据本公开的一个实施方式,所述目标名词的类型包括产品名称、组织名称、地名、人名中的一项或多项。
4、根据本公开的一个实施方式,对所述目标名词进行标记,包括:在所述目标名词的前端和后端插入预设的标识符,其中,所述标识符之间的内容为被标记的内容。
5、根据本公开的一个实施方式,在对所述目标名词进行标记时,不同类型的目标名词采用不同的标识符进行标记。
6、根据本公开的一个实施方式,所述文本风格转换模型被配置为输出的文本中不包含所述标识符。
7、根据本公开的一个实施方式,所述文本风格转换模型采用经过微调后的bart模型。
8、根据本公开的一个实施方式,在将标记后的待转换文本输入训练好的文本风格转换模型之前,所述方法还包括:依据目标转换风格选取相应的文本风格转换模型。
9、根据本公开的一个实施方式,所述目标转换风格为:小说风格、影视风格或写作风格。
10、根据本公开的一个实施方式,在得到转换后的文本之后,所述方法还包括:获取对所述转换后的文本的语法评估结果;在所述语法评估结果表征所述转换后的文本存在语法错误时,依据所述语法评估结果从所述待转换文本中确定出原始名词;将所述原始名词作为新的目标名词添加到目标名词表中。
11、本公开第二方面提出了一种文本风格转换装置,包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行任一实施方式所述的文本风格转换方法。
1.一种文本风格转换方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标名词的类型包括产品名称、组织名称、地名、人名中的一项或多项。
3.根据权利要求1或2所述的方法,其特征在于,对所述目标名词进行标记,包括:
4.根据权利要求3所述的方法,其特征在于,在对所述目标名词进行标记时,不同类型的目标名词采用不同的标识符进行标记。
5.根据权利要求3所述的方法,其特征在于,所述文本风格转换模型被配置为输出的文本中不包含所述标识符。
6.根据权利要求1或5所述的方法,其特征在于,所述文本风格转换模型采用经过微调后的bart模型。
7.根据权利要求1所述的方法,其特征在于,在将标记后的待转换文本输入训练好的文本风格转换模型之前,所述方法还包括:
8.根据权利要求7所述的方法,其特征在于,所述目标转换风格为:小说风格、影视风格或写作风格。
9.根据权利要求1所述的方法,其特征在于,在得到转换后的文本之后,所述方法还包括:
10.一种文本风格转换装置,其特征在于,包括: