一种文本生成的方法、装置、存储介质及电子设备与流程

文档序号:35137965发布日期:2023-08-16 23:33阅读:16来源:国知局
一种文本生成的方法、装置、存储介质及电子设备与流程

本说明书涉及计算机,尤其涉及一种文本生成的方法、装置、存储介质及电子设备。


背景技术:

1、随着互联网技术的快速发展,文本生成广泛应用于多种业务领域。现有技术常通过文本生成模型来生成文本内容,大致过程为:将输入数据输入文本生成模型后,基于输入数据,文本生成模型会输出与输入数据相关联的文本内容。

2、在风险识别领域中,可以将业务数据输入到文本生成模型中,文本生成模型会根据该业务数据,进行风险识别,并生成用于描述该业务数据所表征的业务风险的文本,以供风控人员进行参考。

3、然而,目前生成的文本内容在语义表达上也缺乏逻辑、并且得到的风险识别结果也不够准确,因此,如何生成逻辑表达清晰且准确的文本内容,则是个亟待解决的问题。


技术实现思路

1、本说明书提供一种文本生成的方法、装置、存储介质及电子设备,以解决现有技术存在的在无法生成逻辑表达清晰且准确的文本内容的问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种文本生成的方法,所述方法包括:

4、获取业务数据;

5、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述业务数据进行统计,得到各统计结果,并对所述各统计结果进行编码,得到每个统计结果对应的编码特征,以及通过所述文本生成模型,确定所述业务数据对应的基础特征;

6、通过所述文本生成模型,基于所述基础特征以及每个统计结果对应的编码特征,确定针对所述业务数据的风险识别结果;

7、根据所述风险识别结果、所述基础特征以及每个统计结果对应的编码特征,通过所述文本生成模型生成用于描述所述业务数据所表征出的业务风险的描述文本。

8、可选地,将所述业务数据表输入到预设的文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述业务数据表中的数据进行统计,得到各统计结果,具体包括:

9、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型针对每种统计方式,根据该统计方式,对所述业务数据进行统计,得到待处理统计结果,确定在该统计方式下所述待处理统计结果中每个数值所对应的标识字符,并根据所述标识字符,确定该统计方式所对应的统计结果。

10、可选地,所述统计方式包括:第一统计方式,所述第一统计方式用于统计所述业务数据中所包含的各数据在各自所在的数据类别下所出现的次数;

11、将所述业务数据表输入到预设的文本生成模型中,以使所述文本生成模型针对每种统计方式,根据该统计方式,对所述业务数据进行统计,得到待处理统计结果,确定在该统计方式下所述待处理统计结果中每个数值所对应的标识字符,并根据所述标识字符,确定该统计方式所对应的统计结果,具体包括:

12、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第一统计方式时,分别确定所述业务数据中所包含的各数据在各自所在的数据类别下所出现的次数,根据所述次数的数值在所述第一统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第一统计方式所对应的统计结果。

13、可选地,所述统计方式包括:第二统计方式,所述第二统计方式用于确定所述业务数据中每种数据类别下的数据所采用的数据形式;

14、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型针对每种统计方式,根据该统计方式,对所述业务数据进行统计,得到待处理统计结果,确定在该统计方式下所述待处理统计结果中每个数值所对应的标识字符,并根据所述标识字符,确定该统计方式所对应的统计结果,具体包括:

15、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第二统计方式时,分别确定所述业务数据中每种数据类别下的数据所采用的数据形式,根据不同的数据形式在所述第二统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第二统计方式所对应的统计结果。

16、可选地,所述统计方式包括:第三统计方式,所述第三统计方式用于按照预设的排列顺序将所述业务数据中所包含的各数据在各自所在的数据类别中进行排序;

17、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型针对每种统计方式,根据该统计方式,对所述业务数据进行统计,得到待处理统计结果,确定在该统计方式下所述待处理统计结果中每个数值所对应的标识字符,并根据所述标识字符,确定该统计方式所对应的统计结果,具体包括:

18、将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第三统计方式时,按照预设的排列顺序将所述业务数据中所包含的各数据在各自所在的数据类别中进行排序,根据不同的排序位置在所述第三统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第三统计方式所对应的统计结果。

19、可选地,根据所述风险识别结果、所述基础特征以及每个统计结果对应的编码特征,生成用于描述所述业务数据所表征出的业务风险的描述文本,具体包括:

20、根据所述基础特征,确定各编码特征对应的权重;

21、根据所述风险识别结果、所述权重以及所述各编码特征,生成各分词;

22、根据生成的各分词,生成所述描述文本。

23、可选地,根据所述风险识别结果、所述权重以及所述各编码特征,生成各分词,具体包括:

24、根据每个统计结果对应的编码特征以及各编码特征对应的权重,确定加权向量;

25、通过所述文本生成模型,基于所述加权向量,得到预测词向量,并根据预设词典中所记录的各分词与各词向量之间的对应关系,确定所述预测词向量对应的分词;

26、将所述预测词向量对应的分词重新输入到所述文本生成模型中,生成下一分词,并将生成的下一分词再输入到所述文本生成模型中,直到确定出所有分词为止。

27、可选地,训练所述文本生成模型,具体包括:

28、获取样本业务数据以及预设的用于描述所述样本业务数据所表征的业务风险的标准文本;

29、将所述样本业务数据输入到所述文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述样本业务数据进行统计,得到所述样本业务数据对应的各统计结果,并对所述样本业务数据对应的各统计结果进行编码,得到所述样本业务数据对应的每个统计结果的编码特征,以及通过所述文本生成模型,确定所述样本业务数据对应的基础特征;

30、通过所述文本生成模型,基于所述样本业务数据对应的基础特征以及所述样本业务数据对应的每个统计结果的编码特征,确定针对所述样本业务数据的风险识别结果;

31、根据针对所述样本业务数据的风险识别结果、所述样本业务数据对应的基础特征以及所述样本业务数据对应的每个统计结果的编码特征,通过所述文本生成模型生成用于描述所述样本业务数据所表征出的业务风险的描述文本,作为所述样本业务数据对应的描述文本;

32、以最小化所述样本业务数据对应的描述文本与所述标准文本之间的差异为优化目标,对所述文本生成模型进行训练。

33、本说明书提供了一种文本生成的装置,所述装置包括:

34、获取模块,用于获取业务数据;

35、输入模块,用于将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述业务数据进行统计,得到各统计结果,并对所述各统计结果进行编码,得到每个统计结果对应的编码特征,以及通过所述文本生成模型,确定所述业务数据对应的基础特征;

36、确定模块,用于通过所述文本生成模型,基于所述基础特征以及每个统计结果对应的编码特征,确定针对所述业务数据的风险识别结果;

37、生成模块,用于根据所述风险识别结果、所述基础特征以及每个统计结果对应的编码特征,通过所述文本生成模型生成用于描述所述业务数据所表征出的业务风险的描述文本。

38、可选地,输入模块具体用于,将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型针对每种统计方式,根据该统计方式,对所述业务数据进行统计,得到待处理统计结果,确定在该统计方式下所述待处理统计结果中每个数值所对应的标识字符,并根据所述标识字符,确定该统计方式所对应的统计结果。

39、可选地,所述统计方式包括:第一统计方式,所述第一统计方式用于统计所述业务数据中所包含的各数据在各自所在的数据类别下所出现的次数;

40、所述第一输入模块具体用于,将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第一统计方式时,分别确定所述业务数据中所包含的各数据在各自所在的数据类别下所出现的次数,根据所述次数的数值在所述第一统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第一统计方式所对应的统计结果。

41、可选地,所述统计方式包括:第二统计方式,所述第二统计方式用于确定所述业务数据中每种数据类别下的数据所采用的数据形式;

42、所述输入模块具体用于,将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第二统计方式时,分别确定所述业务数据中每种数据类别下的数据所采用的数据形式,根据不同的数据形式在所述第二统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第二统计方式所对应的统计结果。

43、可选地,所述统计方式包括:第三统计方式,所述第三统计方式用于按照预设的排列顺序将所述业务数据中所包含的各数据在各自所在的数据类别中进行排序;

44、所述输入模块具体用于,将所述业务数据输入到预设的文本生成模型中,以使所述文本生成模型采用所述第三统计方式时,按照预设的排列顺序将所述业务数据中所包含的各数据在各自所在的数据类别中进行排序,根据不同的排序位置在所述第三统计方式下所对应的标识字符,确定每种数据类别下的各数据所对应的标识字符,根据每种数据类别下的各数据所对应的标识字符,确定所述第三统计方式所对应的统计结果。

45、可选地,所述生成模块具体用于,根据所述基础特征,确定各编码特征对应的权重;根据所述风险识别结果、所述权重以及所述各编码特征,生成各分词;根据生成的各分词,生成所述描述文本。

46、可选地,所述生成模块具体用于,根据每个统计结果对应的编码特征以及各编码特征对应的权重,确定加权向量;通过所述文本生成模型,基于所述加权向量,得到预测词向量,并根据预设词典中所记录的各分词与各词向量之间的对应关系,确定所述预测词向量对应的分词;将所述预测词向量对应的分词重新输入到所述文本生成模型中,生成下一分词,并将生成的下一分词再输入到所述文本生成模型中,直到确定出所有分词为止。

47、可选地,所述装置还包括:

48、训练模块,用于训练所述文本生成模型,其中:

49、所述训练模块具体用于,获取样本业务数据以及预设的用于描述所述样本业务数据所表征的业务风险的标准文本;将所述样本业务数据输入到所述文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述样本业务数据进行统计,得到所述样本业务数据对应的各统计结果,并对所述样本业务数据对应的各统计结果进行编码,得到所述样本业务数据对应的每个统计结果的编码特征,以及通过所述文本生成模型,确定所述样本业务数据对应的基础特征;通过所述文本生成模型,基于所述样本业务数据对应的基础特征以及所述样本业务数据对应的每个统计结果的编码特征,确定针对所述样本业务数据的风险识别结果;根据针对所述样本业务数据的风险识别结果、所述样本业务数据对应的基础特征以及所述样本业务数据对应的每个统计结果的编码特征,通过所述文本生成模型生成用于描述所述样本业务数据所表征出的业务风险的描述文本,作为所述样本业务数据对应的描述文本;以最小化所述样本业务数据对应的描述文本与所述标准文本之间的差异为优化目标,对所述文本生成模型进行训练。

50、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文本生成的方法。

51、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述文本生成的方法。

52、本说明书采用的上述至少一个技术方案能够达到以下有益效果:

53、在本说明书提供的文本生成的方法,将业务数据输入到预设的文本生成模型中,以使所述文本生成模型按照不同的统计方式对所述业务数据进行统计,得到各统计结果,并对所述各统计结果进行编码,得到每个统计结果对应的编码特征;通过文本生成模型,基于得到的基础特征以及每个统计结果对应的编码特征,确定针对业务数据的风险识别结果,并根据该风险识别结果、基础特征以及每个统计结果对应的编码特征,通过文本生成模型生成用于描述业务数据所表征出的业务风险的描述文本。

54、从上述方法中可以看出,文本生成模型采用不同的统计方式对业务数据进行统计,不同统计方式下得到的各统计结果,能反应出业务数据中所包含的各数据相关联的一些特性。所以,文本生成模型可以通过不同的统计方式,挖掘出各数据之间可能隐含的逻辑关系,再对得到各统计结果进行编码,确定每个统计结果对应的编码特征,这样有助于后续文本生成模型生成逻辑表达清晰且准确的描述文本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1