技术特征:
1.一种目标内容的生成方法,包括:利用内容生成模型处理素材内容,得到多个目标内容分段;以及根据多个目标内容分段,生成针对所述素材内容的目标内容,其中,所述利用内容生成模型处理素材内容,得到多个目标内容分段包括多个处理阶段,所述多个处理阶段中的每个处理阶段包括:利用内容生成模型处理所述素材内容,得到候选内容分段和候选内容分段的原始概率分布;根据预定下游数据集和前面的处理阶段输出的目标内容分段,调整所述原始概率分布,得到调整概率分布;以及根据所述调整概率分布,从所述候选内容分段中确定该处理阶段输出的对应目标内容分段。2.根据权利要求1所述的方法,其中,所述根据所述调整概率分布,从所述候选内容分段中确定该处理阶段输出的对应目标内容分段包括:通过束搜索,从所述候选内容分段中确定对应目标内容分段,所确定的对应目标内容分段的数量等于束宽度。3.根据权利要求1所述的方法,其中,所述根据预定下游数据集和前面的处理阶段输出的目标内容分段,调整所述原始概率分布,得到调整概率分布包括:根据预定下游数据集和前面的处理阶段输出的目标内容分段,确定受限概率分布;以及利用受限概率分布调整所述候选内容分段的原始概率分布。4.根据权利要求3所述的方法,其中,所述根据预定下游数据集和前面的处理阶段输出的目标内容分段,确定受限概率分布包括:利用所述预定下游数据集构建字典树;以及根据字典树确定所述受限概率分布。5.根据权利要求4所述的方法,其中,所述根据字典树确定所述受限概率分布包括:通过在字典树中搜索前面的处理阶段输出的目标内容分段,确定所述受限概率分布。6.根据权利要求1至5中任一项所述的方法,其中,所述预定下游数据集包括所述素材内容。7.根据权利要求1至5中任一项所述的方法,其中,所述素材内容包括段落文本和问题,并且所述目标内容包括从所述段落文本得出的针对所述问题的答案。8.一种目标内容的生成装置,包括:处理模块,用于利用内容生成模型处理素材内容,得到多个目标内容分段;以及生成模块,用于根据多个目标内容分段,生成针对所述素材内容的目标内容,其中,所述处理模块包括多个处理子模块,每个处理子模块用于:利用内容生成模型处理所述素材内容,得到候选内容分段和候选内容分段的原始概率分布;根据预定下游数据集和前面的处理子模块输出的目标内容分段,调整所述原始概率分布,得到调整概率分布;以及
根据所述调整概率分布,从所述候选内容分段中确定该处理子模块输出的对应目标内容分段。9.根据权利要求8所述的装置,其中,每个处理子模块包括:第一确定单元,用于通过束搜索,从所述候选内容分段中确定对应目标内容分段,所确定的对应目标内容分段的数量等于束宽度。10.根据权利要求8所述的装置,其中,每个处理子模块包括:第二确定单元,用于根据预定下游数据集和前面的处理子模块输出的目标内容分段,确定受限概率分布;以及调整单元,用于利用受限概率分布调整所述候选内容分段的原始概率分布。11.根据权利要求10所述的装置,其中,所述第二确定单元包括:构建子单元,用于利用所述预定下游数据集构建字典树;以及确定子单元,用于根据字典树确定所述受限概率分布。12.根据权利要求11所述的装置,其中,所述确定子单元用于:通过在字典树中搜索前面的处理子模块输出的目标内容分段,确定所述受限概率分布。13.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1
‑
7中任一项所述的方法。14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1
‑
7中任一项所述的方法。15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1
‑
7中任一项所述的方法。
技术总结
本公开提供了一种目标内容的生成方法,具体涉及计算机技术领域,尤其涉及人工智能技术领域。具体实现方案包括:利用内容生成模型处理素材内容,得到多个目标内容分段;以及根据多个目标内容分段,生成针对素材内容的目标内容,其中,利用内容生成模型处理素材内容得到多个目标内容分段包括多个处理阶段,多个处理阶段中的每个处理阶段包括:利用内容生成模型处理素材内容,得到候选内容分段和候选内容分段的原始概率分布;根据预定下游数据集和前面的处理阶段输出的目标内容分段,调整原始概率分布,得到调整概率分布;以及根据调整概率分布,从候选内容分段中确定该处理阶段输出的对应目标内容分段。应目标内容分段。应目标内容分段。
技术研发人员:尚骏远 王硕寰 丁思宇
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.06.30
技术公布日:2021/9/7