本公开涉及人工智能领域,具体涉及自然语言处理、深度学习技术,尤其涉及一种图像生成方法、装置、电子设备和存储介质。
背景技术:
1、文生图任务指的是根据输入的一句话,生成一张图像。当用户需要生成一张内容复杂的图像时,往往需要在文本描述中有所侧重或者有所规避,例如,在“夕阳日落时,天边有巨大的云朵,海面波涛汹涌,一只鲸鱼跃出海面”这句文本描述中,用户希望突出“鲸鱼跃出海面”这部分;又如用户想生成“一只巨大的鲸鱼在天空中飞翔”时,不希望出现“海水”相关的画面。
2、但是,目前尚缺乏用于生成图像的有效手段,以满足用户对不同的描述内容进行加强或规避的需求。
技术实现思路
1、本公开提供了一种图像生成方法、装置、电子设备以及存储介质。
2、根据本公开的第一方面,提供了一种图像生成方法,包括:
3、获取至少一个文本描述信息以及每个所述文本描述信息的权重;
4、获取待处理的噪声图像;
5、根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重,对所述噪声图像进行去噪处理,生成与所述至少一个文本描述信息对应的目标图像。
6、根据本公开的第二方面,提供了一种图像生成装置,包括:
7、第一获取模块,用于获取至少一个文本描述信息以及每个所述文本描述信息的权重;
8、第二获取模块,用于获取待处理的噪声图像;
9、生成模块,用于根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重,对所述噪声图像进行去噪处理,生成与所述至少一个文本描述信息对应的目标图像。
10、根据本公开的第三方面,提供了一种电子设备,包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的方法。
14、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述第一方面所述的方法。
15、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现前述第一方面所述方法的步骤。
16、根据本公开的技术可以支持输入一个或多个文本描述并赋予不同的正向或负向权重,综合多个不同权重的文本描述生成图片,从而满足用户对不同的描述内容进行加强或规避的需求,从而可以提升图像内容生成效果。
17、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种图像生成方法,包括:
2.如权利要求1所述的方法,其中,所述根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重,对所述噪声图像进行去噪处理,生成与所述至少一个文本描述信息对应的目标图像,包括:
3.如权利要求2所述的方法,还包括:
4.如权利要求2或3所述的方法,其中,所述根据每个所述文本描述信息的第一预测图像、每个所述文本描述信息的权重和所述第二预测图像,得到新的噪声图像,包括:
5.如权利要求4所述的方法,其中,所述第一公式表示如下:
6.一种图像生成装置,包括:
7.如权利要求6所述的装置,其中,所述生成模块具体用于:
8.如权利要求7所述的装置,还包括:
9.如权利要求7或8所述的装置,其中,所述生成模块具体用于:
10.如权利要求9所述的装置,其中,所述第一公式表示如下:
11.一种电子设备,包括:
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1至5中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1至5中任一项所述方法的步骤。