图像生成方法及其装置与流程

文档序号：34453260发布日期：2023-06-13 19:40阅读：51来源：国知局

本公开涉及人工智能领域，具体涉及自然语言处理、深度学习技术，尤其涉及一种图像生成方法、装置、电子设备和存储介质。

背景技术：

1、文生图任务指的是根据输入的一句话，生成一张图像。当用户需要生成一张内容复杂的图像时，往往需要在文本描述中有所侧重或者有所规避，例如，在“夕阳日落时，天边有巨大的云朵，海面波涛汹涌，一只鲸鱼跃出海面”这句文本描述中，用户希望突出“鲸鱼跃出海面”这部分；又如用户想生成“一只巨大的鲸鱼在天空中飞翔”时，不希望出现“海水”相关的画面。

2、但是，目前尚缺乏用于生成图像的有效手段，以满足用户对不同的描述内容进行加强或规避的需求。

技术实现思路

1、本公开提供了一种图像生成方法、装置、电子设备以及存储介质。

2、根据本公开的第一方面，提供了一种图像生成方法，包括：

3、获取至少一个文本描述信息以及每个所述文本描述信息的权重；

4、获取待处理的噪声图像；

5、根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重，对所述噪声图像进行去噪处理，生成与所述至少一个文本描述信息对应的目标图像。

6、根据本公开的第二方面，提供了一种图像生成装置，包括：

7、第一获取模块，用于获取至少一个文本描述信息以及每个所述文本描述信息的权重；

8、第二获取模块，用于获取待处理的噪声图像；

9、生成模块，用于根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重，对所述噪声图像进行去噪处理，生成与所述至少一个文本描述信息对应的目标图像。

10、根据本公开的第三方面，提供了一种电子设备，包括：

11、至少一个处理器；以及

12、与所述至少一个处理器通信连接的存储器；其中，

13、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面所述的方法。

14、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行前述第一方面所述的方法。

15、根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现前述第一方面所述方法的步骤。

16、根据本公开的技术可以支持输入一个或多个文本描述并赋予不同的正向或负向权重，综合多个不同权重的文本描述生成图片，从而满足用户对不同的描述内容进行加强或规避的需求，从而可以提升图像内容生成效果。

17、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种图像生成方法，包括：

2.如权利要求1所述的方法，其中，所述根据所述噪声图像、所述至少一个文本描述信息以及每个所述文本描述信息的权重，对所述噪声图像进行去噪处理，生成与所述至少一个文本描述信息对应的目标图像，包括：

3.如权利要求2所述的方法，还包括：

4.如权利要求2或3所述的方法，其中，所述根据每个所述文本描述信息的第一预测图像、每个所述文本描述信息的权重和所述第二预测图像，得到新的噪声图像，包括：

5.如权利要求4所述的方法，其中，所述第一公式表示如下：

6.一种图像生成装置，包括：

7.如权利要求6所述的装置，其中，所述生成模块具体用于：

8.如权利要求7所述的装置，还包括：

9.如权利要求7或8所述的装置，其中，所述生成模块具体用于：

10.如权利要求9所述的装置，其中，所述第一公式表示如下：

11.一种电子设备，包括：

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1至5中任一项所述的方法。

13.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1至5中任一项所述方法的步骤。

技术总结
本公开提供了一种图像生成方法及其装置，涉及人工智能领域，具体涉及自然语言处理及深度学习技术。具体实现方案为：获取至少一个文本描述信息以及每个文本描述信息的权重；获取待处理的噪声图像；根据噪声图像、至少一个文本描述信息以及每个文本描述信息的权重，对噪声图像进行去噪处理，生成与至少一个文本描述信息对应的目标图像。本公开支持输入一个或多个文本描述并赋予不同权重，综合多个不同权重的文本描述生成图像，从而满足用户对不同的描述内容进行加强或规避的需求，从而可以提升图像内容生成效果。

技术研发人员：余欣彤,刘佳祥,冯仕堃
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：余欣彤刘佳祥冯仕堃
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种车载显示屏控制方法、装置、车辆及存储介质与流程
上一篇：精异丙甲草胺连续化不对称制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。