技术编号:36910806
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请涉及多模态文本生成图像,具体涉及一种基于扩散模型的科技文献附图生成方法及系统。背景技术、近年来,随着科技的迅速发展,科学研究领域涌现出大量的科技论文和专利。然而,高效地检索、阅读分析和理解这些文献,以及准确地呈现研究成果,仍然是一个挑战。此外,在技术人员进行绘制科技附图时,也需要花费大量的时间进行图片绘制,此过程耗费了大量的时间。、现有的文本生成图像模型如扩散模型,可以实现从文本生成大致的图像,但是这些图像可能会丢失一些具体的部件,比如在生成机械图时,文本描述为“一个套着螺母的螺钉放置...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。