所属的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。图10是本发明实施例中的一种改变目标前景光照条件的设备的结构示意图。下面参照图10来描述根据本发明的这种实施方式的电子设备600。图10显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图10所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述一种改变目标前景光照条件的方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图10中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储平台等。本发明实施例中还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的一种改变目标前景光照条件的方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述一种改变目标前景光照条件的方法部分中描述的根据本发明各种示例性实施方式的步骤。如上所示,本实施例利用rgbd图像获得目标前景,进而重建出三维点云和mesh模型,通过不同光照强度的光源模拟背景的光照条件,对目标前景的mesh模型进行照射,再投影到二维平面中,具有计算量小、实时计算、准确性高、稳定性强的特点。图11是本发明实施例中的计算机可读存储介质的结构示意图。参考图11所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。本实施例利用rgbd图像获得目标前景,进而重建出三维点云和mesh模型,通过不同光照强度的光源模拟背景的光照条件,对目标前景的mesh模型进行照射,再投影到二维平面中,具有计算量小、实时计算、准确性高、稳定性强的特点。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
背景技术:
1、近年来,随着互联网、物流、电商的快速发展,短视频制作,直播带货,娱乐直播逐渐成为人们生活的日常,不少主播都会选择绿幕替换背景来提高直播效果。替换背景方法背后用到的是抠图技术,将一张图片中感兴趣的目标前景提取出来并合成到新的背景图中去,有别于图像分割技术的是,抠图能够让合成的边缘更加自然。抠图可以进一步分类为语义抠图和trimap抠图,语义抠图是根据图像中语义来选择抠图对象,而trimap抠图是利用额外的trimap输入来选择抠图对象。利用深度来生成得到trimap的rgbd抠图,是理想的trimap抠图技术之一。抠图能够实现任意背景替换,但是,直接替换背景会带来新的问题,即前景光照条件与新背景的光照条件并不一致,从而导致不和谐的合成画面,影响用户的视觉体验。
2、目前不少学者和研究人员都对抠图带来的前后背景不和谐问题进行了研究,提出了重打光技术,也就是基于背景的光照条件来修正前景的光照条件。有学者利用神经网络和rgb抠图对人像实现了重打光,该方法只能针对人像进行重打光,且基于神经网络的方法存在计算量大,无法实时,效果不稳定的问题。该问题的难点在于,抠图范围的不准确导致打光范围的不准确,只基于rgb的三维重建技术存在较大的误差,从而影响最终的视觉效果。
3、以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本技术的新颖性和创造性。
技术实现思路
1、为此,本发明利用rgbd图像获得目标前景,进而重建出三维点云和mesh模型,通过不同光照强度的光源模拟背景的光照条件,对目标前景的mesh模型进行照射,再投影到二维平面中,具有计算量小、实时计算、准确性高、稳定性强的特点。
2、第一方面,本发明提供一种改变目标前景光照条件的方法,其特征在于,包括如下步骤:
3、步骤s1:获取rgbd图像中的目标前景及替换背景;
4、步骤s2:利用一一对应的rgb颜色信息和深度信息,重建出所述目标前景的三维点云,并建立所述目标前景的mesh模型;
5、步骤s3:采用n个具有不同光照强度的光源在预设位置对所述mesh模型进行照射;其中,所述光源是所述替换背景的光源或等同光源;
6、步骤s4:将所述mesh模型投影到二维平面中,并与所述替换背景合成,得到替换图像。
7、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,步骤s1包括:
8、步骤s11:获取第一rgb图像、第一深度图像和替换背景;
9、步骤s12:在所述第一深度图像上,利用预设距离参数,得到第一目标范围;
10、步骤s13:基于unet网络结构与不同维度特征的skip-connection,结合所述第一rgb图像和所述第一深度图像的时序特征,对第一目标范围进行识别,得到第二目标范围;
11、步骤s14:采用所述预设距离参数对所述第二目标范围进行调整,得到第三目标范围。
12、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,步骤s2包括:
13、步骤s21:利用一一对应的rgb颜色信息和深度信息,重建出所述目标前景的三维点云;
14、步骤s22:对所述三维点云进行滤波处理,并计算出所述三维点云的反射率;
15、步骤s23:利用表面重建技术获得所述目标前景的mesh模型。
16、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,步骤s3包括:
17、步骤s31:确定所述目标前景及所述替换背景的位置关系;
18、步骤s32:获取所述替换背景的光照条件;
19、步骤s33:根据转换函数,采用n个具有不同光照强度的光源在预设位置模拟所述替换背景的光照条件;
20、步骤s34:采用n个所述光源同时对所述mesh模型进行照射。
21、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,所述光源是点光源、面光源、线光源中的至少一类。
22、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,所述步骤s31包括:
23、步骤s311:获得所述替换背景的三维信息;
24、步骤s312:调整所述替换背景与所述目标前景的距离,以使所述替换背景与所述目标前景比例一致。
25、可选地,所述的一种改变目标前景光照条件的方法,其特征在于,还包括:
26、步骤s313:调整所述替换背景的位置,以使所述替换背景在光照方向对所述目标前景不产生遮挡。
27、第二方面,本发明提供一种改变目标前景光照条件的系统,用于实现上述任一项所述的改变目标前景光照条件的方法,其特征在于,包括:
28、获取模块,用于获取rgbd图像中的目标前景及替换背景;
29、三维重建模块,用于利用一一对应的rgb颜色信息和深度信息,重建出所述目标前景的三维点云,并建立所述目标前景的mesh模型;
30、光照模块,用于采用n个具有不同光照强度的光源在预设位置对所述mesh模型进行照射;其中,所述光源是所述替换背景的光源或等同光源;
31、合成模块,用于将所述mesh模型投影到二维平面中,并与所述替换背景合成,得到替换图像。
32、第三方面,本发明提供一种改变目标前景光照条件的设备,其特征在于,包括:
33、处理器;
34、存储器,其中存储有所述处理器的可执行指令;
35、其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述改变目标前景光照条件的方法的步骤。
36、第四方面,本发明提供一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现前述任意一项所述改变目标前景光照条件的方法的步骤。
37、与现有技术相比,本发明具有如下的有益效果:
38、本发明尝试利用范围更加准确的rgbd抠图技术来实现更真实更准确的重打光,深度信息能够让抠图的目标和范围有了更明确的定义,从而能够获得更稳定的抠图内容。在深度信息的加持下,能够将rgbd抠图得到的目标前景精确地重建在三维空间中,为后续的重打光提供更好的三维模型。
39、本发明在三维空间中利用多个不同光照强度的光源对目标前景的mesh模型进行照射,可以获得更加真实的照射结果,同时具有计算量小、运算速度快的特点。