本发明涉及智能交通领域,具体而言,涉及一种道路数据生成方法、装置、电子设备及存储介质。
背景技术:
随着科技的不断发展,智能交通技术也在不断的创新,完善道路交通感知系统有助于推动城市交通更加的智能化和信息化,并能够加快交通运输业向安全、高效、智能的方向综合发展。
现有的道路感知模型一般采用基于深度学习的语义分割方法,该方法为了能在不同的场景下,比如强光场景、夜间场景、雨天场景等都有比较好的分割效果,需要大量的场景图片数据进行训练。但是,大量的道路场景图片获取困难,而且获得的道路图像需要额外进行交通线标签标注,时间成本和人力成本大,降低了获得道路数据的效率。
技术实现要素:
有鉴于此,本发明的目的在于提供一种道路数据生成方法、装置、电子设备及存储介质,用于解决获得特定场景的道路图像及其对应交通线标签时的时间成本和人力成本大的问题,提高获得道路数据的效率。为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供一种道路数据生成方法,包括:
构建包括生成模型和判别模型的生成对抗网络;
获取第一自定义数据、多类场景下的多张真实道路图像和所述真实道路图像对应的分割标签图像、所述多类场景对应的场景控制参数作为训练样本,对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型;所述场景控制参数表征场景类别;
基于所述最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成所述待生成道路图像和所述待生成道路图像对应的分割标签图像;所述第一自定义数据和所述第二自定义数据具有相同的分布规律。
可选地,所述获取第一自定义数据、多类场景下的多张真实道路图像和所述真实道路图像对应的分割标签图像、所述多类场景对应的场景控制参数作为训练样本,对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型的步骤,包括:将所述第一自定义数据和所述场景控制参数输入到所述生成模型获得仿真道路图像和所述仿真道路图像对应的分割标签图像;将所述仿真道路图像和所述仿真道路图像对应的分割标签图像、真实道路图像和所述真实道路图像对应的分割标签图像输入所述判别模型,获得所述判别模型的输出概率值;利用所述判别模型的输出概率值对所述判别模型进行反向调节,得到最优判别模型;固定所述最优判别模型的参数,基于所述第一自定义数据、场景控制参数、生成模型和最优判别模型,得到所述最优判别模型的输出概率值;利用所述最优判别模型的输出概率值对所述生成模型进行反向调节,得到最优生成模型。
可选地,所述构建包括生成模型和判别模型的生成对抗网络的步骤之前,所述方法还包括:获取所述多类场景下的多张真实道路图像;根据预设的编码方式确定每一类场景对应的场景控制参数;将每张所述道路图片中的交通线类别对应的像素值进行标记,获得每张所述道路图对应的分割标签图像。
可选地,所述生成模型和所述判别模型包括特征提取网络;所述特征提取网络包含包括至少一层卷积层;所述生成模型和所述判别模型具有第一分辨率;所述方法还包括:增加所述特征提取网络的卷积层数,以使所述最优生成模型和所述最优判别模型具有第二分辨率;所述第二分辨率大于所述第一分辨率;通过所述最优生成模型生成具有所述第二分辨率的仿真道路图像和所述仿真道路图像对应的分割标签图像。
可选地,所述方法还包括:通过所述特征提取网络提取所述仿真道路图像和所述仿真道路图像对应的分割标签图像的具有第一分辨率的特征图和具有第二分辨率的特征图;根据预设的权重对所述具有第一分辨率的特征图和所述具有第二分辨率的特征图进行卷积计算,获得所述第二分辨率的仿真道路图像和所述仿真道路图像对应的分割标签图像。
第二方面,本发明实施例提供一种道路数据生成装置,包括:构建模块、训练模块和生成模块;构建模块,用于构建包括生成模型和判别模型的生成对抗网络;所述构建模块,用于构建包括生成模型和判别模型的生成对抗网络;所述训练模块,用获取第一自定义数据、多类场景下的多张真实道路图像和所述真实道路图像对应的分割标签图像、所述多类场景对应的场景控制参数作为训练样本,对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型;所述场景控制参数表征场景类别;所述生成模块,基于所述最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成所述待生成道路图像和所述待生成道路图像对应的分割标签图像;所述第一自定义数据和所述第二自定义数据具有相同的分布规律。
可选地,所述训练模块具体用于:将所述第一自定义数据和所述场景控制参数输入到所述生成模型获得仿真道路图像和所述仿真道路图像对应的分割标签图像;将所述仿真道路图像和所述仿真道路图像对应的分割标签图像、真实道路图像和所述真实道路图像对应的分割标签图像输入所述判别模型,获得所述判别模型的输出概率值;利用所述判别模型的输出概率值对所述判别模型进行反向调节,得到最优判别模型;固定所述最优判别模型的参数,基于所述第一自定义数据、场景控制参数、生成模型和最优判别模型,得到所述最优判别模型的输出概率值;利用所述最优判别模型的输出概率值对所述生成模型进行反向调节,得到最优生成模型。
可选地,所述道路数据生成装置还包括:获取模块和确定模块和标记模块;所述获取模块,用于获取所述多类场景下的真实道路图像;所述确定模块,用于根据预设的编码方式确定每一类场景对应的场景控制参数;所述标记模块,用于将每张所述道路图片中的交通线类别对应的像素值进行标记,获得每张所述道路图对应的分割标签图像;所述确定模块,用于将所述多张道路图像和每张所述道路图对应的分割标签图像确定为所述真实图像集。
第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现如第一方面所述的道路数据生成方法。
第四方面,本发明实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的道路数据生成方法。
相比于现有技术,本发明提供的一种道路数据生成方法、装置、电子设备及存储介质,该方法包括:构建包括生成模型和判别模型的生成对抗网络;获取第一自定义数据、多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数作为训练样本,对生成对抗网络进行训练,以基于生成模型得到最优生成模型;场景控制参数表征场景类别;基于最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成待生成道路图像和待生成道路图像对应的分割标签图像;第一自定义数据和第二自定义数据具有相同的分布规律。本发明通过真实带有标签的道路图像和道路场景对应场景的场景控制参数训练生成对抗网络,获得最优的生成模型,通过最优的生成模型和指定的场景控制参数能够生成大量指定场景的道路图像,在生成道路图像的同时,能够得到道路图像对应的分割标签图像,解决了获得特定场景的道路图像及其对应交通线标签时的时间成本和人力成本大的问题,提高获得道路数据的效率本发明实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种道路数据生成方法的示意性流程图;
图2为本发明实施例提供的一种生成对抗网络训练过程示意图;
图3为本发明实施例提供的另一种道路数据生成方法的示意性流程图;
图4为本发明实施例提供的另一种生成对抗网络训练过程示意图;
图5本发明实施例提供的另一种生成对抗网络训练过程示意图;
图6本发明实施例提供的一种道路数据生成装置的功能模块图;
图7本发明实施例提供的一种电子设备的方框示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,道路感知模型是智能交通的基础,通过道路感知可以获得车道线、导向线以及斑马线等交通线信息,从而有效识别、车辆压线、不按导向线行驶、逆行等交通事件。现实情况中,不同场景的道路信息对道路感知的效果有不同的影响,例如,强光场景、夜间场景、白天场景和雨天场景,单一场景数据训练的道路感知模型无法适应各个场景下的道路识别,所以需要通过大量的场景数据训练感知模型适应不同的场景,因此可以通过生成大量的场景数据来训练道路感知模型,以提高道路感知模型的识别效果。现有的方法中,无法生成指定场景的道路图像以及对应的分割标签,这样一来训练出来的道路感知模型就无法在实际场景中进行准确识别。
为了解决上述技术问题,本发明提供一种道路数据生成方法,引入“场景控制参数”来生成指定场景的道路图像,其中“场景控制参数”表征场景类别,并结合生成对抗网络获得道路数据生成模型,通过一个模型就可以生成指定场景的道路图像,同时,通过将采集的图像进行标签标注获得分割标签图像,并利用采集的真实场景图和对应的分割标签图像、场景控制参数训练路数据生成模型,使得生成的道路图像具有分割标签图像,利用带有分割标签的道路生成图像来进行道路感知模型的训练,即可以提高道路感知模型的识别效果。
为了方便描述本发明实施例提供的技术方案,首先参见图1,图1为本发明实施例提供的一种道路数据生成方法的示意性流程图,该方法包括:
步骤201、构建包括生成模型和判别模型的生成对抗网络。
可以理解是,在本申请实施例中,构建的模型整体结构为生成对抗网络,该生成对抗网络包括生成模型和判别模型,其中,生成模型用于根据输入的随机数据和场景控制参数生成对应的道路图像和道路图像对应的分割标签;判别模型用于在生成对抗网络的训练阶段,判别生成模型生成的道路图像和道路图像对应的分割标签的真伪。
其中,生成模型和判别模型都可以是由卷积神经网络组成,判别模型还可以包括特征提取网络和分类网络,特征提取网络用于提取输入的道路图像和分割标签的特征,判别网络用于对特征进行分类,得到最有可能的判别结果,作为一种方式,判别模型的特征提取网络可以包括至少一层卷积层;在本申请实施例中,生成模型可以不断进行上采样产生道路图像和分割标签,判别模型可以不断进行卷积下采样提取道路图像和分割标签的特征,判断道路图像和分割标签是来自于生成模型还是真实的道路图像和分割标签。
步骤202、获取第一自定义数据、多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数作为训练样本,对生成对抗网络进行训练,以基于生成模型得到最优生成模型。
可以理解的是,在本申请实施例中,构建出生成对抗网络之后,需要对生成对抗网络进行训练,首先需要获取训练集,训练集可以是多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数,其中,作为一种可能的实现方式,获取多类场景下的真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数的具体方式可以如下:
第一步、采集多类场景下的多张真实道路图像。
可以理解的是,可以通过视频图像采集设备、智能设备等采集不同道路场景下的道路图像,采集的道路图像可以包含多类场景,例如强光场景、夜间场景、雨天场景等。
第二步、根据预设的编码方式确定每一类场景对应的场景控制参数。
可以理解的是,在一种可能的实现方式下,可以通过预设的编码方式(例如独热编码(one-hot))对每一类场景进行编码,获得对应的场景控制参数,例如,采集的道路图像中的场景是白天,则对应的场景控制参数为10,集的道路图像中的场景是黑夜,则对应的场景控制参数为01,通过不同的场景控制参数可以区别不同的场景,进而可以通过向生成器输入指定的场景控制参数,即可生成指定场景下的道路图像,有效解决了获取不同场景道路图像困难的问题。
第三步、将每张道路图片中的交通线类别对应的像素值进行标记,获得每张道路图像向对应的分割标签图像。
可以理解的是,道路图像中的交通线类别可以是以下任意一项或组合:车道线、人行横道、斑马线和导向线,在一种可能的实现方式中,可以通过标注软件来进行分割标签标注,以获得道路图像对应的分割标签图像,具体的,可以通过逐像素标注的方法将每一类交通线对应的像素值标注为不同的像素值,获得分割标签图像,例如,车道线为类别1,人行横道为类别2,导向线为类别3,转换标注结果为单通道的掩码图像,该掩码图像图片上车道线位置的所有像素值可以为1,人行横道的像素值可以为2,导向线的像素值可以为3,背景的像素值可以为0,获得道路图像对应的分割标签图像之后,可以将每一张道路图像和对应的分割标签图像进行合并,组成道路图像和分割标签图像对,作为训练样本,对生成对抗网络进行训练,在一种可能的实现方式下,可以将道路图像和分割标签图像组成一个多维度的图像数据,维度可以为h*w*c,其中h和w分别表征图像对的高和宽,h*w即可以表征图像对的尺寸,c表征图像对的通道,在本申请实施例中,采集的道路图像具有rgb三个通道,分割标签图像具有一通道,所以道路图像和分割标签图像组成一个多维度的图像数据具有四通道,即c可以为4。
还可以理解的是,第一自定义数据可以是通过随机数发生器随机获取的数据分布规律服从均匀分布的随机噪声数据,将随机噪声数据输入到生成网络之后,可以生成图像数据。
获得第一自定义数据、获取多类场景下的真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数之后,可以采用单独交替迭代训练原则对生成对抗网络进行训练,即,先训练判别网络再训练生成网络并重复这一过程直至达到迭代次数,并按照评估标准选择出最优生成模型,下面仅以一次训练过程为例进行说明:
请参见图2,图2为本发明实施例提供的一种生成对抗网络训练过程示意图,先将第一自定数据和场景控制参数输入至生成模型,可以得到仿真道路图像和仿真道路图像对应的分割标签图像,该仿真道路图像和仿真道路图像对应的分割标签图像为假样本,同时获取真样本,真样本为真实道路图像和真实道路图像对应的分割标签图像;然后,人为定义真样本和假样本的标签,即,定义真实道路图像和真实道路图像对应的分割标签图像的标签为1,仿真道路图像和仿真道路图像对应的分割标签图像的标签为0,接下来,将真实道路图像和真实道路图像对应的分割标签图像、仿真道路图像和仿真道路图像对应的分割标签图像输入判别模型进行训练,并依据误差反向调节判别模型的参数,重复上述步骤直至判别模型对真实道路图像和真实道路图像对应的分割标签图像的判别结果逼近1、对仿真道路图像和仿真道路图像对应的分割标签图像的判别结果逼近0,这样就完成了判别模型的训练。
判别模型训练完成之后,需要固定判别模型的参数并对生成模型进行训练,对于生成模型,训练的目的是生成尽可能逼真的样本,而生成模型生成的样本的真实程度只有通过判别模型才能知道,所以在训练生成模型时需要联合判别模型才能达到训练的目的。将第一自定义数据和场景控制参数再次输入生成模型得到仿真道路图像和仿真道路图像对应的分割标签图像,将该仿真道路图像和仿真道路图像对应的分割标签图像设置为真样本,也就是人为定义仿真道路图像和仿真道路图像对应的分割标签图像的标签为1;然后,将仿真道路图像和仿真道路图像对应的分割标签图像输入判别模型得到误差,并利用误差反向调节生成模型的参数,重复这一过程直至最优判别模型对仿真道路图像和仿真道路图像对应的分割标签图像的判别结果逼近1,即完成生成模型的训练。
请参见图3,图3为本发明实施例提供的另一种道路数据生成方法的示意性流程图,其中,生成对抗网络的一次训练过程可以包括子步骤202-1~子步骤202-5,下面进行详细描述:
子步骤202-1、将第一自定义数据和场景控制参数输入到生成模型获得仿真道路图像和仿真道路图像对应的分割标签图像。
子步骤202-2、将仿真道路图像和仿真道路图像对应的分割标签图像、真实道路图像和真实道路图像对应的分割标签图像输入判别模型,获得判别模型的输出概率值。
在本申请实施例中,通过上述子步骤202-1获得仿真道路图像和仿真道路图像对应的分割标签图像之后,显然得到的仿真道路图像和仿真道路图像对应的分割标签图像为生成模型生成的假样本,此时需要获取真样本即真实道路图像和真实道路图像对应的分割标签图像,同时,人为定义真样本和假样本的标签,例如,可以定义仿真道路图像和仿真道路图像对应的分割标签图像的标签为0,真实道路图像和真实道路图像对应的分割标签图像的标签为1,这样就得到了仿真道路图像和仿真道路图像对应的分割标签图像的标签及其标签、真实道路图像和真实道路图像对应的分割标签图像及其标签。此时就可以利用假样本和真样本对判别模型进行训练,具体的训练过程可以包括以下过程:
首先,通过判别模型的特征提取网络真实道路图像和真实道路图像对应的分割标签图像、仿真道路图像和仿真道路图像对应的分割标签图像进行特征特征提取,得到图像特征,然后,利用分类网络对图像特征进行分类,得到判别模型的输出概率值,将上一步获得的图像特征输入分类网络之后,判别模型的输出概率值有2个,分别为属于类别1的概率和类别0的概率,类别1即为真实道路图像和真实道路图像对应的分割标签图像,类别0即为仿真道路图像和仿真道路图像对应的分割标签图像,例如,属于类别1的概率为0.6、属于类别0的概率为0.4。
子步骤202-3、利用判别模型的输出概率值对判别模型进行反向调节,得到最优判别模型。
在本申请实施例中,将真实道路图像和真实道路图像对应的分割标签图像和仿真道路图像和仿真道路图像对应的分割标签图像输入判别模型,得到判别模型的输出概率值之后,依据误差反向调节判别模型的参数,具体过程可以包括:
第一步、分别获取真实道路图像和真实道路图像对应的分割标签图像和仿真道路图像对应的分割标签图像对应的标签。由于训练判别模型时,仿真道路图像对应的分割标签图像为假样本,真实道路图像和真实道路图像为真样本,故获取到的真实道路图像和真实道路图像的标签为1,仿真道路图像对应的分割标签图像的标签为0,此时判别模型相当于一个二分类网络。同时,对于二分类问题,可以将预测值经过一个非线性变换缩小到0到1之间,并设置一个阈值(例如,0.5),小于0.5便是0,大于0.5便是1。例如,属于类别1的概率为0.6、属于类别0的概率为0.4,此时便认为预测值为1。
子步骤202-4、固定最优判别模型的参数,基于第一自定义数据、场景控制参数、生成模型和最优判别模型,得到最优判别模型的输出概率值。
在本实施例中,判别模型训练完成之后,需要固定最优判别模型的参数并对生成模型进行训练。在训练过程中,需要将生成模型及最优判别模型串联。具体来说,首先固定最优判别模型的参数,随机获得第一自定义数据和场景控制参数输入生成模型得到仿真道路图像和对应的分割标签图像,将该仿真道路图像对应的分割标签图像设置为真样本,也就是人为定义仿真道路图像和对应的分割标签图像的标签为1;然后,将仿真道路图像和对应的分割标签图像输入最优判别模型,得到最优判别模型的输出概率值。
子步骤202-5、利用最优判别模型的输出概率值对生成模型进行反向调节,得到最优生成模型。
在本申请实施例中,生成对抗网络的优化过程可以如下式:
其中,v(g,d)为整个生成对抗网络的代价函数,x~pdata表示x采样自分布服从pdata的道路图片和分割标签对构成的数据集,z~pz表示z采样自分布服从pz的第一自定义数据,即先验噪声,y表示场景控制参数,可以为one-hot编码形式,d(x|y)表示在场景控制参数y的条件下,经过判别模型的输出,g(z|y)表示z在场景控制参数y的条件下经过生成模型的输出,d(g(z|y))表示g(z|y)经过判别模型的输出,
步骤203、基于最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成待生成道路图像和待生成道路图像对应的分割标签图像。
可以理解的是,第一自定义数据和第二自定义数据具有相同的分布规律。
本发明实施例提供的道路数据生成方法,包括:构建包括生成模型和判别模型的生成对抗网络;获取第一自定义数据、多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数作为训练样本,对生成对抗网络进行训练,以基于生成模型得到最优生成模型;场景控制参数表征场景类别;基于最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成待生成道路图像和待生成道路图像对应的分割标签图像;第一自定义数据和所述第二自定义数据具有相同的分布规律。本方法通过第一自定义数据、多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数作为训练样本,对生成对抗网络进行训练获得最优的生成模型,然后根据通过最优的生成模型生成指定场景下的道路图像,同时由于在训练过程中,训练样本中还包括道路图像对应的分割标签,所以生成的最优的生成模型同时能够生成道路图像对应的分割标签,解决了获得的道路图像需要额外进行交通线标签标注,时间成本和人力成本大的问题,提高获得道路图像的效率。
可选地,通过训练最优的生成模型来生成指定场景的道路图像和对应的分割标签图像,可以解决获得大量道路图像困难的问题,还能降低对道路交通线进行人工标注的成本,但是,生成的道路图像和对应的分割标签通常是低分辨率的图像,为了能够使得生成的道路图像和对应的分割标签具有高分辨率,便于道路感知模型训练,本申请实施例还提供一种提高生成的道路图像分辨率的实现方式,即在进行模型训练的过程中,逐渐增加网络层数,学习图像的细节特征,生成更高分辨率的道路图像和对应的分割标签,具体的实现方式如下:
增加特征提取网络的卷积层数,以使最优生成模型和最优判别模型具有第二分辨率;第二分辨率大于第一分辨率。
可以理解的是,生成模型和判别模型都可以包括特征提取网络;特征提取网络包含包括至少一层卷积层;生成模型和判别模型具有对称的卷积结构,卷积层数决定了生成模型和判别模型具有第一分辨率,通过增加网络层数,生成模型可以学习图像的细节特征,生成具有第二分辨率的道路图像和对应的分割标签,同时增加判别模型的卷积层数,利用具有第二分辨率的道路图像和对应的分割标签训练判别模型,使得生成模型和判别模型具有相同的分辨率。
例如,请参见图4,图4为本发明实施例提供的另一种生成对抗网络训练过程示意图。其中z和y分别表示第一自定义数据(先验噪声)和场景控制参数,将z和y组和输入到生成模型之后生成仿真道路图像和对应的分割标签他图像(xfake),分辨率为m*n,将真实道路图像和对应的分割标签他图像(xreal)和场景控制参数一并输入判别模型,使得,通过增加生成模型和判别模型的卷积层数,逐渐可以将生成模型和判别模型的分辨率加倍,即生成模型逐渐能生成分辨率为2m*2n、2pm*2pn等,同样,判别模型逐渐能判别分辨率为2m*2n、2pm*2pn的图像。
同时,当加倍分辨率训练的时候,为了防止训练不稳定,使得样本的质量也极大的降低,还可以加入平滑的转换过程,增加模型训练的稳定性,具体实现方式如下:
第一步、通过特征提取网络提取仿真道路图像和仿真道路图像对应的分割标签图像的具有第一分辨率的特征图和具有第二分辨率的特征图。
第二步、根据预设的权重对具有第一分辨率的特征图和具有第二分辨率的特征图进行卷积计算,获得第二分辨率的仿真道路图像和仿真道路图像对应的分割标签图像。
例如,参见图5,图5为本申请实施例提供的另一种生成对抗网络训练过程示意图,假设当前生成的图像分辨率为m*n,当要加倍分辨率时,对于生成模型平滑过渡如下:
x2m*2n=(1-α)*torgbm(up2(fm*n))+α*torgbm(f2m*2n)
其中x2m*2n为生成模型输出的分辨率为2m*2n的仿真道路图像和仿真道路图像对应的分割标签图像数据,α为从0到1线性增长的权重值,fm*n表示尺寸为m*n的特征图,f2m*2n表示尺寸为2m*2n的特征图,up2表示2倍上采样操作,通过最近邻插值加卷积实现,torgbm表示将特征图卷积为4通道的rgbm道路图片和分割标签对,rgb是三通道的道路图片,是一通道的分割标签,对于判别模型平滑过渡如下:
ym*n=(1-α)*fromrgbmy(down2(x2m*2n))+α*down2(fromrgbmy(x2m*2n))
其中ym*n为判别器平滑过渡输出,fromrgbmy为从道路图片、分割标签以及场景控制参数组合rgbmy卷积为特征图,down2表示为2倍下采样,m通过平均池化实现。
通过在训练的过程,增加生成模型和判别模型的分辨率使得生成的道路图像具有更高的分辨率,同时通过平滑操作,增加了模型训练的稳定性,提高了样本的质量。
为了执行上述实施例及各个可能的方式中的相应步骤,下面给出一种道路数据生成装置的实现方式,参见图6,图6示出了本发明实施例提供的一种道路数据生成装置道路数据生成装置的功能模块图。
需要说明的是,本实施例所提供的道路数据生成装置道路数据生成装置30,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容,该道路数据生成装置30包括:构建模块301、训练模块302及生成模块303。
构建模块301,用于构建包括生成模型和判别模型的生成对抗网络。
训练模块302,用于获取第一自定义数据、多类场景下的多张真实道路图像和真实道路图像对应的分割标签图像、多类场景对应的场景控制参数作为训练样本,对生成对抗网络进行训练,以基于生成模型得到最优生成模型。
上述的场景控制参数表征场景类别。
生成模块303,基于最优生成模型、待生成道路图像对应的场景控制参数和第二自定义数据,生成待生成道路图像和待生成道路图像对应的分割标签图像。
上述的第一自定义数据和第二自定义数据具有相同的分布规律。
可以理解的是,构建模块301、训练模块302及生成模块303可以协同的执行步骤201~步骤203以实现相应的技术效果。
可选地,训练模块302具体用于:将第一自定义数据和场景控制参数输入到生成模型获得仿真道路图像和仿真道路图像对应的分割标签图像;将仿真道路图像和仿真道路图像对应的分割标签图像、真实道路图像和真实道路图像对应的分割标签图像输入判别模型,获得判别模型的输出概率值;利用判别模型的输出概率值对判别模型进行反向调节,得到最优判别模型;固定最优判别模型的参数,基于第一自定义数据、场景控制参数、生成模型和最优判别模型,得到最优判别模型的输出概率值;利用最优判别模型的输出概率值对述生成模型进行反向调节,得到最优生成模型。
可以理解是,训练模块302可以用来执行子步骤202-1~子步骤202-5以实现相应的技术效果。
可选地,道路数据生成装置道路数据生成装置30还包括:获取模块和确定模块和标记模块;获取模块,用于获取多类场景下的真实道路图像;确定模块,用于根据预设的编码方式确定每一类场景对应的场景控制参数;标记模块,用于将每张道路图片中的交通线类别对应的像素值进行标记,获得每张道路图对应的分割标签图像。
可选地,训练模块302还可以用来增加特征提取网络的卷积层数,以使最优生成模型和最优判别模型具有第二分辨率;第二分辨率大于第一分辨率;通过最优生成模型生成具有第二分辨率的仿真道路图像和仿真道路图像对应的分割标签图像。
可选地,训练模块302还可以用来通过特征提取网络提取仿真道路图像和仿真道路图像对应的分割标签图像的具有第一分辨率的特征图和具有第二分辨率的特征图;根据预设的权重对具有第一分辨率的特征图和具有第二分辨率的特征图进行卷积计算,获得第二分辨率的仿真道路图像和仿真道路图像对应的分割标签图像。
本发明实施例还提供的一种电子设备,参见图7,图7本发明实施例提供的一种电子设备的方框示意图,该电子设备50包括存储器51、处理器52和通信接口53。该存储器51、处理器52和通信接口53相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
存储器51可用于存储软件程序及模块,如本发明实施例所提供的道路数据生成方法对应的程序指令/模块,处理器52通过执行存储在存储器51内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口53可用于与其他节点设备进行信令或数据的通信。在本发明中该电子设备50可以具有多个通信接口53。
其中,存储器51可以是但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。
处理器52可以是一种集成电路芯片,具有信号处理能力。该处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
电子设备50可以实现本发明提供的任一种确定装配体检测角度的方法。该电子设备50可以是,但不限于,手机、平板电脑、笔记本电脑、服务器或其它具有处理能力的电子设备。该电子设备50还可以是具有通过本发明提供的道路数据生成方法来获取道路图像生成模型的电子设备。
本发明实施例还提供一种存储介质,其上存储有计算机程序,例如,当该存储介质存储于图6中的存储器51时,该计算机程序被处理器执行时实现如前述实施方式中任一项的道路数据生成方法,该计算机可读存储介质可以是,但不限于,u盘、移动硬盘、rom、ram、prom、eprom、eeprom、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。