本发明涉及一种训练方法,利用该训练方法,生成器能够被训练用于,在两个域a和b之间转换具有测量数据的数据集。利用这样的生成器又可以在例如针对至少部分自动化的行驶而对能训练的模块进行训练的情况下缓解学习数据集的不足(knappheit)。
背景技术:
在道路交通中由人类驾驶员来对车辆进行的驾驶通常被训练,其方式是,使驾驶学习者在自身的培训范畴内一再地面临对多个情形的确定准则(kanon)。驾驶学习者必须分别对这些情形进行作出反应并且通过评语或者甚至是驾驶教师的干预来得到反馈:自身的反应是正确的还是错误的。利用有限数目的情形而进行的训练应该使得该驾驶学习者在对车辆的独立驾驶中也能够胜任未知的情形。
为了使车辆能够完全或部分自动化地参与道路交通而力求:利用能以非常类似的方式训练的模块来控制这些车辆。这些模块例如从车辆环境中获得传感器数据来作为输入参量并且作为输出参量来提供操控信号,利用这些操控信号来干预车辆的运行,和/或提供半成品(vorprodukt),由这些半成品来构成这样的操控信号。例如,对车辆的环境中的对象的分类可以是这样的半成品。
对于在这种训练中的时间和成本耗费的推进是如下必要性:创建足够数量的学习数据集。分别需要用于能训练的模块的输入参量的学习值和用于输出参量的学习值,能训练的模块应该在经正确训练的状态下由此生成这些学习值。
技术实现要素:
在本发明的范畴内开发了一种用于训练生成器的方法,该生成器被构造用于,将具有测量数据的数据集从第一个域a转换到第二个域b。
在此,测量数据的概念非常一般而言地包括如下数据,这些数据已通过物理测量过程和/或通过部分或完全模拟这样的测量过程和/或通过部分或完全模拟利用这样的测量过程能观察的技术系统所获得。测量数据因此总是如下数据,所述数据表征在技术系统中的过程和/或物理观察。为了更好的可读性并且鉴于在许多应用中的模拟是对于物理实验的几乎同等价值的替代方案这一事实,在下文中将这些数据仅还称为“测量数据”而无关于所述数据是通过物理测量还是通过模拟所获得的。
具有测量数据的数据集可以例如包括如下图像,这些图像已通过利用一个或多个摄像机来观察车辆的环境所获得。然而,这些数据集也可以例如包括雷达反射的点云,其已利用一个或多个雷达传感器通过观察车辆的环境所获得。
这些域a和b可以例如代表情形的不同类型或类别,这些情形影响测量数据的物理上的记录(aufnahme)或模拟的记录。如果这些测量数据例如包括图像,则这些域a和b可以例如代表不同的季节、白天时间(tageszeit)、照明情形和/或天气情况。每个域的这些图像于是具有如下风格(stil),该风格通过相应的情形而共同施加(aufprägen)于这些图像。例如:
•在白天、在黄昏或在夜间所记录的图像,
•在日照情况下或在阴雨天气情况下所记录的图像,以及
•在春天、夏天、秋天和冬天所记录的图像
分别具有各自的风格。
这些大量的可能的风格提高了在能训练的模块的训练情况下的耗费,其中这些能训练的模块应该从图像中得出用于控制或操控车辆的推论。因此必须例如保证:始终正确识别在图像中的包括在图像中出现的交通标志和其他交通参与者在内的确定的交通情形,而无关于哪个风格恰好被施加给这些图像。这意味着,与该交通情形的语义内容无关的图像风格不允许影响到该语义内容的识别。为了保证这点,通常以如下图像来训练能训练的模块,所述图像的可变性包括非常多的可能图像风格。
能训练的模块尤其是视为如下模块,该模块以用于概括的大力度体现了(verkörpern):以能适配的参数来参数化的功能(funktion)。这些参数可以在对能训练的模块进行训练时尤其是如此适配,使得在将学习输入参量输入到模块中时使所属的学习输出参量的值尽可能良好地被再现。能训练的模块可以尤其包含人工神经网络,knn;和/或可以是knn。
关于训练数据的不足可能尤其是如下地出现,在收集真实的用于训练的图像时,确定的交通情形并非非常常见地与确定的图像风格相结合地出现。例如,在确定的位置可能仅仅十分少见地发生降雪,从而仅仅有少量的如下图像可供使用,这些图像示出在积雪状态下的该位置。也可能在真实的行驶运行中原则上少见地发生例如确定的危险情形(“cornercases(极端情况)”),在这些危险情形中明显提高了事故风险。于是,获得如下图像是越发困难的,在这些图像中,这些情形与许多不同的图像风格相结合(gepaart)。
在这些情形中,使用到用于域转换(domänenübersetzung)的生成器。例如,可以使在夏天记录的图像属于域a,并且可以使在冬天记录的图像属于域b。生成器于是可以将任意的在夏天所记录的图像这样转换,使得该图像看起来就像是在冬天所记录的那样。因此在确定的交通情形的理想情况下,仅还需要一个具有任意风格的图像并且可以于是将该图像转换成所有对于能训练的模块的训练所需的其他风格。
生成器的最终实际应用因此是:改善能训练的模块的训练,这些能训练的模块又被构造用于控制和/或监控技术系统。因此也间接地改善了所述控制和/或监控。
在该方法的范畴内在其方面训练该生成器。为此,属于域a的学习数据集的第一集合和属于域b的学习数据集的第二集合被使用。在此,并不需要使在域a和b中的学习数据集分别具有相同的语义内容。这意味着,该训练也可以以不成对(ungepaart)的学习数据集来执行。
生成器的行为通过能适配的参数来表征。这些参数在训练的范畴内逐步被适配,以便优化预给定的成本函数的值。该成本函数包含可信度贡献(plausibilitäts-beitrag)。该可信度贡献为此是用于如下的度量,以何种程度:
•在属于域a的至少一个学习数据集中体现的至少一个特性在将该学习数据集转换到域b的情况下保持不变;和/或
•在属于域a的至少一个学习数据集中体现的至少一个特性在转换到域b之后类似于属于域b的至少一个学习数据集的与之对应的特性。
以这种方式,在训练生成器时可以考虑关于域a和b的、关于物理或模拟过程的以及关于测量数据的语义内容的附加信息,其中在学习数据集中的测量数据属于所述域a和b,测量数据是利用所述物理或模拟过程所获得的。已认识到:能够以这种方式使生成器的训练变得更稳定,从而使该生成器在训练结束之后以更高概率是针对将具有测量数据的数据集从域a转换到域b而言的可用的(brauchbar)工具。
尤其是,可以例如减小如下概率:在从域a转换到域b的情况下无意地改变这些测量数据的对于相应应用而言重要的语义内容。如果例如视觉上良好地达到的从风格“夏天”到风格“冬天”的图像转换将小的伪迹(artefakt)引入到该图像,则所述伪迹导致:将停车标牌误解作为速度70标牌,那么这可以在用于成本函数的可信度贡献中表现出来(niederschlagen)。该生成器的训练可以例如以这种方式对其进行反应:使经转换的图像看起来视觉上更不“漂亮”,但是为此语义内容却正确地被传递。
用于生成器的训练的成本函数因此具有总共至少两种贡献。存在如下贡献,这些贡献涉及域转换本身并且取决于其具体的式样(machart)(例如generativeadversarialnetwork(生成对抗网络),gan)。这些贡献评价了:图像从一风格到另一风格的改写(übertragung)例如以何种程度“达成(gelingen)”。与之伴随有(hierzugeselltsich)可信度贡献,该可信度贡献评价了:经转换的图像是否也还可用于自身的有意的其他应用。当已从域a转换到域b的数据集接下来应被使用用于能训练的模块、例如人工神经网络的训练时,那么这尤其是重要的。这样的能训练的模块的性能和可靠性决定性地取决于在训练时所使用的数据的质量。
在一种特别有利的构型方案中,该成本函数附加地包含至少一个循环论证贡献。该循环论证贡献为此是如下度量:属于域a的至少一个学习数据集以何种程度在利用生成器从域a转换到域b之后并且在接下来从域b转换回域a之后一致地再现。该循环论证贡献因此属于如下贡献,这些贡献涉及域转换本身。
例如,该生成器可以在cyclegan(循环gan)方法的范畴内被训练。在这样的方法情况下,可以例如训练总共四个能训练的模块、例如神经网络。第一生成器鉴于如下方面被训练:将数据集这样从域a转换到域b,使得这些数据集能够与在物理上或模拟地直接在域b中所记录的数据集区分。第二生成器鉴于如下方面被训练,将数据集在相反方向上这样从域b转换到域a,使得这些数据集能够与在物理上或模拟地直接在域a中所记录的数据集区分。此外,第一鉴别器(diskriminator)鉴于如下方面被训练,将物理上或模拟地直接在域b中所记录的数据集与通过第一生成器转换到域b的数据集区分。第二鉴别器鉴于如下方面被训练,将物理上或模拟地直接在域a中所记录的数据集与通过第二生成器转换到域a的数据集区分。
在这样的cyclegan方法的情况下,成本函数可以例如包含两个循环论证贡献。该第一循环论证贡献是用于如下的度量:属于域a的至少一个学习数据集在利用第一生成器从域a转换到域b之后并且在接下来利用第二生成器从域b转换回域a之后以何种程度被一致地再现。该第二循环论证贡献是用于如下的度量:属于域b的至少一个学习数据集在利用第二生成器转换到域a之后并且在接下来利用第一生成器从域a转换回域b之后以何种程度被一致地再现。
已认识到:在根据该方法训练时,这两个生成器可以学会(erlernen)对这些数据集的歪曲(verfälschung);这些歪曲在该循环论证的完整(komplett)运行中彼此抵消并且因此使得用于成本函数的这些循环论证贡献不变。例如,该第一生成器可以在颜色到不同对象类型的分配中学会交换(vertauschung),并且第二生成器可以学会相反的交换。该完整的循环论证于是可以例如准确地再次对所输入的图像进行再现。如果例如一方面分配给道路的并且另一方面分配给天空的颜色在域之间的转换时被相互交换,或者甚至如果该图像的颜色在转换时被完全地颠倒(invertieren),则这因此被用于成本函数的循环论证贡献完全地忽略(entgehen)。以这种方式歪曲的图像例如不再可用于对能训练的模块进行训练。
该可信度贡献现在可以例如此外监视(wachen):在从域a转换到域b的情况下使基础色调保持不变和/或仅以可信的方式改变。因此,在大多情形中道路的色调例如是灰调。该色调可以在转换到域“冬天”时通过以白色的雪来覆盖而改变或者在转换到域“秋天”时通过以棕色调的落叶来覆盖而改变。然而,难以想象如下真实动机(anlass),出于这些动机,道路的色调例如变换成蓝色、绿色或红色。同样地,可以例如使天空的颜色根据天气情况而定地从蓝色改变成灰色或白色,或者使天空的颜色在日出或日落时变换成红色调。然而难以想象的是:出于何种真实动机而应将天空的颜色例如变换成绿色。
因此,例如所述颜色交换或颜色颠倒在该生成器的训练中不再保持不受注意,而是在所述成本函数中“受到惩罚(bestrafen)”,使得该生成器最终再次从该错误行为移开(abrücken)。
以这种方式,该生成器的训练总体变得更能够再现。典型地,表征该生成器的行为的参数在训练开始时被随机地初始化。在迄今为止的利用没有可信度贡献的成本函数的试验中,其因此取决于如下偶然性:这些生成器是否学会了所描述的歪曲,这些歪曲在循环论证中彼此抵消。在不利的情况下,该训练必须多于十次地被重新开始,以便获得可用的生成器。利用该可信度贡献,所描述的歪曲无关于生成器的参数的初始配置地在训练的过程中被生成器“戒除(aberziehen)”。与此关联的是对用于训练的时间和资金的明显节省,因为完整的训练可以鉴于强度的图形处理器(gpu)而需要多天的计算时间,并且无论是通过提供自身的硬件还是通过在云中的租用,该计算时间都必须以任一形式被付出。
成本函数可以例如包含可选地也加权的、由可信度贡献和循环论证贡献组成的总和。
在另一特别有利的构型方案中,响应于该成本函数的可信度贡献的曲线走向和/或值满足预给定的标准地,该生成器的训练利用如下成本函数来继续进行,在该成本函数中,可信度贡献被更小地加权或移除。已认识到:对在完整的循环论证中相互抵消的、所描述的歪曲的学会优选地在该训练开始时从参数的随机初始化出发地出现。该训练越进一步地进展(fortgeschritten),该生成器还对用于所描述的歪曲的趋势进行发展的概率就越小。
如之前阐述的那样,在一种特别有利的构型方案中,域a和b在至少一个物理条件和/或模拟边界条件方面区分,其中对于域a和b的所属的学习数据集分别已在所述物理条件下和/或所述模拟边界条件下所检测。这些条件可以例如包括:白天时间、季节、天气条件或照明条件。
尤其是,可以例如使用可信度贡献,以便在终究考虑用于成本函数的循环论证贡献之前预先训练该生成器。但是例如也可以在仅针对于可信度贡献的优化的训练和仅针对于循环论证贡献的优化的训练之间交替。
在另一特别有利的构型方案中,选择如下物理特性来作为在将学习数据集从域a转换到域b的情况下应保持不变的特性:在域a和b之间的在模拟边界条件和/或物理条件方面的区别并不影响到该物理特性或仅以直至预给定的最大度量(höchstmaß)来影响到该物理特性。如之前阐述的那样,可以在天气条件和/或照明条件改变时例如仅以既定的极限而使确定的在图像中可见的对象的色调变化。例如照明条件的单纯改变也可以并非根本地改变例如树冠或道路的纹理。
在另一有利的构型方案中,学习数据集分别包括至少一个物理上能观察的测量参量的在二维或三维的空间区域中所检测的分布。该测量参量可以在此情况下具有任意的维度。该分布将测量参量的任意维度的值分配至如下位置,这些位置又通过在空间区域内的二维的或三维的坐标来表征。对于这种的分布的示例是二维的或三维的图像。因此,利用图像传感器所记录的二维的图像例如体现了:经图像传感器的区(fläche)的光强度的和/或颜色的位置分辨的分布。对于分布的另一示例是雷达数据的点云,该点云给例如距离和一个或多个角分配由通过该距离和所述一个或多个角所表征的位置所入射的强度。
术语“物理上能观察的测量参量”并不应在该意义上限制性地理解为:这些测量参量的值必须强制性地通过物理测量来检验。类似于术语“测量数据”地,仅仅意味着:这种物理检测的测量参量可用。然而也可以作为对于物理检测的替代方案而使用到模拟,而并不对该测量参量的接下来的应用略微进行改变。
在另一特别有利的构型方案中,在其处已检测到物理上能观察的测量参量的至少一个位置到至少一个物理对象的所属性被选择作为在将学习数据集从域a转换到域b的情况下应保持不变的特性。为此目的,可以例如利用任意方法来对在学习数据集中的测量数据进行语义分割。进行该分割的精确度仅仅是次要的;决定性的只是:该分割的结果是否在学习数据集转换到域b之后改变。该语义分割也无需强制性地全自动地进行,而是可以例如也保持从图像中手动选择如下图像区域,这些图像区域属于这两个域a和b。
如之前所阐述的,被施加到图像的例如取决于季节、白天时间、天气条件和/或照明条件的风格基本上无关于该图像的语义内容。如果因此进行到另一风格的单纯转换,那么该图像的语义内容应并不改变。
该语义分割的结果也可以鉴于图像中的小的改变而敏感地进行反应。对此的范例(paradebeispiel)是所谓的“对抗示例(adversarialexample)”。这是在图像中有意引入的、视觉上不显眼的或者对于人类而言根本以裸眼不能识别出的改变,而所述改变则剧烈地改变该图像的语义分割的结果或者该图像的其他分类的结果。以相同方式,该语义分割的结果也可能通过在域转换中无意地产生的伪迹而被影响。因此,对于从位置到对象的分配以何种程度保持不变的监控是有意义的。
如果该语义分割的结果在从域a转换到域b的情况下改变,则存在不同的可能性:这如何能够在可信度贡献中被考虑。
例如,成本函数的可信度贡献可以取决于如下位置的数目和/或维度(ausdehnung),这些位置到至少一个物理对象的分配在学习数据集从域a转换到域b的情况下改变。可信度贡献于是可以例如是用于如下的度量:语义分割的改变涉及图像的哪个部分。
可替代地或者也与此相结合地,可以将如下物理对象划分成多个类别,其中分别给这些物理对象分配位置。成本函数的可信度贡献于是可以取决于,在域a中的至少一个位置被分配给哪个类别的对象并且该分配在转换到域b的情况下变换到哪个类别。以这种方式可以例如将如下改变在可信度贡献中更高加权(übergewichten),该改变例如在能训练的模块的训练中在进一步处理经转换的数据集时特别不利地产生影响。在至少部分自动化驾驶的上下文中例如特别危急的是,其他交通参与者或者其他对象在转换到域b之后被分类为能自由通行的区。
只要是对于在从域a转换到域b的情况下应保持不变的特性的改变而言存在标量的(skalar)或矢量的度量,就可以使该成本函数的可信度贡献例如包括经该二维或三维的空间区域的所述度量的按数值的总和或平方总和,其中在所述二维或三维的空间区域上检测所述物理上能观察的测量参量。该可信度贡献于是不仅考虑该改变的强度而且也考虑该改变的相应的空间上的程度(ausmaß)。
在另一特别有利的构型方案中,该物理上能观察的测量参量的经二维或三维的空间区域的预给定的部分区域聚合的(aggregieren)值被选择为如下特性,该特性在学习数据集从域a转换到域b的情况下应保持不变。
如果该学习数据集例如包含图像,则可以例如将在图像的至少一个部分区域内的颜色平均值选择为如下特性,该特性是在将学习数据集从域a转换到域b的情况下应保持不变的特性或者该特性应该在该转换之后类似于属于域b的至少一个学习数据集的与之对应的特性。
例如,交通信号灯的三个灯和壳体分别具有所规定的颜色,所述颜色在过渡到其他的白天时间、季节、天气条件和/或照明条件时并不改变或者仅不重要地改变。同样地,在交通标志上的饱和的颜色、例如黑色、红色或蓝色在这样的域变换情况下并不改变或者仅仅不重要地改变。相反,例如天空的着色(farbgebung)以限定的方式在从中午时间到日出或日落的变换中改变。在交通标志上的标定(nominell)白色的区域也可以例如随着太阳位置(sonnenstand)而改变自身的在图像中可见的颜色。
颜色平均值与至少一个属于该域b的学习数据集的相适应可以例如分开地根据对象类型来被测量,其中这些对象类型又能够在这两个域a和b中通过语义分割从相应的图像中被确定。对此,例如可以将确定的对象类型的所有像素的在从域a转换到域b之后出现的颜色平均值与属于域b的学习数据集的所有像素的颜色平均值比较,其中这些像素被分配给相同的对象类型。例如,因此可以将转换到域b的图像的被分配给对象类型“道路”的所有像素的颜色平均值与从一开始(vornherein)属于域b的学习数据集中的图像的同样被分配给对象类型“道路”的所有像素的颜色平均值比较。该比较可以例如以在rgb颜色空间(farbraum)中的适合的基准(norm)来进行。如果在转换到域b的图像中以及在从一开始就属于域b的图像中被分配给相同对象类型的区域是颜色上非常相似的,则所述基准接近于零(null)。相反,被比较的图像区域在色调方面和/或在亮度方面越大地区别,该基准就可以具有(annehmen)越大的值。但是,针对该相似性的所使用的包括到可信度贡献中的度量也可以例如在其他颜色空间中解释为rgb,仅取决于选择性的颜色通道(farbkanal)和/或使用其他基准定义(normdefinition)。用于成本函数的可信度贡献可以例如与该相似性度量成比例。但是用于成本函数的该可信度贡献也可以以任意的其他函数而取决于该相似性度量。如果除了用于颜色平均值的相似性度量以外该可信度贡献还测量一个或多个其他标准,那么这尤其是有意义的。
在另一特别有利的构型方案中,选择如下学习数据集,这些学习数据集包含测量数据的时间序列。以这种方式,可以例如利用该域转换的原理,以便使得用于对车辆的发动机或其他机组的行为进行预测的、能训练的模块的学习数据集多样化(vervielfältigen)。
因此,例如在发动机开发中期望的是,预测在真实行驶条件下发动机的废气行为(真实驾驶排放(realdrivingemissions),rde)。因此,发动机还可以在开发期间必要时被适配,从而使该最终产品以高概率通过rde废气测试。为了预测又可以使用能训练的模块(例如人工神经网络),这些能训练的模块将作为时间程序(zeitprogramm)存在的行驶周期作为输入来获得并且这些能训练的模块将一个或多个有害物质的总体所排放的量作为输出来输出。在此,用于获得学习数据集的测试行驶的执行是比较时间耗费的并且存在如下需求,例如将针对在夏天所执行的测试行驶的学习数据集转换到针对在冬天所执行的测试行驶的数据集。以这种方式,能够减小实际要执行的测试行驶的数目。
尽管时间序列和二维或三维图像是用于利用生成器从域a转换到域b的测量数据的最突出的示例,这并不因此包含:将测量数据的维度限于时间序列和图像的维度。更高维度的学习数据集可以例如通过将不同数据类型联合(vereinigung)到一个并且同一个学习数据集中而产生。之前作为示例提及的行驶周期可以例如通过一方面由时间程序并且另一方面由图像构成的结合来表征,其中该图像例如被利用,以便表征如下的白天时间、天气条件和/或季节,其中该时间程序曾经在所述白天时间、天气条件和/或季节出发(abgefahren)。
非常一般而言地,优选选择如下学习数据集,所述学习数据集的测量数据已通过观察和/或模拟车辆的环境和/或通过观察和/或模拟该车辆的机组和/或结构组合件的至少一个状态所获得。
对生成器进行训练的实体(entität)无需强制性地是使用该生成器的实体。相反,训练完成的生成器是独立的产品。例如,可以利用来自大量情形的图像通用地鉴于在季节、白天时间和天气条件和/或照明条件之间的转换方面来训练生成器,其中这些情形并不限于道路交通。该生成器于是可以例如由第一企业来使用用于与观察车辆环境相关联的域转换并且由第二企业来使用用于与监控运营地区(betriebsgelände)相结合的域转换。
因此,本发明一般而言也涉及用于将数据集从域a转换到域b的生成器和/或涉及具有能适配的参数的数据集,这些参数表征该生成器。该生成器或该数据集利用之前所描述的方法来获得。
如在之前所阐述的,根据之前描述的方法所训练的生成器的重要应用是:将用于能训练的模块的学习数据集转换并且因此特别地转换到如下域,在所述域中学习数据集是不足的,以用于缓解该不足。因此,本发明也涉及一种用于对能训练的模块进行训练的方法,该方法将一个或多个输入参量转换成一个或多个输出参量。该能训练的模块的行为通过其他能适配的参数来表征。所述其他能适配的参数被逐渐地适配,使得用于输入参量的学习值平均地映射到用于输出参量的所属学习值。
例如,这些输入参量可以是图像的像素值并且所述输出参量于是可以例如代表在图像中可见的对象的分类。
在该方法中,利用之前所描述的生成器来将具有用于输入参量的学习值的至少一个学习数据集从域a转换到域b。在能训练的模块的训练的范畴内将用于输入参量的被转换到域b的学习值输送给该能训练的模块。
以这种方式,用于输入参量的属于域b的学习值可以被提供,而无需使这些学习值都物理上或模拟地直接记录在域b中。尤其是,可以将针对其仅在域a(例如“夏天”)中记录了测量数据的情形这样呈现给能训练的模块,就好像这些情形在域b(例如“冬天”)中出现一样。
在另一特别有利的构型方案中,用于所述输入参量的如下学习值被选择,所述学习值在域a之内基于至少一个在所述学习值中所体现的特性而以至少一个用于输出参量的学习值来加标签,其中生成器在转换的情况下使所述特性不变和/或使所述特性与在所述域b中的对应的特性相适应。根据在机器学习的领域中常见的语言惯用法,“加标签(gelabelt)”就此而论意味着:已将用于输出参量的学习值作为附加信息分配给该学习数据集。因此,可以用信息例如给示出不同对象的图像加标签:其分别涉及哪些对象。
通过使基于自身来给学习数据集加了标签的特性在域转换的情况下保持不变和/或与域b相适应,确保:标签至学习数据集的分配在转换到域b之后还在内容上适用(zutreffend)。如果该标签例如说明在图像中在域a中包含确定的对象,那么也在转换到域b的图像中还良好地识别出这些对象。能训练的模块因此可以根据适用的信息来学习:在该图像中哪些特征分别指出根据标签而存在的对象。相反,如果在被转换到域b的图像中不再识别出这些对象,能训练的模块可能使该图像的根本与根据标签而存在的对象无关的某些特征具有如下特性,所述特性恰好指出这些对象。由此,可能通过能训练的模块而使该对象识别恶化而并非改善。
如开头提及的那样,能训练的模块的重要应用是:车辆的控制或操控,其中针对这些模块的训练又使用所描述的生成器。因此,本发明也涉及其他方法。
在该方法中,利用之前描述的用于训练生成器的方法来训练生成器。在利用该生成器的情况下,利用用于能训练的模块的训练的方法来训练能训练的模块。该能训练的模块被运行,其方式为,将测量数据输送给该模块来作为输入参量,这些测量数据已通过观察车辆的环境和/或通过观察该车辆的机组和/或结构组合件的至少一个状态所获得。根据由能训练的模块所提供的输出参量,利用操控信号来操控该车辆和/或该车辆的机组或结构组合件。
所描述的方法可以完全地或者部分地以计算机来实施。因此,这些方法可以例如以软件的方式来体现。因此,本发明也涉及一种具有机器可读的指令的计算机程序,当所述指令在计算机上被执行时,所述指令促使所述计算机,执行所描述的方法之一。
同样地,本发明也涉及一种机器可读的数据载体或下载产品,所述数据载体和/或下载产品具有计算机程序。下载产品是通过数据网络能传输的、也即由数据网络的用户能下载的、数字产品,所述数字产品例如能够在网上商店出售以用于立即下载。
此外,能够使计算机装备有所述计算机程序、所述机器可读的数据载体或下载产品。
附图说明
在下文中与本发明优选实施例的描述共同地根据附图来进一步示出对本发明进行改进的其他措施。其中:
图1示出用于训练生成器1的方法100的实施例;
图2示出用于训练能训练的模块2的方法200的实施例;
图3示出用于训练生成器1的、用于能训练的模块2的训练和用于该能训练的模块2的接下来的运行的方法300的实施例;
图4示出在利用方法100训练生成器1之后作为学习数据集11a的图像的示例性的域转换(图4a)和没有方法100的情况下训练生成器1之后作为学习数据集11a的图像的示例性域转换(图4b)。
具体实施方式
根据图1,在方法100的步骤110中,在要训练的生成器1中将学习数据集11a从域a转换到域b。对于该转换的结果11a’附加地,在此情况下,提供成本函数13的值,利用该成本函数来评价该结果11a'。
该成本函数13包含可信度贡献13a。该可信度贡献13a可以测量:在学习数据集11a中体现的特性14a在该学习数据集11a转换到域b的情况下以何种程度保持不变(invariant),也即在域b中生存的(leben)结果11a’以何种程度如之前那样存在。可替代地或与其相结合地,该可信度贡献13a也测量:在学习数据集11a中体现的特性14b在该学习数据集11a转换到域b之后以何种程度类似于至少一个在域b中生存的学习数据集11b的与之对应的特性14b*。
该成本函数13此外包含循环论证贡献13b。该循环论证贡献13b测量:当该转换的在域b中生存的结果11a’又被转换回到域a中时,在域a中的原始的学习数据集11a又以何种程度被一致地再现。该转换回尤其可以利用第二生成器来进行,该第二生成器类似于生成器1地利用与方法100对应的方法来被训练。
在步骤120中,基于成本函数13的值而确定用于能适配的参数12的新的值,这些新的值表征该生成器1的行为。这可以例如利用梯度下降法来进行。
在步骤130中检验:该成本函数13的可信度贡献13a的曲线走向和/或值是否满足预给定的标准13c。如果这是该情况(真实值1),则在步骤140中以经修改的成本函数13’来继续进行该训练,在该经修改的成本函数中,该可信度贡献13a更小地被加权或者被移除。相反,如果该标准13c并不被满足(真实值0),则针对进一步训练,该成本函数13因此保持并不改变。可信度贡献13a的移除或较低加权(untergewichten)尤其是可以考虑如下情况:生成器1的训练正好在开始时容易有这样的转换错误,这些转换错误在从域b转换回域a的情况下再次被补偿。
该训练可以尤其是例如被继续进行,直至满足针对该成本函数13的值和/或曲线走向的预给定的中断条件(abbruchbedingung)。该相应检验在图1中出于一目了然的原因而未描绘出。
根据块102,尤其是可以选择包含图像的学习数据集11a、11b。可替代地或与此相结合地,可以根据块103来选择包含测量数据的时间序列(zeitreihe)的学习数据集11a、11b。一般而言,根据块104可以尤其是选择如下学习数据集11a、11b,这些学习数据集的测量数据已通过观察车辆50的环境51和/或通过观察该车辆50的机组52和/或结构组合件的至少一个状态所获得。
根据块105,可以选择如下物理特性来作为在将学习数据集11a转换到域b的情况下应保持不变的特性14a:其中在域a和b之间的模拟边界条件和/或至少一个物理条件方面的区别并不影响到所述物理特性或者仅以直至预给定的最大度量的方式影响到所述物理特性。这可以例如是在相应的应用的上下文中的学习数据集11a的语义意义。因此,如果例如停止标牌已从域“夏天”转换到域“冬天”并且被积雪,则该停止标牌本身也必须还能识别。
因此,例如可以根据块106来将至少一个位置到至少一个对象的所属性选择为在域转换的情况下应保持不变的特性14a,其中在所述至少一个位置已检测了在学习数据集11a中所记录的物理上能观察的测量参量。
根据块107,可以将物理上能观察的测量参量的通过空间区域的预给定的部分区域聚合的值选择作为在所述域转换的情况下应保持不变的特性14a,其中在该空间区域内已检测了在学习数据集11a中所记录的物理上能观察的测量参量。在这方面可以出现如下表达(ausdruck):在所述域转换的情况下,以物理上能观察的测量参量应主要检测的条件并不根本地改变。
例如,根据块108,可以将在图像的至少一个部分区域内的颜色平均值选择为特性14a、14b,所述特性在域转换的情况下应保持不变或者适应于域b。例如,可以规定:在以信号传达禁令(verbot)的交通标志(诸如禁止超车或速度限制)上,围绕禁令的更详细的标记(bezeichnung)的被保持在红色调的外部的环在域转换之后也应保持红色调。例如,可以规定:在以信号传达命令(gebot)的交通标志上,在其上更详细标记该命令的、保持为蓝色调的背景在所述域转换之后也应保持为蓝色调。
图2示出用于能训练的模块2的训练的方法200的实施例,该模块将一个或多个输入参量21转换成一个或多个输出参量23。能训练的模块的行为通过能适配的参数22来表征。
在步骤210中,具有用于输入参量21的学习值21a的至少一个学习数据集利用之前描述的、训练完成的生成器1从域a转换到域b。在该模块2的训练220的范畴内,将转换到域b的学习值21a’输送给模块2。原本在域a中存在的学习值21a因此可以被利用,以便缓解在域b中的学习值的不足。能训练的模块2可以此外附加地还包含在域a中生存的学习值21a。因此,对图像的内容进行分类的例如能训练的模块2可以不仅使用在域a“夏天”中所记录的学习图像也可以使用由此利用生成器1所生成的在域b“冬天”中生存的学习图像。
在训练220的范畴内检验:用于输入参量21的学习值21a以何种程度通过能训练的模块2而被映射到用于输出参量23的所属的学习值23a。利用成本函数24来评价该一致性。在步骤230中,能训练的模块22的能适配的参数22随着改善成本函数24的值的目标而改变。
该训练可以尤其是例如被继续进行,直至满足用于成本函数24的值和/或曲线走向的预给定的中断条件。相应的检验在图2中出于一目了然的原因而没有被描绘。
根据块205,例如用于所述输入参量的这样的学习值21a可以被选择,其中所述学习值在域a之内基于至少一个在所述学习值中所体现的如下特性而以至少一个用于输出参量23的学习值23a来加标签,其中生成器1在转换的情况下使所述特性保持不变和/或使所述特性与在所述域b中的对应的特性相适应。以这种方式,这些标签也可以在转换到域b之后继续被利用。这意味着,由在域a中生存的经标签的学习值21a而变成在域b中生存的经标签的学习值21a’,而并无需进行重新标签。
在图3中示例性示出的方法300将利用生成器1和能训练的模块2所形成的效应链(wirkkette)合并。在步骤310中,生成器1利用方法100来被训练。在利用该生成器的情况下,在步骤200中,训练能训练的模块2。在步骤330中,能训练的模块2被运行,其方式为,将测量数据输送给该模块作为输入参量21,所述测量数据已通过观察车辆(50)的环境51和/或通过观察该车辆50的机组51和/或结构组合件的至少一个状态所获得。在步骤340中,根据由能训练的模块2所提供的输出参量23利用操控信号3来操控该车辆50和/或该车辆50的机组52或结构组合件。
图4a示意性地示出属于域a的图像11a到属于域b的结果11a’的示例性的域转换。该图像11a包含天空61、树62、草地63和道路64。因为在训练在域转换的情况下所使用的生成器1时已预给定了:在域转换的情况下位置到语义对象61、62、63、64的分配应该是不变的特性14a,在示出这些对象61、62、63、64其中的每个时,图像风格分别改变,但是在结果11a’中应在正确的位置处再次识别出每个对象61、62、63、64。
为了比较,图4b示出了利用并未根据方法100所训练的生成器1来对相同图像11a进行的示例性的域转换。在此,在结果11a中,在其中示出对象61、62、63、64的图像风格并不仅仅分别已被转化(transformieren)到域b,而是也已经在这些对象61、62、63和64之间进行了交换。天空61和树62的图像风格已彼此互换。同样地,草地63和道路64的图像风格已彼此互换。交换在附图标记中得以反映,利用这些附图标记来在图4b中标记在结果11a’中的对象。通过交换,该结果11a’以如下程度不同于在域b中的真实情况:其不再可用作为用于能训练的模块2的训练材料。