用于对信号进行分类和/或对信号执行回归分析的设备和方法与流程

文档序号:32797704发布日期:2023-01-03 22:48阅读:39来源:国知局

1.本发明涉及用于确定输入信号的分类和/或回归结果的方法、用于训练机器学习系统的方法、机器学习系统、用于训练机器学习系统的设备、计算机程序和计算机可读存储介质。
现有技术
2.hastie等人的2009“10. boosting and additive trees”in the elements of statistical learning公开了一种用于增强型分类(boosted classification)的方法。


背景技术:

3.在各种技术领域中,使用机器学习系统来进行分类和/或回归分析已经变得普遍。尤其是对于机器人应用,机器学习系统被大量地用于例如从相应机器人的周围环境的传感器数据推断出知识。这里,尤其是神经网络被广泛地应用,因为它们构成了关于预测性能的现有技术。
4.大多数机器学习系统并且特别是神经网络中的一个主要缺点是:它们针对所提供的输入确定了错误的预测,但是仍然在它们的预测中输出高置信度。当然,这是非常不合期望的,这是因为如果机器学习系统对它自己的预测是确信的(confident),人们就会希望该机器学习系统是正确的,并且如果它的预测是错误的,人们就会对它不确信。


技术实现要素:

5.给定这个背景,本发明涉及一种用于确定表征输入信号的分类和/或回归结果的输出信号的计算机实现方法,包括以下步骤:a. 确定表征输入信号的特征表示;b. 确定表征特征表示的分类和/或回归结果的中间信号;c. 基于特征表示和中间信号来预测中间信号与输入信号的期望输出信号的偏差;d. 根据所确定的偏差来适配中间信号,由此确定经适配的信号;e. 提供经适配的信号作为输出信号。
6.特征表示、中间信号和偏差优选地均由机器学习系统来确定。因此,该方法可以被理解为用于预测输入信号的分类和/或回归结果的方法,其中该预测是自校正的(self-corrected)。这意味着,在该预测实际上作为输出信号被发出(put out)之前,该方法自动地校正不正确的预测。
7.输入信号是技术信号。它可以优选地表征从传感器获得的数据。传感器可以是例如光学传感器,例如相机传感器、雷达传感器、lidar、超声波或热相机。从这些示例性传感器获得的数据可以全部被认为是图像。还可能的是,输入信号表征来自音频传感器、诸如麦
克风的数据。还可能的是,输入信号表征从压电传感器、温度传感器、或用于测量压力的传感器获得的数据。特别地,输入信号还可以表征来自不同类型的传感器的数据或/和来自单个传感器类型的多个数据(例如,来自立体相机传感器的两个图像)。因此,该方法可以被理解为由虚拟传感器执行的方法,即,用于检测不能够直接从传感器数据本身导出的传感器信号中的内容的方法。
8.输出信号可以表征输入信号的分类和/或回归结果。术语“回归结果”可以被理解为来自用于执行回归分析的方法的结果。换句话说,虽然用于分类的方法被理解为输出离散数据(例如,类别标签),但是回归结果是表征输入信号的连续值。术语“分类”被理解为包括不同类型的分类。例如,对象检测、语义分割、多标签分类和多类别分类全部被理解为落在更一般的术语“分类”下。输出信号还可以表征回归结果和分类两者,例如,以对象检测的形式,其中该方法对对象是否存在于图像的某个部分中进行分类,并且其中该方法进一步关于该对象的大小(例如,图像中或现实世界中的该对象的大小)执行回归。
9.中间信号可以理解为如下信号:该信号也可以可能地用作输出信号,但是它可以在作为输出信号被发出之前在该方法中被校正。
10.输出信号尤其可以用于控制致动器。例如,输出信号可以用作用于确定包括致动器的机器人的控制信号的基础。输入信号可以例如表征机器人的周围环境,并且控制信号可以被确定为使得机器人与其环境适当地交互。例如,输入信号可以表征机器人的周围环境的图像,并且输出信号可以表征环境中的对象的存在和/或位置。然后可以确定控制信号,使得机器人移动到期望位置而不与对象碰撞。
11.所提出的方法的优点在于:由输出信号表征的分类和/或回归结果被校正,使得其更紧密地匹配于期望输出信号,即,改进了输出信号的质量。尤其是当使用机器学习系统来确定输出信号时,机器学习信号可能会输出相对于期望输出信号不准确的输出信号,而机器学习系统却仍然确信它提供了准确的输出信号。
12.在优选实施例中,特征表示由第一机器学习系统使用作为第一机器学习系统的输入的输入信号来确定,并且中间信号由第二机器学习系统使用作为第二机器学习系统的输入的特征表示来确定,并且该偏差由第三机器学习系统使用作为第三机器学习系统的输入的特征表示和中间信号来确定。第一、第二和第三机器学习系统可以被理解为第四机器学习系统的部分,该第四机器学习系统即包括第一、第二和第三机器学习系统的机器学习系统。
13.特征表示可以被理解为输入信号的优选地高维的编码。优选地,第一神经网络用于确定特征表示。在这种情况下,当提供输入信号作为输入时,特征表示可以是第一神经网络的层、优选地隐藏层的输出。特征表示可以是向量,或者可以被重新成形(reshape)为向量。在特征向量是向量的情况下,第二机器学习模型和/或第三机器学习模型尤其可以分别是多层感知器。
14.优选地,第一、第二和第三机器学习系统均是神经网络。发明人发现,当针对第一、第二和第三机器学习系统使用神经网络时,输出信号是最准确的。
15.该偏差可以例如表征中间信号与期望输出信号之间的度量或半度量(semimetric)(例如,余弦相似性)。例如,中间信号和期望输出信号可以均以向量的形式,并且该偏差可以是这两个向量之间的欧几里德距离或曼哈顿距离。这里应当注意的是,在
该方法中,期望输出信号不是必需的,如在确定分类和/或回归结果时常见的那样。对该偏差的预测不依赖于期望输出信号、即输入信号的地面真值的存在。期望输出信号可以被理解为输入信号的隐含性质。例如,示出了对象的图像可以被理解为隐含地包含关于对象的位置和范围(extent)的信息。
16.虽然对于例如训练机器学习系统而言,可能需要期望输出信号,但是对于用于预测输出信号的所提出的方法而言,并非是这种情况。
17.该偏差还可以表征中间信号相对于期望输出信号足够准确的概率。例如,可以定义中间信号与期望输出信号之间的距离,其中该距离表征中间信号针对其相对于期望输出信号仍然足够准确的最大距离。在该方法中预测的偏差然后可以表征中间信号处于与期望输出信号的该最大距离内的概率。
18.在优选实施例中,步骤c.和d.被迭代地重复,直到满足退出标准,其中经适配的信号被用作下一个迭代中的中间信号。
19.换句话说,步骤c.和d.可以在环路中运行,直到满足退出标准。退出标准可以例如表征以下各项:所执行的迭代的预定义最大数量、和/或表征中间信号与输出信号的小于或等于预定义阈值的差异的偏差。
20.发明人发现,迭代地适配中间表示在输出信号的准确度方面产生了甚至更大的增加。作为附加的技术效果,发明人发现,当使用表征了表征中间信号与输出信号的小于或等于预定义阈值的差异的偏差的退出标准时,满足该退出标准所必要的迭代数量表征了关于确定足够准确的输出信号有多难的信息。该信息可以用作不确定性量度,即,所必要的步骤越多,就越难以确定针对输入信号的输出信号,并且输出信号中的不确定性越大。
21.在优选实施例中,该偏差是通过可微分模型来预测的,并且中间信号是基于相对于中间信号的该偏差的梯度来适配的。
22.这种方法可以被理解为相对于中间信号的该偏差上的梯度下降,即优化中间信号。
23.不管模型的类型如何,中间信号也可以根据其他优化方法来适配,尤其是根据黑盒优化方法,诸如演化算法。对于优化而言,该偏差被用作目标值,并且中间表示被用作待优化的变量。
24.在优选实施例中,还可能的是,第二机器学习系统是神经网络,并且第二机器学习系统的隐藏层的输出被用作去往用于确定该偏差的第三机器学习系统的附加输入。
25.这可以被理解为提供去往第二机器学习系统的附加输入,即第二机器学习系统的层的输出。发明人发现,这更进一步改进了输出信号的准确度。
26.在另一方面,本发明涉及一种用于训练根据上述规范所配置的第四机器学习系统的计算机实现方法,其中训练包括以下步骤:f. 训练第四机器学习模型的第二机器学习模型、或者第四机器学习模型的第一机器学习模型和第二机器学习模型,以确定针对所提供的第一训练输入信号的期望输出信号;g. 在训练了第二机器学习模型之后或者在训练了第一机器学习模型和第二机器学习模型之后,训练第三机器学习模型以确定针对所提供的第二训练输入信号的从第一机器学习模型和第二机器学习模型确定的中间信号与针对所提供的第二训练输入信号的期
望输出信号的偏差,其中,不训练第一机器学习模型和第二机器学习模型。
27.该方法可以被理解为启用了如上面所详细说明的用于确定输出的方法。该训练过程可以被理解为两个阶段的方法。首先,训练第四机器学习系统以能够预测中间信号。其次,训练第四机器学习系统以校正中间信号。有可能的是,经预处理的机器学习系统被用作第一机器学习系统,并且第一机器学习系统在该训练过程期间不被训练。优选地,第一机器学习系统和第二机器学习系统两者在该训练过程的第一阶段(步骤f.)期间被训练,因为发明人发现,这产生了稍后在推理期间(即,当执行来自上文的用于确定输出信号的方法时)输出信号的准确度方面的改进。
28.第一阶段的训练可以被理解为对第一机器学习系统和/或第二机器学习系统的监督训练。在监督训练中,输入信号被用于训练,该输入信号即训练输入信号,其中针对每个训练输入信号,提供期望输出信号。
29.在第二阶段(步骤g.)期间,第一机器学习系统和第二机器学习系统的参数可以优选地被冻结,并且仅第三机器学习系统的参数可以被优化。第三机器学习系统的训练数据可以被理解为结合中间信号与期望输出信号的相应偏差从训练输入信号所预测的中间信号。换句话说,为了训练第三机器学习系统,训练输入信号通过第一机器学习模型被转发,并且所得到的特征表示然后通过第二模型被转发,以便确定中间输出。所确定的特征表示和中间信号然后被用作针对第三机器学习系统的训练输入。作为要从第三机器学习系统预测的期望偏差,针对训练输入信号的期望输出信号和中间信号之间的偏差可以被确定。然后,可以使用针对训练输入信号所确定的特征表示和针对训练输入信号所确定的中间信号作为用于训练第三机器学习系统的自变量、并且使用期望偏差作为用于训练第三机器学习系统的因变量来以监督方式训练第三机器学习系统。
30.如果第一机器学习系统或第二机器学习系统是神经网络,则它们可以优选地在步骤f.中使用梯度下降算法来训练。同样地,如果第三机器学习系统是神经网络,则它可以优选地在步骤g.中使用梯度下降算法来训练。
31.如本说明书中较早详述的那样,期望偏差还可以表征二进制变量,该二进制变量指示中间信号与期望输出信号之间的距离是否等于或低于预定义阈值。
32.将参考以下各图更详细地讨论本发明的实施例。各图示出了:图1 机器学习系统;图2 包括机器学习系统的控制系统,该机器学习系统控制处于其环境中的致动器;图3 控制至少部分自主的机器人的控制系统;图4 控制制造机器的控制系统;图5 控制自动个人助理的控制系统;图6 控制医学分析系统的控制系统;图7 控制阀的控制系统;图8 用于训练机器学习系统的训练系统。
具体实施方式
33.图1示出了机器学习系统(60)的实施例,其中机器学习系统(60)被配置成确定针
对输入信号(x)的输出信号(y),其中输出信号(y)表征分类和/或回归结果。
34.输入信号(x)被提供给第一机器学习系统(61),其中第一机器学习系统(61)是机器学习系统(60)的一部分。在该实施例中,第一机器学习系统(61)是神经网络。在进一步的实施例中,其他机器学习系统(诸如,支持向量机或随机森林)也有可能作为第一机器学习系统(61)。第一机器学习系统(61)确定输入信号(x)的特征表示(f)。优选地,特征表示(f)是以向量的形式。
35.特征表示(f)然后被提供给机器学习系统(60)的第二机器学习系统(62)。第二机器学习系统(62)优选地是神经网络。第二机器学习系统(62)被配置成基于特征表示(f)来确定中间信号(i)。中间信号(i)表征针对特征表示(f)获得的分类和/或回归结果。因此,中间信号(i)可以被理解为表征输入信号(x)的分类和/或回归结果。例如,中间信号(i)可以表征在第二机器学习系统(62)的softmax操作之后获得的多个类别的概率。
36.中间信号(i)和特征表示(f)被用作第三机器学习系统(63)的输入,第三机器学习系统(63)是机器学习系统(60)的一部分。第三机器学习系统(63)被配置成预测中间信号(i)与输入信号(x)的期望输出信号之间的偏差(d)。
37.预测偏差(d)然后被转发到机器学习系统(60)的决策单元(64)。决策单元(64)基于预测偏差(d)来决定是否适配该信号。如果偏差(d)小于或等于预定义阈值,则中间信号(i)被发出作为机器学习系统(60)的输出信号(y)。否则,决策单元(64)结合第二机器学习系统(62)来确定经适配的信号。在所描绘的实施例中,确定相对于中间信号(i)的该偏差的梯度(g),并且然后基于偏差(d)的梯度下降来确定经适配的信号。如果中间信号(i)是softmax操作的结果,则可以优选地相对于softmax操作的输入(即,logit)来确定梯度,并且然后可以通过根据该梯度的负方向来适配logit并且将所得到的信号传递通过softmax操作从而确定经适配的信号。在进一步的实施例(未示出)中,可以使用其他优化方法来确定经适配的信号,其中该偏差被用作目标值。其他优化方法可以是例如演化算法。在任何情况下,经适配的信号然后作为中间信号(i)被提供给第三机器学习系统(63)以再次确定偏差(d)。
38.确定偏差(d)并且基于偏差(d)来适配中间信号(i)的过程被重复达预定义的迭代量,或者被重复直到偏差(d)小于或等于预定义阈值。在进一步的实施例中,可以应用其他退出标准,例如,在运行机器学习系统(60)的计算机已经消耗了预定义的能量预算之后退出。在任何情况下,在满足退出标准之后,中间信号(i)被提供作为机器学习系统(60)的输出信号(y)。
39.图2示出了处于其环境(20)中的致动器(10)的实施例,其中基于机器学习系统(60)的输出信号(y)来控制致动器(10)。致动器(10)与控制系统(40)交互。致动器(10)以及其环境(20)将被统称为致动器系统。在优选地均匀间隔开的时间点处,传感器(30)感测致动器系统的状况。传感器(30)可以包括若干个传感器。优选地,传感器(30)是取得环境(20)的图像的光学传感器。传感器(30)的输出信号(s)(或者,在传感器(30)包括多个传感器的情况下,是每一个传感器的输出信号(s))被传输到控制系统(40),该输出信号(s)对感测到的状况进行编码。
40.由此,控制系统(40)接收传感器信号(s)的流。然后,它取决于传感器信号(s)的流来计算一系列控制信号(a),这些控制信号(a)然后被传输到致动器(10)。
41.控制系统(40)在可选的接收单元(50)中接收传感器(30)的传感器信号(s)的流。接收单元(50)将传感器信号(s)变换成输入信号(x)。替代地,在没有接收单元(50)的情况下,可以将每个传感器信号(s)直接取作输入信号(x)。输入信号(x)可以例如作为来自传感器信号(s)的摘录(excerpt)而给出。替代地,可以处理传感器信号(s)以产生输入信号(x)。换句话说,根据传感器信号(s)来提供输入信号(x)。
42.输入信号(x)然后被传递到机器学习系统(60)。
43.机器学习系统(60)由参数(φ)来参数化,该参数(φ)被存储在参数存储装置(st1)中并且由其提供。
44.机器学习系统(60)从输入信号(x)来确定输出信号(y)。输出信号(y)表征输入信号(x)的分类和/或回归结果。输出信号(y)被传输到可选的转换单元(80),该转换单元(80)将输出信号(y)转换成控制信号(a)。控制信号(a)然后被传输到致动器(10)以用于相应地控制致动器(10)。替代地,输出信号(y)可以被直接取作控制信号(a)。
45.致动器(10)接收控制信号(a),被相应地控制,并且实行与控制信号(a)相对应的动作。致动器(10)可以包括控制逻辑,该控制逻辑将控制信号(a)变换成进一步的控制信号,该进一步的控制信号然后用于控制致动器(10)。
46.在进一步的实施例中,控制系统(40)可以包括传感器(30)。在更进一步的实施例中,控制系统(40)替代地或附加地可以包括致动器(10)。
47.在仍进一步的实施例中,可以设想的是,代替于致动器(10)或者除了致动器(10)之外,控制系统(40)控制显示器(10a)。
48.此外,控制系统(40)可以包括至少一个处理器(45)和其上存储有指令的至少一个机器可读存储介质(46),所述指令如果被实行,则使得控制系统(40)实行根据本发明的方面的方法。
49.还可能的是,控制系统(40)的机器学习系统(60)被配置成执行回归分析。在这种情况下,从机器学习系统(60)预测的输出信号(y)包括连续值,这些连续值然后被转发到可选的转换单元(80)。
50.图3示出了一实施例,其中控制系统(40)用于控制至少部分自主的机器人,例如,至少部分自主的车辆(100)。
51.传感器(30)可以包括一个或多个视频传感器和/或一个或多个雷达传感器和/或一个或多个超声传感器和/或一个或多个lidar传感器。这些传感器中的一些或全部优选地但不一定集成在车辆(100)中。因此,输入信号(x)可以被理解为输入图像,并且机器学习系统(60)可以被理解为图像分类器。
52.图像分类器(60)可以被配置成基于输入图像(x)来检测至少部分自主的机器人附近的对象。输出信号(y)可以包括表征对象位于至少部分自主的机器人附近何处的信息。然后可以根据该信息来确定控制信号(a),例如以避免与检测到的对象碰撞。
53.优选地集成在车辆(100)中的致动器(10)可以通过车辆(100)的制动器、推进系统、引擎、传动系或转向装置来给出。控制信号(a)可以被确定为使得致动器(10)被控制,使得车辆(100)避免与检测到的对象碰撞。还可以根据图像分类器(60)认为检测到的对象最可能是什么(例如,行人或树木)来对检测到的对象进行分类,并且可以取决于该分类来确定控制信号(a)。例如,致动器(10)可以是刹车装置(break),并且控制信号(a)可以被选择
为使得如果车辆(100)与预定义阈值相比更接近检测到的对象,则车辆(100)刹车。
54.替代地或附加地,控制信号(a)也可以用于控制显示器(10a),例如用于显示由图像分类器(60)检测到的对象。还可以想象的是,如果车辆(100)接近于与检测到的对象中的至少一个发生碰撞,则控制信号(a)可以控制显示器(10a),使得其产生警告信号。警告信号可以是警告声音和/或触觉信号,例如车辆的方向盘的振动。
55.在进一步的实施例中,至少部分自主的机器人可以通过另一个移动机器人(未示出)来给出,该另一个移动机器人可以例如通过飞行、游泳、潜水或步行来移动。该移动机器人尤其可以是至少部分自主的割草机、或至少部分自主的清洁机器人。在所有上述实施例中,控制信号(a)可以被确定为使得该移动机器人的推进单元和/或转向装置和/或制动器被控制,使得该移动机器人可以避免与所述所标识的对象碰撞。
56.在进一步的实施例中,至少部分自主的机器人可以通过园艺机器人(未示出)来给出,该园艺机器人使用传感器(30)、优选地是光学传感器来确定环境(20)中的植物的状态。致动器(10)可以控制用于喷洒液体的喷嘴和/或切割设备,例如刀片。取决于植物的所标识品种和/或所标识状态,可以确定控制信号(a)以使得致动器(10)向植物喷洒适当量的适当液体和/或对植物进行切割。
57.在更进一步的实施例中,至少部分自主的机器人可以通过家用电器(未示出)来给出,该家用电器如例如洗衣机、炉子、烤箱、微波炉或洗碗机。传感器(30)(例如,光学传感器)可以检测将经历由家居电器进行的处理的对象的状态。例如,在该家用电器是洗衣机的情况下,传感器(30)可以检测洗衣机内部的衣物的状态。然后,可以取决于衣物的检测到的材料来确定控制信号(a)。
58.图4中示出的是一实施例,其中控制系统(40)用于控制制造系统(200)的制造机器(11),例如冲压切割器、切割器、枪钻或夹具,例如作为生产线的一部分。该制造机器可以包括运输设备(例如,传送带或装配线),该运输设备移动所制造的产品(12)。控制系统(40)控制致动器(10),致动器(10)又控制制造机器(11)。致动器(10)可以例如是打开或关闭夹具的电气或液压驱动器。
59.传感器(30)可以通过捕获例如所制造的产品(12)的性质的光学传感器来给出。机器学习系统(60)因此可以被理解为图像分类器。
60.图像分类器(60)可以确定所制造的产品(12)关于运输设备的位置。然后,可以取决于所制造的产品(12)的所确定的位置来控制致动器(10),以用于所制造的产品(12)的后续制造步骤。例如,可以控制致动器(10),以在所制造的产品本身的特定位置处切割所制造的产品。替代地,可以设想的是,图像分类器(60)对所制造的产品是否破损或展现出缺陷进行分类。然后,可以控制致动器(10)以便从运输设备中移除所制造的产品。
61.图5中示出的是一实施例,其中控制系统(40)用于控制自动个人助理(250)。传感器(30)可以是光学传感器,例如用于接收用户(249)的手势的视频图像。替代地,传感器(30)也可以是音频传感器,例如用于接收用户(249)的语音命令。
62.控制系统(40)然后确定用于控制自动个人助理(250)的控制信号(a)。控制信号(a)是根据传感器(30)的传感器信号(s)来确定的。传感器信号(s)被传输到控制系统(40)。例如,机器学习系统(60)可以被配置成例如实行手势识别算法以标识用户(249)做出的手势。控制系统(40)然后可以确定控制信号(a)以用于传输到自动个人助理(250)。然后,它将
控制信号(a)传输到自动个人助理(250)。替代地,机器学习系统(60)可以被配置成用于音频分类,以对用户(249)说出的语音命令进行分类。
63.例如,控制信号(a)可以根据由机器学习系统(60)识别的所标识的用户手势或所标识的语音命令来确定。它可以包括如下信息:该信息使得自动个人助理(250)从数据库中检索信息并以适合由用户(249)接收的形式来输出该检索到的信息。
64.在进一步的实施例中,可以设想的是,代替于自动个人助理(250),控制系统(40)控制家用电器(未示出),该家用电器是根据所标识的用户手势来控制的。该家用电器可以是洗衣机、炉子、烤箱、微波炉或洗碗机。
65.图6中示出的是由控制系统(40)控制的医学成像系统(500)的实施例。成像系统可以例如是mri装置、x射线成像装置或超声成像装置。传感器(30)可以例如是取得患者的至少一个图像的成像传感器,该图像例如显示患者的不同类型的身体组织。
66.机器学习系统(60)然后可以确定所感测的图像的至少部分的分类。因此,该图像的该至少部分被用作去往机器学习系统(60)的输入图像(x)。因此,机器学习系统(60)可以被理解为图像分类器。
67.然后,可以根据该分类来选择控制信号(a),由此控制显示器(10a)。例如,图像分类器(60)可以被配置成检测所感测的图像中的不同类型的组织,例如通过将该图像中显示的组织分类为恶性或良性组织。这可以借助于由图像分类器(60)对输入图像(x)进行的语义分割来完成。然后可以确定控制信号(a)以使得显示器(10a)显示不同的组织,例如通过显示输入图像(x)并且以相同的颜色对相同组织类型的不同区域进行着色。
68.在进一步的实施例(未示出)中,成像系统(500)可以用于非医学目的,例如以确定工件的材料性质。在这些实施例中,图像分类器(60)可以被配置成接收工件的至少部分的输入图像(x)并且执行对输入图像(x)的语义分割,由此对工件的材料性质进行分类。然后可以确定控制信号(a)以使得显示器(10a)显示输入图像(x)以及关于检测到的材料性质的信息。
69.图7示出了用于控制阀(10)的控制系统(40)的实施例。在该实施例中,传感器(30)是感测可以由阀(10)输出的流体的压力的压力传感器。特别地,机器学习系统(60)可以被配置成基于压力值的时间序列(x)来确定由阀(10)分配的流体的注入量。
70.特别地,阀(10)可以是内燃机引擎的燃料注入器(injector)的一部分,其中阀(10)被配置成将燃料注入到内燃机引擎中。基于所确定的注入量,阀(10)然后可以在未来的注入过程中以如下这样的方式被控制,使得过于大量的所注入的燃料或过于少量的所注入的燃料被相应地补偿。
71.替代地,还可能的是,阀(10)是农业肥料系统的一部分,其中阀(10)被配置成喷洒肥料。基于所喷洒的肥料的所确定的量,阀(10)然后可以在未来的喷洒操作中以如下这样的方式被控制,使得过量的所喷洒的肥料或不足量的所喷洒的肥料被相应地补偿。
72.图8示出了用于借助于训练数据集(t)来训练控制系统(40)的机器学习系统(60)的训练系统(140)的实施例。训练数据集(t)包括用于训练机器学习系统(60)的多个输入信号(xi),其中训练数据集(t)针对每个输入信号(xi)进一步包括期望输出信号(ti),该期望输出信号(ti)对应于输入信号(xi)并且表征输入信号(xi)的分类和/或回归结果。
73.训练以两个阶段来进行。在第一阶段中,训练数据单元(150)访问计算机实现的数
据库(st2),该数据库(st2)提供训练数据集(t)。训练数据单元(150)从训练数据集(t)优选地随机确定至少一个输入信号(xi)和对应于输入信号(xi)的期望输出信号(ti),并且将输入信号(xi)传输到机器学习系统(60)。机器学习系统(60)基于输入信号(xi)来确定中间信号(yi)。
74.期望输出信号(ti)和所确定的中间信号(yi)被传输到修改单元(180)。
75.基于期望输出信号(ti)和所确定的中间信号(yi),修改单元(180)然后确定用于机器学习系统(60)的新参数(φ')。具体地,新参数(φ')是针对第二机器学习系统(62)来确定的。在进一步的实施例中,新参数(φ')还可以包括第一机器学习系统(61)的新参数(φ')。为了确定新参数(φ'),修改单元(180)使用损失函数来比较期望输出信号(ti)和所确定的中间信号(yi)。损失函数确定第一损失值,该第一损失值表征所确定的中间信号(yi)与期望输出信号(ti)相差多远。在给定的实施例中,负对数似然函数被用作损失函数。在替代实施例中,其他损失函数也是可设想到的。
76.此外,有可能的是,所确定的中间信号(yi)和期望输出信号(ti)均包括多个子信号,例如以张量的形式,其中期望输出信号(ti)的子信号对应于所确定的中间信号(yi)的子信号。例如,有可能的是,机器学习系统(60)被配置成用于对象检测,并且第一子信号关于输入信号(xi)的部分来表征对象的出现概率,并且第二子信号表征该对象的确切位置。如果所确定的中间信号(yi)和期望输出信号(ti)包括多个对应的子信号,则优选地针对每个对应的子信号借助于合适的损失函数来确定第二损失值,并且将所确定的第二损失值适当地组合以形成第一损失值,例如借助于加权和。
77.修改单元(180)基于第一损失值来确定新参数(φ')。在给定的实施例中,这是使用梯度下降方法、优选地是随机梯度下降、adam或adamw来完成的。在进一步的实施例中,训练还可以基于用于训练神经网络的演化算法或二阶方法。
78.在其他优选实施例中,训练的第一阶段被迭代地重复达预定义数量的迭代步骤,或者被迭代地重复直到第一损失值落到预定义阈值以下。替代地或附加地,还可能的是,当关于测试或验证数据集的平均第一损失值落到预定义阈值以下时,终止训练的第一阶段。在迭代中的至少一个中,在先前迭代中确定的新参数(φ')被用作机器学习系统(60)的参数(φ),特别是用作第二机器学习系统(62)、或者第一机器学习系统(61)和第二机器学习系统(62)的参数。
79.在训练的第二阶段中,确定第三机器学习系统(63)的新参数(φ')。为此,如在训练的第一阶段中那样,从数据集(t)来确定输入信号(xi)和期望输出信号(ti)。针对输入信号(xi)从第一机器学习系统(61)来确定特征表示(f),并且从第二机器学习系统(62)来确定中间信号(yi)。特征表示(f)和中间表示(yi)被用作第三机器学习系统(63)的输入。附加地,第二机器学习系统(62)的隐藏层的输出可以被用作第三机器学习系统(63)的输入。
80.基于所提供的输入,在第二阶段中训练第三机器学习系统(63),以预测所确定的中间信号(yi)与期望输出信号(ti)的偏差。该偏差可以例如由度量(例如,欧几里德距离)或半度量(例如,余弦距离)来表征。该偏差由修改单元(180)确定,并且随后在修改单元(180)中被使用,以便确定该偏差相对于第三机器学习系统(63)的参数的梯度。基于该梯度,修改单元(180)确定第三机器学习系统的新参数(φ')。如第一阶段那样,第二阶段可以被迭代地重复达预定义数量的迭代步骤,或者被迭代地重复直到该偏差落到预定义阈值以下。替
代地或附加地,还可能的是,当关于测试或验证数据集的平均偏差落到预定义阈值以下时,终止训练的第二阶段。在迭代中的至少一个中,在先前迭代中确定的新参数(φ')被用作机器学习系统(60)的参数(φ),特别是用作第三机器学习系统(63)的参数。
81.此外,训练系统(140)可以包括至少一个处理器(145)和包含指令的至少一个机器可读存储介质(146),所述指令在被处理器(145)执行时使得训练系统(140)执行根据本发明的方面之一的训练方法。
82.术语“计算机”可以被理解为覆盖用于处理预定义计算规则的任何设备。这些计算规则可以采用软件、硬件、或软件和硬件的混合的形式。
83.一般而言,“多个”可以理解为被编入索引,也就是说,该多个中的每个元素被指派唯一的索引,优选地通过将连续的整数指派给该多个中包含的元素。优选地,如果多个包括n个元素,其中n是该多个中的元素的数量,则向这些元素指派从1到n的整数。还要理解的是,该多个中的元素可以通过它们的索引被访问。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1