本发明涉及一种用于产生训练数据集的方法,该训练数据集用于训练用于墙体诊断设备的人工智能。本发明还涉及一种训练数据集、一种计算单元和一种计算机程序产品。
背景技术:
1、从现有技术中已知用于诊断墙体以及用于探测被构造在墙体中的物体的诊断设备。
技术实现思路
1、本发明的任务是,提供一种改进的用于产生训练数据集的方法的,该训练数据集用于训练墙体诊断设备的人工智能。
2、该任务通过根据本发明的方法来解决。有利实施方式是拓展技术方案的主题。
3、根据一个方面,提供一种计算机实现的用于产生训练数据集的方法,该训练数据集用于训练用于运行测量设备、尤其是墙体诊断设备的人工智能,其中,该方法包括:
4、由分类器模块接收测量设备的至少一个传感器单元的传感器数据,其中,该传感器数据映射具有墙体类型的待诊断的墙体,其中,属于物体类型的物体在墙体中被布置在物体位置上;
5、由分类器模块生成传感器数据在潜空间中的潜空间表示其中,传感器数据的潜空间表示被构造为该传感器数据的降维后的展示(darstellungen);
6、由距离求取模块求取在潜空间中潜空间表示之间的距离;
7、由分类模块基于传感器数据在潜空间中的潜空间表示的距离在墙体的墙体类型和/或物体的物体位置和/或物体类型方面对该传感器数据进行分类,其中,如果在潜空间中的各个潜空间表示彼此之间的距离小于或等于预定义的边界值,那么将该传感器数据分类为配属于共同的类别;以及
8、将分类后的传感器数据汇总到训练数据集中。
9、由此可以得到如下技术优势:可以提供一种改进的用于产生训练数据集的方法,该训练数据集用于训练用于运行测量设备、尤其是墙体诊断设备的人工智能。为此,首先由分类器模块接收测量设备的至少一个传感器单元的传感器数据。在这里,传感器数据映射具有墙体类型的待诊断的墙体和可能被布置在该墙体中的物体。由分类器模块基于该传感器数据生成该传感器数据的潜空间表示。在这里,潜空间表示是传感器数据的降维后的展示。因此,潜空间表示是对传感器数据的编码并且可以以向量形式给出。
10、此外,在潜空间表示之间由距离求取模块求取在潜空间中的距离。基于在潜空间内部的潜空间表示之间的求取到的距离,由分类模块在待诊断的墙体的墙体类型和/或被布置在该墙体中的物体的物体位置和/或物体类型方面对传感器数据进行分类。
11、在这里,这样进行分类:如果一个在潜空间中的潜空间表示到由已经被指派有第一分类的另外的潜空间表示所组成的组的距离小于或等于预确定的距离,那么将该第一分类指派给该潜空间表示。因此,经由对潜空间中的潜空间表示的距离确定可以引起由该潜空间表示所展示(dargestellten)的传感器数据在所展示墙体的墙体类型或者物体的物体位置和/或物体类型方面的精确分类。
12、因此,经由对潜空间表示的距离确定可以实现参考分类特征对传感器数据进行简单且可靠的自动分类。随后,将相应地被分类的传感器数据汇总到训练数据集中。因此可以避免对重新分类的传感器数据实施繁琐的人工分类。
13、分类后的传感器数据在本发明意义上是这样的传感器数据,对这些传感器数据来说,关于分类特征的相应的分类是已知的。分类特征例如可以是墙体的墙体类型和/或物体的物体位置和/或物体类型。因此,对于分类后的传感器数据来说,由该传感器数据映射的墙体的墙体类型和/或由该传感器数据映射的物体的物体位置和/或物体类型是已知的。在这里,分类是在分类特征方面对传感器数据进行标识。传感器数据经由分类被标识,由该传感器数据映射的墙体具有哪个墙体类型,或者由该传感器数据映射的物体具有哪个物体位置和/或物体类型。
14、在这里,未分类的传感器数据可以来自多个测量设备的多个测量,其中,这些测量是在具有不同物体的、不同墙体类型的多个不同的墙体上所实施的。这些测量可以主要是为了产生用于训练数据集的传感器数据,或者是在用户使用测量设备期间所实施的。
15、根据一种实施方式,该方法还包括:
16、如果对应的潜空间表示到训练数据集的其他传感器数据在潜空间中的潜空间表示的距离大于或等于预定义的第二边界值,那么从训练数据集中去除或者说对于训练数据集来说不考虑这些传感器数据。
17、由此可以得到如下技术优势:基于潜空间表示的距离可以从训练数据集中去除或者说对于训练数据集来说可以不考虑传感器数据,这些传感器数据经由距离确定无法被配属给任何物体类别。如果潜空间表示到潜空间中已经被分类的潜空间表示的距离大于或等于预定义的第二边界值,那么无法将由对应的潜空间所表示的传感器数据配属给任何已经被分类的传感器数据的分类。这种不能被分类的传感器数据例如可能基于错误测量并且是有错误的传感器数据。通过对于训练数据集来说不考虑或者说从训练数据集中去除这种传感器数据,可以提高所得到的训练数据集的质量。
18、根据一种实施方式,该方法还包括:
19、由分类器模块生成用于训练数据集的被生成的传感器数据,其中,该生成包括:
20、由分类器模块生成到潜空间中预选出的潜空间表示具有预定义的距离的潜空间表示,其中,该预选出的潜空间表示是预选出的分类的传感器数据;以及
21、由分类器模块生成由被生成的潜空间表示所展示的传感器数据,其中,该被生成的传感器数据具有该预选出的分类;以及
22、将被生成的传感器数据添加至训练数据集。
23、由此可以得到如下技术优势:可以由分类器模块生成用于训练数据集的传感器数据。由此可以避免为了记录用于训练数据集的传感器数据而进行的繁琐的测量。
24、取而代之,可以简单地通过实施分类器模块来生成相应的传感器数据,这些传感器数据不以测量设备的传感器单元的实际测量为基础。为此,首先由分类器模块生成到潜空间中预选出的潜空间表示具有预定义的距离的潜空间表示。如上所述,潜空间表示是向量展示(vektordarstellungen),这些向量展示在其维度上相较于实际的传感器数据有所降低并且是对传感器数据的信息的编码。
25、通过生成相应的向量展示或者说在潜空间中的潜空间表示可以表示相应的传感器数据,该传感器数据实际上不是之前由测量所记录的。通过生成到预选出的潜空间表示具有预定义的距离的潜空间表示,可以实现:新生成的潜空间表示具有该预选出的潜空间表示的预选出的分类。由此可以实现:由被生成的潜空间表示所展示的传感器数据同样具有该预选出的分类。
26、随后,基于相应地被生成的潜空间表示可以通过将该潜空间表示的信息解码为传感器数据的形式来生成相应地由该潜空间表示所展示的传感器数据。通过这种方式可以生成分类后的传感器数据,这些分类后的传感器数据不以传感器单元的实际执行的测量为基础并且具有分别预定义的分类。因此,可以定制地根据符合预期的分类生成传感器数据。因此,训练数据集可以经由任意数量的新生成的传感器数据被扩展,进而被扩大为任意的规模,而无需为此进行繁琐的测量来产生相应的有说服力的传感器数据。
27、此外,训练数据集可以以具有符合预期的分类的传感器数据扩展,即这些传感器数据映射在现有的训练数据集中表示性不足的墙体类型或者物体位置或者物体类型。因此,可以精确地按照训练数据集的需求定制地生成传感器数据,以便生成尽可能全面且均衡的训练数据集,在该数据集中,尽可能大量的不同的墙体类别、物体位置和物体类型都有被表示。
28、根据一种实施方式,分类还包括:
29、相应于分类对训练数据集的传感器数据加标签。
30、由此可以得到如下技术优势:可以产生通过对传感器数据进行分类的同时被加标签的传感器数据。在这里,加标签的传感器数据相当于被标注的传感器数据,在这些被标注的传感器数据中,各自的分类通过相应的标签被标记。由此可以进一步提高相应地被生成的训练数据集的质量。
31、根据一种实施方式,该方法还包括:
32、通过由可视化模块对各个传感器数据的相应的潜空间表示进行可视化来对训练数据集的传感器数据进行可视化。
33、由此可以得到如下技术优势:基于被可视化的潜空间表示,由于潜空间表示彼此之间各自的布置和间距,使得能够将由这些潜空间表示所展示的物体配属给共同的物体类别和/或物体领域。在这里,物体类别是对不同的物体类型的定义。物体领域是多个物体类别的汇总。
34、根据一种实施方式,距离被定义为欧几里得距离。
35、由此可以得到如下技术优势:可以进行简单的距离确定。
36、根据一种实施方式,分类器模块被构造为相应地被训练的人工智能,该人工智能被设置为,用于基于传感器数据生成相应的潜空间表示和/或基于潜空间表示生成相应的传感器数据。
37、由此可以得到如下技术优势:可以提供性能强大且可靠的具有上述特征的分类器模块。
38、根据一种实施方式,分类器模块被构造为生成对抗网络gan(generativeadversarial network),尤其是被构造为具有编码器模块和解码器模块的自动编码器。
39、由此可以得到如下技术优势:可以提供性能强大且可靠的分类器模块。
40、根据一种实施方式,接收到的传感器数据包括加标签的和/或没有标签的传感器数据。
41、由此可以得到如下技术优势:该方法既可以被应用于已经加标签的传感器数据,也可以被应用于直到现在也没有标签的传感器数据。
42、根据一种实施方式,传感器数据包括:雷达传感器的雷达数据,和/或感应传感器和/或涡流电流传感器和/或电容传感器和/或交流电流传感器和/或核磁共振(nmr)传感器和/或超声波传感器的数据。
43、由此可以实现这样的技术优势:通过分别设置为探测不同的物理测量变量的附加传感器的另外的传感器数据,除了雷达传感器单元的雷达数据的信息之外附加的信息也可以汇入到墙体诊断中。这些附加的、优选与雷达传感器单元的雷达数据的信息互补的信息,使得能够进一步提高墙体诊断或物体识别的精度。
44、根据一种实施方式,还参考物体的物体深度和/或物体延展尺度对传感器数据进行分类。
45、由此可以得到如下技术优势:在诊断模块的训练中,进而在诊断模块的墙体诊断中,可以考虑训练数据集中的、与被布置在待检查的墙体中的物体的另外的特征有关的附加信息。
46、根据一种实施方式,物体的物体类型的物体类别包括:金属/非金属物体,用于低压的电缆,带有单相ac信号的电缆,带有多相ac信号的电缆,木质支架,金属支架,塑料管道,注满水的塑料管道(例如自来水管道),未注满水的塑料管道(例如污水管道),和/或其中,墙体的墙体类型的墙体类型类别包括:混凝土墙体,轻型结构/干砌结构墙体,砖砌墙体和/或墙体的砖砌石块,地板供暖设施,墙体供暖设施。
47、由此可以得到如下技术优势:可以对大量的、不同物体类型的不同物体进行识别或者说分类。在这里,测量设备或者说诊断模块可以被训练用于,对通常的、被建造在建筑物墙体中的物体进行探测和分类。这使得能够进行特别精确的墙体诊断,在该墙体诊断中,可以精确且明确地将探测到的物体配属给相应的物体类别。
48、通过精确的物体分类和经由显示单元给用户提供相应的分类信息,使得能够进行尽可能有说服力的墙体诊断。在用户不仅知道物体处于墙体内部以及在哪里、而且还知道探测到的物体是哪个物体类型的情况下,用户可以相应地决定,如何在该探测到的物体实施方面对该墙体的进一步的加工。因此,提供探测到的物体的物体分类的物体类型是墙体诊断的一个关键领域,因为用户基于给出的物体类型可以相应地调整所规划的墙体加工。
49、根据一个方面,提供一种用于训练用于墙体诊断技术的测量设备的人工智能的训练数据集,其中,该训练数据集是通过根据上述实施方式之一所述的用于产生训练数据集的方法所产生的,该训练数据集用于训练用于运行测量设备的人工智能。
50、根据一个方面,提供一种计算单元,其被设置为,实施根据上述实施方式之一所述的用于产生训练数据集的方法和/或用于训练测量设备的人工智能的方法,该训练数据集用于训练用于运行测量设备的人工智能。
51、根据一个方面,提供一种包括指令的计算机程序产品,在通过数据处理单元实施该程序时,所述指令促使该数据处理单元实施根据上述实施方式之一所述的用于产生训练数据集的方法和/或用于训练测量设备的人工智能的方法,该训练数据集用于训练用于运行测量设备的人工智能。