1.本发明涉及人工智能技术领域,尤其涉及一种人工智能的解释方法、装置、设备及存储介质。
背景技术:2.随着人工智能技术的发展,人工智能应用呈现爆发式增长,在人脸识别、自动驾驶、对话系统、金融风控等领域到得到了广泛使用。但是,不同于传统的it应用,当前以机器学习、深度神经网络为代表的人工智能模型(以下简称“模型”)外部数据隐含假设繁多、内部结构复杂、自身运作机理普遍黑箱化,无法用人类可以理解的语言解释模型输入特征与模型结果的影响关系。xai(可解释性人工智能)可以为模型决策提供人类可读的以及可理解的解释,帮助人类理解和信任机器学习算法所产生的结果和输出,建立对模型工作机理的直接理解。
3.当前xai的主要方法分为如下几种:1、基于统计信息提供相关性解释,比如通过特征权重对结果进行解释,这类方法直观、易理解,但似是而非,可解释性不稳定不严谨;2、基于计算逻辑提供过程性解释,比如公开模型的计算过程,这类方法容易建议信任,但计算逻辑不等同于可理解的逻辑,可解释性差;3、基于规则推理提供推理性解释,比如针对规则决策方法的解释,这类方法可解释性强,但局限性大,仅适用于有明确意义的简单规则决策场景中;4、基于因果关系发现提供因果性解释,比如rct试验或ab测试方法,这类方法结果客观稳定,可复用可推演,但其实验性方法受成本、伦理规范约束较多,观测性方法主要研究因子之间的关系,通常不能直接应用到实际业务场景中。
4.综上,目前的xai方法各有优缺,同时可解释性输出的好坏在一定程度上依赖分析师的经验,对结果的解读往往还需要人工参与,自动化程度不高。
技术实现要素:5.本发明提供了一种人工智能的解释方法、装置、设备及存储介质,以实现对人工智能模型决策提供人类可读及可理解的解释。
6.根据本发明的一方面,提供了一种人工智能的解释方法,包括:
7.获取观测数据集,对所述观测数据集进行分析生成目标规则,所述目标规则包括群组划分规则、行为干预规则和定律适配规则;
8.获取所述观测数据集对应的探索目标集,将各所述目标规则与所述探索目标集进行匹配,根据匹配结果生成相应的规则结果对;
9.对各所述规则结果对进行因果关系探索,生成相应的规则因果关系集合;
10.根据所述规则因果关系进行人工智能的解释。
11.进一步地,获取观测数据集,对所述观测数据集进行分析生成目标规则,包括:
12.获取所述观测数据集的特征集合;
13.对所述特征集合中的特征进行分析生成所述目标规则。
14.进一步地,当所述目标规则为所述群组划分规则时,对所述特征集合中的特征进行分析生成所述目标规则,包括:
15.若所述特征为稀疏特征,则根据所述特征的群组划分方式生成所述群组划分规则;
16.若所述特征为稠密特征,则对所述特征进行稀疏化处理,并根据稀疏化处理后的特征的群组划分方式生成所述群组划分规则。
17.进一步地,当所述目标规则为所述行为干预规则时,对所述特征集合中的特征进行分析生成所述目标规则,包括:
18.若所述特征为稀疏特征,则根据对所述特征执行的干预行为生成所述行为干预规则;
19.若所述特征为稠密特征,则对所述特征进行稀疏化处理,并根据对稀疏化处理后的特征执行的干预行为生成所述行为干预规则。
20.进一步地,当所述目标规则为所述定律适配规则时,对所述特征集合中的特征进行分析生成所述目标规则,包括:
21.获取定律集合,将所述定律集合与所述特征进行匹配;
22.根据匹配结果生成所述定律适配规则。
23.进一步地,获取所述观测数据集对应的探索目标集,包括:
24.对所述观测数据集进行扩展,得到扩展数据集;
25.根据所述观测数据集与所述扩展数据集确定所述探索目标集。
26.进一步地,对所述观测数据集进行扩展,包括:
27.利用设定工具对所述观测数据集进行扩展,所述设定工具包括知识图谱、专家知识库和数据库。
28.进一步地,所述规则结果对包括群组划分规则结果对、行为干预规则结果对和定律适配规则结果对,对各所述规则结果对进行因果关系探索,生成相应的规则因果关系集合,包括:
29.对所述群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验;
30.根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合。
31.进一步地,对所述群组划分规则结果对进行分组采样检验,包括:
32.对所述群组划分规则结果对进行分组,对各分组进行随机采样;
33.对随机采样结果进行统计,确定不同分组中的目标分布;
34.相应的,根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合,包括:
35.若所述目标分布为异分布,则所述群组划分规则结果对存在因果效应,若所述目标分布为同分布,则所述群组划分规则结果对不存在因果效应;
36.若所述群组划分规则结果对存在因果效应,则根据所述因果效应生成群组划分规则因果关系集合。
37.进一步地,根据所述因果效应生成群组划分规则因果关系集合,包括:
38.根据所述因果效应获取至少一个影响因子;
39.确定各所述影响因子对应的权重,根据所述至少一个影响因子与对应的权重生成所述群组划分规则因果关系集合。
40.进一步地,对所述行为干预规则结果对进行分组采样检验,包括:
41.将所述行为干预规则结果对划分为第一行为干预规则结果对和第二行为干预规则结果对,所述第一行为干预规则结果对来源于观测数据,所述第二行为干预规则结果对来源于模型数据或反事实数据;
42.分别对所述第一行为干预规则结果对与第二行为干预规则结果对进行分组采样检验,获取相应的分组采样检验结果;
43.相应的,根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合,包括:
44.若所述分组采样检验结果为所述行为干预规则结果对存在因果效应,则根据所述因果效应生成行为干预规则因果关系集合。
45.进一步地,根据所述因果效应生成行为干预规则因果关系集合,包括:
46.根据所述因果效应获取至少一个影响因子;
47.确定各所述影响因子对应的权重,根据所述至少一个影响因子与对应的权重生成所述行为干预规则因果关系集合。
48.进一步地,当所述规则结果对为所述定律适配规则结果对时,对各所述规则结果对进行因果关系探索,生成相应的规则因果关系集合,包括:
49.将所述定律适配规则划分为第一定律适配规则和第二定律适配规则,所述第一定律适配规则包含分组关系,所述第二定律适配规则包含因果关系;
50.将所述第一定律适配规则作为分组条件,对所述定律适配规则结果对进行分组采样检验;
51.根据分组采样检验结果生成第一定律适配规则因果关系集合;
52.提取所述第二定律适配规则中包含的因果关系,并生成所述第二定律适配规则因果关系集合;
53.将所述第一定律适配规则因果关系集合与第二定律适配规则因果关系集合的并集确定为所述定律适配规则因果关系集合。
54.进一步地,对所述群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验,包括:
55.对所述群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行堆叠处理;
56.对堆叠处理后的所述群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验。
57.进一步地,所述方法还包括:
58.获取自定义规则,根据所述自定义规则生成至少一个所述目标规则。
59.进一步地,根据所述自定义规则生成至少一个所述目标规则,包括:
60.对所述自定义规则进行解析,得到至少一个解析规则;
61.根据所述解析规则的类型,将所述解析规则确定为对应的所述目标规则。
62.根据本发明的另一方面,提供了一种人工智能的解释装置,包括:
63.目标规则生成模块,用于获取观测数据集,对观测数据集进行分析生成目标规则,目标规则包括群组划分规则、行为干预规则和定律适配规则。
64.可选的,目标规则生成模块还用于:
65.获取观测数据集的特征集合;对特征集合中的特征进行分析生成目标规则。
66.可选的,当目标规则为群组划分规则时,目标规则生成模块还用于:
67.若特征为稀疏特征,则根据特征的群组划分方式生成群组划分规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据稀疏化处理后的特征的群组划分方式生成群组划分规则。
68.可选的,当目标规则为所述行为干预规则时,目标规则生成模块还用于:
69.若特征为稀疏特征,则根据对特征执行的干预行为生成行为干预规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据对稀疏化处理后的特征执行的干预行为生成行为干预规则。
70.可选的,当目标规则为所述定律适配规则时,目标规则生成模块还用于:
71.获取定律集合,将定律集合与特征进行匹配;根据匹配结果所述定律适配规则。
72.规则结果对生成模块,用于获取观测数据集对应的探索目标集,将各目标规则与探索目标进行匹配,根据匹配结果生成相应的规则结果对。
73.可选的,规则结果对生成模块还用于:
74.对观测数据集进行扩展,得到扩展数据集;根据观测数据集与扩展数据集确定探索目标集。
75.可选的,规则结果对生成模块还用于:
76.利用设定工具对观测数据集进行扩展,设定工具包括知识图谱、专家知识库和数据库。
77.规则因果关系集合生成模块,用于对各规则结果对进行因果关系探索,生成相应的规则因果关系集合。
78.可选的,规则结果对包括群组划分规则结果对、行为干预规则结果对和定律适配规则结果对,规则因果关系集合生成模块还用于:
79.对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验;根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合。
80.可选的,规则因果关系集合生成模块还用于:
81.对群组划分规则结果对进行分组,对各分组进行随机采样;对随机采样结果进行统计,确定不同分组中的目标分布。
82.相应的,若目标分布为异分布,则群组划分规则结果对存在因果效应,若目标分布为同分布,则群组划分规则结果对不存在因果效应;若群组划分规则结果对存在因果效应,则根据因果效应生成群组划分规则因果关系集合。
83.可选的,规则因果关系集合生成模块还用于:
84.根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成群组划分规则因果关系集合。
85.可选的,规则因果关系集合生成模块还用于:
86.将行为干预规则结果对划分为第一行为干预规则结果对和第二行为干预规则结
果对,第一行为干预规则结果对来源于观测数据,第二行为干预规则结果对来源于模型数据或反事实数据;分别对第一行为干预规则结果对与第二行为干预规则结果对进行分组采样检验,获取相应的分组采样检验结果。
87.相应的,若分组采样检验结果为行为干预规则结果对存在因果效应,则根据因果效应生成行为干预规则因果关系集合。
88.可选的,规则因果关系集合生成模块还用于:
89.根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成行为干预规则因果关系集合。
90.可选的,当规则结果对为定律适配规则结果对时,规则因果关系集合生成模块还用于:
91.将定律适配规则划分为第一定律适配规则和第二定律适配规则,第一定律适配规则包含分组关系,第二定律适配规则包含因果关系;将第一定律适配规则作为分组条件,对定律适配规则结果对进行分组采样检验;根据分组采样检验结果生成第一定律适配规则因果关系集合;提取第二定律适配规则中包含的因果关系,并生成第二定律适配规则因果关系集合;将第一定律适配规则因果关系集合与第二定律适配规则因果关系集合的并集确定为定律适配规则因果关系集合。
92.可选的,规则因果关系集合生成模块还用于:
93.对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行堆叠处理;对堆叠处理后的群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验。
94.人工智能解释模块,用于根据规则因果关系进行人工智能的解释。
95.可选的,人工智能的解释装置还包括第二目标规则生成模块,用于获取自定义规则,根据自定义规则生成至少一个目标规则。
96.可选的,第二目标规则生成模块还用于:
97.对自定义规则进行解析,得到至少一个解析规则;根据解析规则的类型,将解析规则确定为对应的目标规则。
98.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
99.至少一个处理器;以及
100.与所述至少一个处理器通信连接的存储器;其中,
101.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的人工智能的解释方法。
102.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的人工智能的解释方法。
103.本发明实施例提供的人工智能的解释方法,首先获取观测数据集,对观测数据集进行分析生成目标规则,目标规则包括群组划分规则、行为干预规则和定律适配规则;然后获取观测数据集对应的探索目标集,将各目标规则与探索目标集进行匹配,根据匹配结果生成相应的规则结果对;再对各规则结果对进行因果关系探索,生成相应的规则因果关系
集合;最后根据规则因果关系进行人工智能的解释。本发明公开的人工智能的解释方法,将规则因果的处理方法具体分为群组划分规则、行为干预规则和定律适配规则三类,以规则为因,分析规则变化对业务绩效的影响,更贴合实际应用场景,避免了传统方式中先进行因子因果分析,再基于因子分析结果分析业务流程变更的影响的繁琐步骤,从而通过规则变更一步到位地优化业务绩效,结果更直观、更可靠,实施也更高效;此外,本发明提出了通用的规则因果自动化发现方法,避免了大量人工分析工作,进一步提升了xai机器学习的工程应用效率。
104.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
105.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
106.图1是根据本发明实施例一提供的一种人工智能的解释方法的流程图;
107.图2是根据本发明实施例一提供的一种人工智能的解释方法的处理过程示意图;
108.图3是根据本发明实施例二提供的一种人工智能的解释方法的流程图;
109.图4是根据本发明实施例二提供的一种ai种植中的特征项示意图;
110.图5为根据本发明实施例三提供的一种人工智能的解释装置的结构示意图;
111.图6是实现本发明实施例四的人工智能的解释方法的电子设备的结构示意图。
具体实施方式
112.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
113.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
114.实施例一
115.图1为本发明实施例一提供了一种人工智能的解释方法的流程图,本实施例可适用于对人工智能模型的决策提供人类可读及可理解的解释的情况,该方法可以由人工智能的解释装置来执行,该人工智能的解释装置可以采用硬件和/或软件的形式实现,该人工智
能的解释装置可配置于电子设备中。如图1所示,该方法包括:
116.s110、获取观测数据集,对观测数据集进行分析生成目标规则。
117.其中,观测数据集是通过调查或观测收集到的数据,是用于进行规则探索与生成的样本数据集合。
118.在本实施例中,利用观测数据集进行规则探索分析后生成的目标规则可以分为三种类型,分别为群组划分规则、行为干预规则和定律适配规则,其中,群组划分规则为群组内在属性相关的规则,行为干预规则为某一或某些特定操作相关的规则,定律适配规则人们所熟知的规律或公理。根据生成的目标规则,可以探索这些规则与结果之间存在的因果效应,即规则因果关系,进一步可以应用规则因果关系提供针对结果的归因性解释,为模型决策提供人类可读的以及可理解的解释,帮助人类理解和信任机器学习算法所产生的结果和输出,建立对模型工作机理的直接理解。
119.可选的,观测数据集的获取方式可以是,选取样本对象,对样本对象进行调查或观测,收集所需的数据并整理为观测数据集。进一步地,实验性探索数据结果是观测数据集的重要补充,还可以将规则探索从观测性方法扩展为实验性发现方法,即通过实验的方式构建观测数据集。例如,可以根据样本对象设计相关实验,并设置感知控制器,通过感知控制器收集实验环境及结果数据,对实验环境及结果数据进行处理后生成观测数据集,在实验过程中还可以将感知控制器对接第三方系统对实验进行控制。
120.进一步地,得到观测数据集后,可以分别进行群组划分规则、行为干预规则和定律适配规则的探索及生成。可选的,不同的规则可以根据观测数据集依次进行探索,也可以并行处理以提高规则探索效率。
121.s120、获取观测数据集对应的探索目标集,将各目标规则与探索目标集进行匹配,根据匹配结果生成相应的规则结果对。
122.其中,探索目标集来源于真实业务场景需要,例如,在ai种植场景下,温室的传感控制器可以感知室内外的光照、温度、湿度等数据,也可以对温室中的co2发生器、开窗控制器、帘幕控制器、灌溉控制器等设备进行控制,观测数据集中包括的特征可以是id(序号)、time(时间)、species(品种)、subclass(子类),outli(室外光照强度)、outtmp(室外温度)、hum(室内湿度)、tmp(室内温度)、co2(室内二氧化炭溶度)、li(室内光照强度),lictrl(光照时间控制)、ventctrl(通风时长控制)、fertirrctrl(施肥灌溉控制),探索目标集可以是结果指标rheight(果长/高)、rwidth(果茎宽度)和rweight(果重)等。
123.可选的,将群组划分规则、行为干预规则和定律适配规则分别以group_rule、do_rule和law_rule表示,将探索目标集以target表示,根据{group_rule|do_rule|law_rule}-{target}集合匹配方式生成规则结果对:group_rule-target对(群组划分规则结果对)、do_rule-target对(行为干预规则结果对)和law_rule-target对(定律适配规则结果对)。其中,对于group_rule-target对和do_rule-target对,可按笛卡尔积方式组合生成;对于law_rule-target对,target的取值必须为law_rule的输出项,在此约束基础之上,再进行笛卡尔积方式组合。将整体规则结果对记为rule-target={group_rule-target|do_rule-target|law_rule-target}。
124.优选地,在目标规则的生成过程中,也可根据探索目标集以逆序方式生成,结果导向,减少不必要的计算,能够进一步提升处理效率。
125.s130、对各规则结果对进行因果关系探索,生成相应的规则因果关系集合。
126.其中,规则因果关系集合是根据各规则与探索目标集中的目标或结果之间的因果效应生成的。对于不同的规则,可以创建相应的探索器,例如,针对群组划分规则、行为干预规则和定律适配规则,相应的探索器可以分别为group探索器、do探索器和law探索器,分别探索三种不同的规则结果对,并生成相应的规则因果关系。
127.优选地,三种规则因果关系集合可以分别表示为causal_g,causal_d和causal_l,分别代表群组划分规则因果关系集合、行为干预规则因果关系集合和定律适配规则因果关系集合,整体的规则因果关系集合可以表示为:causal(rule-》target)={causal_g,causal_d,causal_l}。
128.进一步地,基于本发明自动化规则因果关系探索框架,可进一步地将规则类别支持、规则支持、结果种类支持、分析方法支持等处理环节进行插件化,通过插件的模式进一步提升本发明的灵活性,扩充本发明对未知情况的兼容处理能力。优选地,为进一步提升效率,在不违背本发明核心处理逻辑的前提下,可将处理逻辑迁移至协处理器(gpu、fpga等)、多机集群进行计算。
129.s140、根据规则因果关系进行人工智能的解释。
130.在本实施例中,基于规则因果关系发现,可以对现有结果进行归因性解释,具体解释性步骤可以是:依据causal_g可以将结果归因于特定群组的内在属性影响,即目标target是某一类特定群组的特有结果;依据causal_d可以将结果归因于特定因素的影响,即目标target是某一或某些特定因素操作的综合影响结果;依据causal_l可以将target结果归因于人们所熟知的规律性影响结果。
131.进一步地,由于因果关系具有必然性及稳定性,基于因果关系可进一步地进行因果推理,从而还可以对规则产生的未来影响结果进行推断及干预。
132.进一步地,方法还包括:获取自定义规则,根据自定义规则生成至少一个目标规则。
133.其中,自定义规则为已有的规则,可以通过对自定义规则进行解析得到上述规则类型,即群组划分规则、行为干预规则和定律适配规则。
134.可选的,根据自定义规则生成至少一个目标规则的方式可以是:对自定义规则进行解析,得到至少一个解析规则;根据解析规则的类型,将解析规则确定为对应的目标规则。
135.具体的,可以通过语法分析方式对自定义规则进行解析,将自定义规则分解为一个或多个符合上述规则类型的子规则,接着对解析后的子规则进行因果分析,最后按因果推理的方式组合输出自定义规则的因果分析结果。
136.图2是本实施例提供的一种人工智能的解释方法的处理过程示意图,如图所示,对于获取的观测数据集,首先对观测数据集进行分析生成目标规则的集合,目标规则包括群组划分规则、行为干预规则和定律适配规则,相应的可以采用不同的规则探索器进行分析;然后获取观测数据集对应的探索目标集,将各目标规则与探索目标集进行匹配,根据匹配结果生成相应的规则结果对;再对各规则结果对进行因果关系探索,生成相应的规则因果关系集合,其中,对于不同的规则结果对可以采用对应的探索器进行规则因果关系的生成;最后根据规则因果关系进行人工智能的解释,得到归因性xai。
137.本发明公开的人工智能的解释方法,将规则因果的处理方法具体分为群组划分规则、行为干预规则和定律适配规则三类,以规则为因,分析规则变化对业务绩效的影响,更贴合实际应用场景,避免了传统方式中先进行因子因果分析,再基于因子分析结果分析业务流程变更的影响的繁琐步骤,从而通过规则变更一步到位地优化业务绩效,结果更直观、更可靠,实施也更高效;此外,本发明提出了通用的规则因果自动化发现方法,避免了大量人工分析工作,进一步提升了xai机器学习的工程应用效率。
138.实施例二
139.图3为本发明实施例二提供的一种人工智能的解释方法的流程图,本实施例为上述实施例的细化。如图3所示,该方法包括:
140.s210、获取观测数据集的特征集合。
141.在本实施例中,观测数据集可以由采样对象的一个或多个特征对应的数据组成的。例如,若采样对象为某一人群,根据研究目标的需要,观测数据集的特征字段可以包括性别、年龄、教育程度等,观测数据集即采样对象针对各特征的统计数据。
142.可选的,令观测数据集的特征集合为{f1、f2
…
fn},其中,f1、f2
…
fn为特征项,各特征项可以为稠密特征(dense feature),也可以为稀疏特征(sparse feature)。
143.s220、对特征集合中的特征进行分析生成目标规则。
144.在本实施例中,针对目标规则的不同类型(群组划分规则、行为干预规则和定律适配规则),可以采用不同的分析方法生成相应的规则。
145.可选的,当目标规则为群组划分规则时,对特征集合中的特征进行分析生成目标规则的方式可以是:若特征为稀疏特征,则根据特征的群组划分方式生成群组划分规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据稀疏化处理后的特征的群组划分方式生成群组划分规则。
146.具体的,当目标规则为群组划分规则时,可以遍历观测数据集的特征集合{f1、f2
…
fn}。若fi为稀疏特征sparse feature,则可以将fi赋值集作为群组划分的treatments集fi_st,即fi_st={fi_v1、fi_v2
…
},其中,fi_v1、fi_v2
…
为fi的各赋值,对应的群组划分规则记为fi{vj}。若fi为稠密特征dense feature,则可以通过分位数或其他稀疏化方法对fi值进行稀疏化处理,稀疏化处理方法记为sf,群组划分的treatments集为fi_dt,fi_dt={fi_sf1、fi_sf2
…
},其中,fi_sf1、fi_sf2
…
为对fi的赋值进行稀疏化处理后的结果,对应的群组划分规则记为fi{sfk}。最终,输出的整体群组划分规则集可以表示为:group_rule={fi{vj|sfk}}。
147.可选的,当目标规则为行为干预规则时,对特征集合中的特征进行分析生成目标规则的方式可以是:若特征为稀疏特征,则根据对特征执行的干预行为生成行为干预规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据对稀疏化处理后的特征执行的干预行为生成行为干预规则。
148.具体的,当目标规则为行为干预规则时,可以遍历观测数据集的特征集合{f1、f2
…
fn}。若fi为稀疏特征sparse feature,则可对观测数据集执行set干预行为(例如可以将fi的具体值由valuea设置为valueb),对应的行为干预规则为fi_sd={fi_sdo(vj)},其中vj属于fi的赋值集,可以简记为fi{do(vj)}=fi{vj-》vj’}。若fi为稠密特征dense feature,则类似地可以通过分位数或其他稀疏化方法对fi进行稀疏化处理,再基于稀疏化
后的结果集进行tune干预操作,即针对fi的具体值进行增减,从而实现稀疏化结果的变更,对应的行为干预规则为fi_td={fi_tdo(sfn_vk))},其中sfn_vk属于fi赋值稀疏化操作sf(vk)的结果集,可以简记为fi{do(sfk)}=fi{sfk-》sfk’}。最终,输出的整体的干预行为规则集为do_rule={fi{do(vj|sfk)}}。
149.可选的,当目标规则为定律适配规则时,对特征集合中的特征进行分析生成目标规则的方式可以是:获取定律集合,将定律集合与特征进行匹配;根据匹配结果生成定律适配规则。
150.具体的,当目标规则为定律适配规则时,可以通过语义解析模块遍历观测数据集的特征集合{f1、f2
…
fn},并与定律集进行语义匹配,并输出定律对应的定律适配规则。其中,语义解析、语义匹配可以是现有的自然语言处理(natural language processing,nlp)技术,定律集的内容可为定理、定律、经验等,以规则形式存储。进一步地,定律集中定律对应的推理形式可为:{
…
fc(input[]-》output[])
…
},其中,fc为因果函数或推理规则,fc可以有多组,每组fc可以有多个输入及输出。将输入字段及输出字段与特征项进行匹配,若匹配,则后继可在特征项实施推理操作,若未匹配,则可将新输出增加为新特征项。最终的定律适配规则集为law_rule={fc(i-》o)}。
[0151]
s230、对观测数据集进行扩展,得到扩展数据集。
[0152]
在本实施例中,观测数据集中包含一个或多个特征项,可通过特征项扩展的方式对观测数据集进行扩展。特征项扩展的方式可以为根据原有特征项得到语义相似或与原特征项存在推理逻辑的扩展特征项,得到扩展特征项的方法可以为语义相似技术或基于知识图谱的推理方法等。可以将原特征项和扩展特征项分别记为fi和ext(fi),相应的观测数据集与扩展数据集分别为{f1、f2
…
fn}和{ext(f1)、ext(f2)
…
ext(fn)}。
[0153]
进一步地,对观测数据集进行扩展的方式可以是:利用设定工具对观测数据集进行扩展,其中,设定工具包括知识图谱、专家知识库和数据库。
[0154]
可选的,针对因果关系中存在的“一果多因”、“多因一果”、“原因背后的原因”等特点,为进一步提升规则因果的准确性,可以借助知识图谱、专家知识库、关系型数据库等工具对特征项进行扩展,引入与现有特征项存在关联的新的特征,拓展数据集的特征及特征关系。
[0155]
s240、根据观测数据集与扩展数据集确定探索目标集。
[0156]
其中,探索目标集来源于真实业务场景需要,探索目标的设置可以直接为特征项或特征项的扩展。
[0157]
可选的,可以将探索目标集记为target={fi|ext(fi)},其中fi为原观测数据集中的已有特征项,ext(fi)为扩展特征项,探索目标集中可有多个特征项。
[0158]
s250、将各目标规则与探索目标集进行匹配,根据匹配结果生成相应的规则结果对。
[0159]
其中,规则结果对是目标规则与探索目标集中存在匹配关系的规则与目标的组合。
[0160]
可选的,以group_rule、do_rule和law_rule分别表示群组划分规则、行为干预规则和定律适配规则,以{target}表示探索目标集,则可以根据{group_rule|do_rule|law_rule}-{target}集合匹配方式生成规则结果对,其中,规则结果对包括群组划分规则结果
对、行为干预规则结果对和定律适配规则结果对,可以分别以group_rule-target、do_rule-target和law_rule-target表示。
[0161]
进一步地,对于group_rule
–
target对和do_rule-target对,可按笛卡尔积方式组合生成;对于law_rule-target对,target的取值必须为law_rule的输出项,在此约束基础之上,再进行笛卡尔积方式组合。最终的规则结果对可以记为rule-target,rule-target={group_rule-target|do_rule-target|law_rule-target}。
[0162]
以ai种植场景为例,温室的传感控制器可以感知室内外的光照、温度、湿度等数据,也可以对温室中的co2发生器、开窗控制器、帘幕控制器、灌溉控制器等设备进行控制。图4是本发明实施例提供的一种ai种植中的特征项示意图,如图所示,观测数据集中包括的特征可以是id(序号)、time(时间)、species(品种)、subclass(子类),outli(室外光照强度)、outtmp(室外温度)、hum(室内湿度)、tmp(室内温度)、co2(室内二氧化炭溶度)、li(室内光照强度),lictrl(光照时间控制)、ventctrl(通风时长控制)、fertirrctrl(施肥灌溉控制),探索目标集可以是结果指标rheight(果长/高)、rwidth(果茎宽度)和rweight(果重)等。利用规则探索器生成规则结果对,规则探索器接收到以rweight为果的群组划分规则生成任务grouprule(rweight)后,在观测数据集的特征项集中以rweight为果,以除结果特征项rheight(果长/高)、rwidth(果茎宽度)、rweight(果重)之外的特征项作为因探索集合,进行因果特征工程处理,因果特征工程方法有基于约束的因果特征工程方法gsmb、iamb、iambnpc、mmmb、bamb、eemb和kiamb等,基于评分的因果特征工程方法gsbn、mmhc、pcdbypcd等。
[0163]
在群组划分规则结果对的生成中,选择直接因作为规则集生成的处理对象,选择的特征项为:subclass(子类)、li(室内光照强度)、hum(室内湿度)、tmp(室内温度)、co2(室内二氧化炭溶度)、fertirrctrl(施肥灌溉控制),因果强度(causal intensity,ci)排序为:ci(subclass-》rweight)》ci(fertirrctrl-》rweight)》ci(li-》rweight)》ci(tmp-》rweight)》ci(hum-》rweight)》ci(co2-》rweight),可以按二八原则取top2强度的因果关系生成群组划分规则,其中subclass为稀疏特征,fertirrctrl、li为稠密特征。subclass值集为{sweet pepper、color pepper、pepper、large fruit tomato、cherry tomato、fruit cucumber、dense spines cucumber},对应编码为subclassid={0,1,2,3,4,5,6},subclass对应的群组划分规则为subclass{0,1,2,3,4,5,6};fertirrctrl、li按3分位数方法将稠密值转换为稀疏值,对应的群组划分规则为fertirrctrl{le,be,gt}。最终将生成的群组划分规则与探索目标指标rweight进行组合输出群组划分规则因果对为:group_rule-target={subclass{0,1,2,3,4,5,6}-》rweight,fertirrctrl{le,be,gt}-》rweight}。
[0164]
在行为干预规则结果对的生成中,可直接复用上述步骤中的因果特征工程结果,但取所有的直接因为规则生成处理对象,对于稀疏特征按编码组合处理,对于稠密特征统一按3分位数方法处理,处理后的特征项集合为subclass{0,1,2,3,4,5,6}、fertirrctrl{le,be,gt}、li{le,be,gt}、tmp{le,be,gt}、hum{le,be,gt}、co2{le,be,gt},最终组合输出的do规则因果对为:do_rule-taget={do(subclass{0,1,2,3,4,5,6})-》rweight,do(fertirrctrl{le,be,gt})-》rweight,do(li{le,be,gt})-》rweight,do(tmp{le,be,gt})-》rweight,do(hum{le,be,gt})-》rweight,do(co2{le,be,gt})-》rweight}。
[0165]
在定律适配规则结果对的生成中,以large fruit tomato为例的知识库存储结构
及信息如表1所示。
[0166]
表1
[0167][0168]
如表1所示,定律适配知识库的关键字段有时间、昼温、夜温、光照强度、土壤含水量、湿度、土壤ph值,将知识库关键字与特征项名称进行语义匹配,可使用dssm、mv-dssm、arc-i、arc-i等算法,语义匹配的结果为:time-时间、time+tmp-昼温/夜温、li-光照强度、hum-湿度,知识库中土壤含水量、土壤ph值未找到匹配的特征项,基于匹配结果进行定律适配规则的提取,定律集中定律的推理形式为{fc(time-》tmp),fc(time-》li),fc(time-》hum)},对应于不同生长期(发芽期、幼苗期、生长期、开花期、果实期)下large fruit tomato对温度、光照、湿度的最佳经验设置,系统可据此使用历史经验,比如根据time字段判断当前温室的large fruit tomato处于开花期,则温室湿度最佳值应处于60-65之间。最终组合输出的定律适配规则因果对为:raw_rule-target={fc(time-》tmp)-》rweight,fc(time-》li)-》rweight,fc(time-》hum)-》rweight}。
[0169]
s260、对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验。
[0170]
其中,规则结果对包括群组划分规则结果对、行为干预规则结果对和定律适配规则结果对。
[0171]
在本实施例中,对群组划分规则结果对进行分组采样检验的方式可以是:对群组划分规则结果对进行分组,对各分组进行随机采样;对随机采样结果进行统计,确定不同分组中的目标分布。
[0172]
可选的,可以基于探索器自动发现规则因果关系,探索器包含group探索器、do探索器和law探索器,分别探索三种不同的规则因果对。
[0173]
具体的,对于group探索器,首先可以将群组划分规则group_rule中的各规则fi{vj|sfk}值分别发送给独立样本分配器,由独立样本分配器进行分组采样,采样方式为分组随机采样,其采样结果应当满足因果分析假设。其中因果分析假设条件通常为可忽略性假设或个体处理稳定性假设,在实际操作中可根据业务需要适当放松假设条件。分组采样检验方式可以为:不同分组间每个特征变量的p值(置信度)均大于阈值(通常为0.05)。然后可以统计不同分组中的target分布,若分组间target分布为异分布,则说明存在因果效应;
若分组间target分布为同分布,则无因果效应。分组间分布检验方式通常可以为t检验、ks检验、kl散度检验等。
[0174]
在本实施例中,对行为干预规则结果对进行分组采样检验的方式可以是:将行为干预规则结果对划分为第一行为干预规则结果对和第二行为干预规则结果对,第一行为干预规则结果对来源于观测数据,第二行为干预规则结果对来源于模型数据或反事实数据;分别对第一行为干预规则结果对与第二行为干预规则结果对进行分组采样检验,获取相应的分组采样检验结果。
[0175]
具体的,对于do探索器,可以假设数据有2类来源,第一类来源于真实世界的观测数据,第二类来源于模型空间数据或反事实试验数据。基于第一类来源数据的因果关系发现方法为:首先将行为干预规则do_rule中的各规则{vj|sfk-》vj’|sfk’}发送给独立样本分配器,独立样本分配器根据vj|sfk及vj’|sfk’进行分组采样,将采样结果分别记为g及g’,采样结果应当满足因果分析假设。g与g’分组采样检验方式可以为:不同分组间每个特征变量的p值(置信度)均大于阈值(通常为0.05)。基于第二类来源数据的因果关系发现方法为:首先基于观测数据集进行模型学习拟合{vj|sfk}与{targeti},使用的模型可以为机器学习(machine learning,ml)模型比如逻辑回归(logisticregression,lr)、xgboost等,也可以为深度学习(deep learning,dl)模型比如神经网络模型等。学习后的拟合模型记为m,可以使用拟合模型m的输出值做为do反事实假设空间的值,即target’=m(vj|sfk),或者以实验性方法得出反事实假设的结果,同样记为target’。进一步地,针对反事实结果,可进一步引入预训练模型的结果做为反事实结果,通过预训练模型的方式将已有知识、经验引入到规则因果发现的处理过程中。
[0176]
进一步地,对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验的方式可以是:对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行堆叠处理;对堆叠处理后的群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验。
[0177]
在本实施例中,为进一步提升效率,可以将多组规则因果发现处理进行堆叠。堆叠方法可以分为物理堆叠及逻辑堆叠两种,可同时实施。物理堆叠是基于不同的采样分组,并行地执行不同的规则因果发现任务;逻辑堆叠是将相互不影响的规则因果发现任务合并,在一个采样分组中执行任务。简而言之,可通过物理堆叠提升规则因果发现的并行度,通过逻辑堆叠减少处理任务的工作量,从而进一步提升规则因果发现的效率。
[0178]
s270、根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合。
[0179]
在本实施例中,对应于上一步骤中的不同规则结果对的分组采样检验,可以分别对分组检验的结果进行分析,根据其中的因果效应生成相应的规则因果关系。
[0180]
可选的,对于group探索器,根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合的方式可以是:若目标分布为异分布,则群组划分规则结果对存在因果效应,若目标分布为同分布,则群组划分规则结果对不存在因果效应;若群组划分规则结果对存在因果效应,则根据因果效应生成群组划分规则因果关系集合。
[0181]
具体的,可以统计不同分组中的target分布,若分组间target分布为异分布,则说明存在因果效应;若分组间target分布为同分布,则无因果效应。分组间分布检验方式通常可以为t检验、ks检验、kl散度检验等。最后,根据因果效应抽取因果关系集合,以group_
causal1表示群组划分规则因果关系集合,其计算方式为
[0182]
进一步地,根据因果效应生成群组划分规则因果关系集合的方式可以是:根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成群组划分规则因果关系集合。
[0183]
具体的,针对一果多因的情况,可以通过模型拟合(比如线性拟合)的方式得到因果影响关系集合,权重系数为不同因子的影响权重,这种情况下的群组划分规则因果关系集合以group_causal2表示,其计算方式为其中δi为因果关系权重。
[0184]
最后,group探索器的整体输出为群组划分规则因果关系集合,即causal_g={group_causal1,group_causal2}。
[0185]
可选的,对于do探索器,根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合的方式可以是:若分组采样检验结果为行为干预规则结果对存在因果效应,则根据因果效应生成行为干预规则因果关系集合。
[0186]
具体的,可以将g’分组中的target’作为do(vj|sfk)操作的target值。根据真实空间与假设空间的因果效应抽取因果关系集合,计算方式为根据观测空间与反事实空间的因果效应抽取因果关系集合,计算方式为的因果效应抽取因果关系集合,计算方式为
[0187]
进一步地,根据因果效应生成行为干预规则因果关系集合的方式可以是:根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成行为干预规则因果关系集合。
[0188]
具体的,针对一果多因的情况,可以通过模型拟合(比如线性拟合、倾向性评分回归等)的方式得到因果影响关系集合,权重系数为不同因子的影响权重,计算方式为其中δi为因果关系权重。
[0189]
最后,do探索器的整体输出为行为干预规则因果关系集合,即causal_d={do_causal1|do_causal2|do_causal3}。
[0190]
进一步地,当规则结果对为定律适配规则结果对时,对各规则结果对进行因果关系探索,生成相应的规则因果关系集合的方式可以是:将定律适配规则划分为第一定律适配规则和第二定律适配规则,第一定律适配规则包含分组关系,第二定律适配规则包含因果关系;将第一定律适配规则作为分组条件,对定律适配规则结果对进行分组采样检验;根据分组采样检验结果生成第一定律适配规则因果关系集合;提取第二定律适配规则中包含的因果关系,并生成第二定律适配规则因果关系集合;将第一定律适配规则因果关系集合与第二定律适配规则因果关系集合的并集确定为定律适配规则因果关系集合。
[0191]
具体的,对于law探索器,由于定律适配规则默认包含分组关系或因果关系,因此可将law_rule做为分组条件进行,在不同分组间进行比对,从而得出因果关系,输出因果效应,记为对于包含因果关系的定律适配规则,也可以从包含因果
关系的law_rule中提取结果因子,作为因果效应输出,记为i-》o。所以law探索器的输出为》o。所以law探索器的输出为基于law探索器输出的因果效应,可直接作为结果方式使用,也可以作为新的因果推断的输入使用。
[0192]
进一步地,针对定律适配规则处理,既可基于形式也可基于语义进行扩展,可进一步基于语义解析、语义匹配技术将特征项与现有的知识库、知识图谱中的节点建立映射关系,从而既能够利用和扩展更多的历史知识和经验,也能够利用第三方知识系统的推理能力,进一步提升扩展性。
[0193]
经过上述自动化规则因果关系发现,观测数据集中的所有规则因果关系可表示为:causal(rule-》target)={causal_g,causal_d,causal_l}。
[0194]
举例说明,在ai种植场景中,对于群组划分规则因果关系,group探索器收到群组划分规则结果对group_rule-taget={subclass{0,1,2,3,4,5,6}-》rweight,fertirrctrl{le,be,gt}-》rweight},解析该规则因果对并分解为2个随机样本集生成任务dataset_subclass{0,1,2,3,4,5,6}及dataset_fertirrctrl{le,be,gt},将样本集生成任务发送给样本独立分配器。样本独立分配器收到随机样本集生成任务后,进行随机采样通过检测后,再将随机样本集发送给group探索器。样本集生成过程以dataset_subclass{0,1,2,3,4,5,6}为例,样本独立分配器在测数据集中以subclass进行分组随机采样,本实施例中每组采样数为1000,采样结束后分别输出7组随机样本集,分别记为dataset_subclass_0、dataset_subclass_1
……
dataset_subclass_6。接着对随机样本集除subclass及结果项之外的特征项进行p值检验,若所有p值大于0.05则样本集通过检验,否则重新进行采样。group探索器收到随机样本集后,通过平均因果效应来判断subclass及fertirrctrl特征项对产量rweight影响的因果关系。同样以subclass为例说明此过程,7组随机采样集的rweight均值数据如表2所示,
[0195]
表2
[0196][0197]
以平均产量最小的组为对照组,即subclass id=2的分组为对照组,因此代表以subclass_i替代subclass_2为研究对象,为subclass_i替代subclass_2的平均因果效应ate(subclass_i)=rweight_i
–
rweight_2。因此针对subclass特征项分组,最终输出的因果关系集合为
[0198]
类似地可以得出group_causal_fertirrctrl。最终group探索器输出结果为causal_g={group_causal_subclass,group_causal_fertirrctrl}。
[0199]
对于行为干预规则因果关系,do探索器收到do_rule-taget={do(subclass{0,1,2,3,4,5,6})-》rweight,do(fertirrctrl{le,be,gt})-》rweight,do(li{le,be,gt})-》rweight,do(tmp{le,be,gt})-》rweig ht,do(hum{le,be,gt})-》rweight,do(co2{le,be,gt})-》rweight},do探索器解析规则因果后将6个do探索子任务合并为1个do探索任务,一次性分析多个因素对一个结果的影响关系。合并后的do探索任务为{rweight|do(subclass,fertirrctrl,li,tmp,hum,co2)}。do探索为反事实探索,反事实结果可以来源于观测数据,也可以来源于试验性数据。对于第1种情况“反事实结果来源于观测数据”:do探索器生成随机样本集生成任务dataset_{subclass,fertirrctrl,li,tmp,hum,co2},并发送给样本独立分配器。样本独立分配器收到随机样本集生成任务后,进行随机采样通过检测后,再将随机样本集发送给do探索器。反事实模型m采用线性模型,do探索器基于随机样本集数据,进行线性回归学习,得到反事实模型m,记为m=α1subclass+α2fertirrctrl+α3li+α4tmp+α5hum+α6co2,反事实结果即为反事实模型的推理结果。随机样本集的rweight均值为15kg/m2,以计算li的因果效应为例,即如果不改变subclass、fertirrctrl等设置,仅改变光照强度为le程度,会导致产量平均下降3kg/m2。类似的可以得出其他所有do探索结果,最终结果汇总为对于第2种情况“反事实结果来源于试验性数据”,do探索器生成随机样本集g生成任务dataset_{subclass,fertirrctrl,li,tmp,hum,co2}以及试验样本集g’采集任务,并发送给样本独立分配器。样本独立分配器收到随机样本集生成任务后,进行随机采样通过检测后,再将随机样本集g发送给do探索器,随机样本集的rweight均值为15kg/m2。实验性数据的产生遵循对照试验的基本要求,可采用单项参数调整的试验方式,以fertirrctrl水平设置为gt为例,do探索器向温室传感控制器发送控制指令,改变温室的fertirrctrl水平,温室fertirrctrl改变后,传感控制器定时采集各项数据并发送给规则因果归因性xai系统形成试验性样本数据集g’,计算g’数据集的rweight均值为17kg/m2,则即灌溉施肥的水平设置为gt,可导致产品提升2kg/m2。类似的可以得出其他所有do探索结果,最终结果汇总为
[0200]
对于定律适配规则因果关系,law探索器收到raw_rule-target={fc(time-》tmp)-》rweight,fc(time-》li)-》rweight,fc(time-》hum)-》rweight},解析规则因果对并分解为3个随机样本集生成任务dataset_fc{time-》tmp}、dataset_fc{time-》li}及dataset_fc{time-》hum},并将样本集生成任务发送给样本独立分配器。可以采用直接从观测集中生成的方式,样本独立分配器收到随机样本集生成任务,按不同的law规则进行分组采样,形成多个分组采样样本集。以dataset_fc(time-》hum)为例,对于subclass为large fruit tomato,其time可分为发芽期、幼苗期、生长期、开花期、果实期,样本独立分配器按不同时期分别取2组样本集,分别为符合定律的样本集g,以及不符合定律的样本集g’,以
large fruit tomato子品类,发芽期样本集生成为例,首先以time=3-5为条件筛选样本,在筛选结果中再以hum=80-90以及hum=!(80-90)分为2组,在2组中进行随机采样,采样结果需要满足充分随机检测条件,符合发芽期湿度规律的样本分组为g,不符合的一组为g’,分别计算g及g’分组rweight均值为8与6,则对于large fruit tomato品类,发芽期湿度定律的因果效应为律的因果效应为即符合发芽期定律会导致产量提升2kg/m2。类似的可以得出其他所有law探索结果,最终结果汇总为2kg/m2。类似的可以得出其他所有law探索结果,最终结果汇总为
[0201]
经过上述三种类别的规则因果关系自动发现,所有的规则因果关系集合汇总为causal(rule-》target)={causal_g,causal_d,causal_l},接着规则因果关系自动发现模块将causal(rule-》target)发送给xai解释模块进行人工智能的解释。
[0202]
s280、根据规则因果关系进行人工智能的解释。
[0203]
在本实施例中,基于规则因果关系发现,可以对现有结果进行归因性解释,具体解释性步骤可以是:依据causal_g可以将结果归因于特定群组的内在属性影响,即目标target是某一类特定群组的特有结果;依据causal_d可以将结果归因于特定因素的影响,即目标target是某一或某些特定因素操作的综合影响结果;依据causal_l可以将target结果归因于人们所熟知的规律性影响结果。
[0204]
以ai种植为例,xai解释模块接收到规则因果关系集causal(rule-》target),根据可解释性报告的设置要求,根据特征项段在causal(rule-》target)中查找相关规则因果关系,根据规则因果关系针对探索目标给出解释。其中,可解释性报告展示内容定义为如下3部分:选品品质、温室控制、规范规律性,其中选品品质与特征项字段species(品种)、subclass(子类)匹配,温室控制与特征项字段time(时间)、hum(室内湿度)、tmp(室内温度)、co2(室内二氧化炭溶度)、li(室内光照强度)、lictrlhours(光照时间控制)、ventctrl(通风时长控制)、fertirrctrl(施肥灌溉控制)匹配,规范规律性与系统的知识库内容相匹配,此部分匹配范围的设置主要源于上层业务应用的场景,如不设置,则可以默认为全部特征项或知识库内容。
[0205]
本发明实施例首先获取观测数据集的特征集合,然后对特征集合中的特征进行分析生成目标规则,再对观测数据集进行扩展,得到扩展数据集,再根据观测数据集与扩展数据集确定探索目标集,再将各目标规则与探索目标集进行匹配,根据匹配结果生成相应的规则结果对,再对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验,再根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合,最后根据规则因果关系进行人工智能的解释。本发明公开的人工智能的解释方法,将规则因果的处理方法具体分为群组划分规则、行为干预规则和定律适配规则三类,以规则为因,分析规则变化对业务绩效的影响,更贴合实际应用场景,避免了传统方式中先进行因子因果分析,再基于因子分析结果分析业务流程变更的影响的繁琐步骤,从而通过规则变更一步到位地优化业务绩效,结果更直观、更可靠,实施也更高效;此外,本发明提出了通用的规则因果自动化发现方法,避免了大量人工分析工作,进一步提升了xai机器学习的工程应用效率。
[0206]
实施例三
[0207]
图5为本发明实施例三提供的一种人工智能的解释装置的结构示意图。如图5所
示,该装置包括:目标规则生成模块310,规则结果对生成模块320,规则因果关系集合生成模块330和人工智能解释模块340。
[0208]
目标规则生成模块310,用于获取观测数据集,对观测数据集进行分析生成目标规则,目标规则包括群组划分规则、行为干预规则和定律适配规则。
[0209]
可选的,目标规则生成模块310还用于:
[0210]
获取观测数据集的特征集合;对特征集合中的特征进行分析生成目标规则。
[0211]
可选的,当目标规则为群组划分规则时,目标规则生成模块310还用于:
[0212]
若特征为稀疏特征,则根据特征的群组划分方式生成群组划分规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据稀疏化处理后的特征的群组划分方式生成群组划分规则。
[0213]
可选的,当目标规则为所述行为干预规则时,目标规则生成模块310还用于:
[0214]
若特征为稀疏特征,则根据对特征执行的干预行为生成行为干预规则;若特征为稠密特征,则对特征进行稀疏化处理,并根据对稀疏化处理后的特征执行的干预行为生成行为干预规则。
[0215]
可选的,当目标规则为所述定律适配规则时,目标规则生成模块310还用于:
[0216]
获取定律集合,将定律集合与特征进行匹配;根据匹配结果所述定律适配规则。
[0217]
规则结果对生成模块320,用于获取观测数据集对应的探索目标集,将各目标规则与探索目标进行匹配,根据匹配结果生成相应的规则结果对。
[0218]
可选的,规则结果对生成模块320还用于:
[0219]
对观测数据集进行扩展,得到扩展数据集;根据观测数据集与扩展数据集确定探索目标集。
[0220]
可选的,规则结果对生成模块320还用于:
[0221]
利用设定工具对观测数据集进行扩展,设定工具包括知识图谱、专家知识库和数据库。
[0222]
规则因果关系集合生成模块330,用于对各规则结果对进行因果关系探索,生成相应的规则因果关系集合。
[0223]
可选的,规则结果对包括群组划分规则结果对、行为干预规则结果对和定律适配规则结果对,规则因果关系集合生成模块330还用于:
[0224]
对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验;根据分组采样检验结果进行因果关系分析,生成相应的规则因果关系集合。
[0225]
可选的,规则因果关系集合生成模块330还用于:
[0226]
对群组划分规则结果对进行分组,对各分组进行随机采样;对随机采样结果进行统计,确定不同分组中的目标分布。
[0227]
相应的,若目标分布为异分布,则群组划分规则结果对存在因果效应,若目标分布为同分布,则群组划分规则结果对不存在因果效应;若群组划分规则结果对存在因果效应,则根据因果效应生成群组划分规则因果关系集合。
[0228]
可选的,规则因果关系集合生成模块330还用于:
[0229]
根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成群组划分规则因果关系集合。
[0230]
可选的,规则因果关系集合生成模块330还用于:
[0231]
将行为干预规则结果对划分为第一行为干预规则结果对和第二行为干预规则结果对,第一行为干预规则结果对来源于观测数据,第二行为干预规则结果对来源于模型数据或反事实数据;分别对第一行为干预规则结果对与第二行为干预规则结果对进行分组采样检验,获取相应的分组采样检验结果。
[0232]
相应的,若分组采样检验结果为行为干预规则结果对存在因果效应,则根据因果效应生成行为干预规则因果关系集合。
[0233]
可选的,规则因果关系集合生成模块330还用于:
[0234]
根据因果效应获取至少一个影响因子;确定各影响因子对应的权重,根据至少一个影响因子与对应的权重生成行为干预规则因果关系集合。
[0235]
可选的,当规则结果对为定律适配规则结果对时,规则因果关系集合生成模块330还用于:
[0236]
将定律适配规则划分为第一定律适配规则和第二定律适配规则,第一定律适配规则包含分组关系,第二定律适配规则包含因果关系;将第一定律适配规则作为分组条件,对定律适配规则结果对进行分组采样检验;根据分组采样检验结果生成第一定律适配规则因果关系集合;提取第二定律适配规则中包含的因果关系,并生成第二定律适配规则因果关系集合;将第一定律适配规则因果关系集合与第二定律适配规则因果关系集合的并集确定为定律适配规则因果关系集合。
[0237]
可选的,规则因果关系集合生成模块330还用于:
[0238]
对群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行堆叠处理;对堆叠处理后的群组划分规则结果对、行为干预规则结果对和定律适配规则结果对进行分组采样检验。
[0239]
人工智能解释模块340,用于根据规则因果关系进行人工智能的解释。
[0240]
可选的,人工智能的解释装置还包括第二目标规则生成模块350,用于获取自定义规则,根据自定义规则生成至少一个目标规则。
[0241]
可选的,第二目标规则生成模块350还用于:
[0242]
对自定义规则进行解析,得到至少一个解析规则;根据解析规则的类型,将解析规则确定为对应的目标规则。
[0243]
本发明实施例所提供的人工智能的解释装置可执行本发明任意实施例所提供的人工智能的解释方法,具备执行方法相应的功能模块和有益效果。
[0244]
实施例四
[0245]
图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0246]
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被
至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0247]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0248]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如人工智能的解释方法。
[0249]
在一些实施例中,人工智能的解释方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的人工智能的解释的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行人工智能的解释方法。
[0250]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0251]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0252]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、
磁储存设备、或上述内容的任何合适组合。
[0253]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0254]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0255]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0256]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0257]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。