决策树模型公平性度量的获取方法、装置、电子设备及存储介质与流程

文档序号:34534632发布日期:2023-06-27 10:51阅读:19来源:国知局
决策树模型公平性度量的获取方法、装置、电子设备及存储介质与流程

本申请涉及计算机,具体涉及一种决策树模型公平性度量的获取方法、装置、电子设备及存储介质。


背景技术:

1、机器学习模型如今被广泛应用于司法、医疗、金融等公共领域的现代决策系统。事实上,在这些环境中引入机器学习的目的之一就是为了规避或减少人类在决策过程中存在的偏见。决策树算法由于其易于实现、效率高、容错能力好等特性,常常被广泛应用于各领域,然而由于其数据驱动、依赖特征选择等特性,许多研究表明其很容易从数据中学习到偏见,以至于产生不公平的模型。目前的一些公平性验证方法,一部分工作从数据分布角度出发,尽管这些方法是有效且具有渐进收敛保证的,但在性能与扩展方面仍有很大的优化空间,也无法处理非布尔属性和复合敏感属性。还有一部分的工作基于样本,关注在给定的固定数据样本上的公平性评估。这类方法基于固定的数据集,通常无法提供基于不同数据分布的健壮性。因此一种能够处理复合敏感属性组合,具有针对不同数据集的健壮性,并可在现实数据集和公平性增强算法上运行的公平性形式化验证方法并进行研究与分析,对于公平性研究具有现实意义。


技术实现思路

1、本发明的主要目的在于提出一种决策树模型公平性度量的获取方法、装置、电子设备及存储介质,旨在弥补当前的启发式公平性验证方法缺乏形式化保证的缺陷,同时提高公平性验证的性能和可扩展性。

2、为实现上述目的,本申请的第一方面提供一种决策树模型公平性度量的获取方法,包括:

3、根据预定义复合敏感群体解析决策树模型;

4、计算决策树模型的各决策节点在敏感群体条件下的概率分布;

5、为所述决策树模型构建pcsp#模型;

6、对所述pcsp#模型进行概率模型检查,得到当前敏感群体阳性预测值;

7、遍历所有所述敏感群体,通过不同公平性定义计算得到公平性度量。

8、本申请提供的基于概率模型检查的决策树公平性验证方法,通过将决策树模型的公平性问题转化为概率问题,通过统计角度对决策树模型的公平性进行验证,提供了从形式化角度对决策树模型的公平性分析。首先,考虑复合敏感属性和非布尔值特征,将传统公平性范围扩大,提供更多潜在偏见的发现;其次,根据两种不同维度的公平性定义,适当宽松得到多个公平性度量公式,通过群体中最受保护群体和最弱势群体的差距来验证群体公平性,不仅考虑了群体之间的不公平性,同时考虑了样本之间的联系;最后,通过将决策树模型转化为等价的马尔科夫决策过程,并生成能够方便进行概率模型检查的pcsp#模型,得到各敏感群体的阳性预测值,简化了建模过程,也提供了公平性度量的扩展。

9、在一些实施例中,所述根据预定义复合敏感群体解析决策树模型,包括:

10、根据预定义复合敏感群体确定敏感属性并标记敏感节点;

11、标记其余内部节点为非敏感节点;

12、提取决策树模型的叶子节点,获得投票分布,计算该叶子节点输出结果。

13、在一些实施例中,所述根据预定义复合敏感群体确定敏感属性并标记敏感节点,包括:

14、根据预定义复合敏感群体确定每个敏感属性;

15、遍历决策树模型各内部节点,若决策特征包含在敏感属性内,则该节点标记为敏感节点。

16、在一些实施例中,所述计算决策树模型的各决策节点在敏感群体条件下的概率分布,包括:

17、敏感节点直接根据预定义敏感群体确定分支;

18、非敏感节点根据概率分布计算各节点特征在敏感群体下条件概率。

19、在一些实施例中,所述为所述决策树模型构建pcsp#模型,包括:

20、构建全局变量保存值变化;

21、对于决策树中每个内部节点,构建相应进程;

22、若节点为敏感节点,则根据确定分支构建后续进程;

23、若节点为非敏感节点,则根据左右孩子满足的敏感群体条件概率和相应后继节点使用选择算子构建进程;

24、对于叶子节点,根据叶子结点输出结果对全局变量进行赋值。

25、在一些实施例中,所述对所述pcsp#模型进行概率模型检查,得到当前敏感群体阳性预测值,包括:

26、利用pat工具对生成的pcsp#模型进行概率模型检查,得到当前敏感群体条件下阳性预测值以及对应的群体。

27、在一些实施例中,所述遍历所有所述敏感群体,通过不同公平性定义计算得到公平性度量,包括:

28、遍历所有可能的敏感群体,得到相应的阳性预测值;

29、将阳性预测值最高的群体定义为最受保护群体;

30、将阳性预测值最低的群体定义为最弱势群体;

31、将两个群体的阳性预测值代入到相应公平性定义公式中,计算得到公平性度量。

32、本申请的第二方面提供了一种决策树模型公平性度量的获取装置,包括:

33、解析模块,用于根据预定义复合敏感群体解析决策树模型;

34、概率分布计算模块,用于计算决策树模型的各决策节点在敏感群体条件下的概率分布;

35、构建模块,用于为所述决策树模型构建pcsp#模型;

36、检查模块,用于对所述pcsp#模型进行概率模型检查,得到当前敏感群体阳性预测值;

37、公平性度量计算模块,用于遍历所有所述敏感群体,通过不同公平性定义计算得到公平性度量。

38、本申请的第三方面提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的决策树模型公平性度量的获取方法。

39、本申请的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的决策树模型公平性度量的获取方法。

40、本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。



技术特征:

1.一种决策树模型公平性度量的获取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据预定义复合敏感群体解析决策树模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据预定义复合敏感群体确定敏感属性并标记敏感节点,包括:

4.根据权利要求1所述的方法,其特征在于,所述计算决策树模型的各决策节点在敏感群体条件下的概率分布,包括:

5.根据权利要求1所述的方法,其特征在于,所述为所述决策树模型构建pcsp#模型,包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述pcsp#模型进行概率模型检查,得到当前敏感群体阳性预测值,包括:

7.根据权利要求1所述的方法,其特征在于,所述遍历所有所述敏感群体,通过不同公平性定义计算得到公平性度量,包括:

8.一种决策树模型公平性度量的获取装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7中任一所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-7中任一所述的方法。


技术总结
本申请公开了一种决策树模型公平性度量的获取方法、装置、电子设备及存储介质。所述方法包括:根据预定义复合敏感群体解析决策树模型;计算决策树模型的各决策节点在敏感群体条件下的概率分布;为所述决策树模型构建PCSP#模型;对所述PCSP#模型进行概率模型检查,得到当前敏感群体阳性预测值;遍历所有所述敏感群体,通过不同公平性定义计算得到公平性度量。该方法基于概率模型检查对决策树模型进行公平性验证,为模型公平性提供了形式化保证;考虑了复合敏感属性的情况,能够处理除了布尔值以外的属性,提供了更丰富的公平性维度;提供了灵活的公平性定义,从不同的公平性角度进行验证。

技术研发人员:史建琦,黄滟鸿,王艳
受保护的技术使用者:上海丰蕾信息科技有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1