具有被配置为生成可解释结果的可分解分层的预测模型的制作方法

文档序号：34454514发布日期：2023-06-13 23:19阅读：44来源：国知局

背景技术：

1、本公开一般涉及可编程计算机，并且更特别地涉及被配置成生成并运行一组预测模型的可编程计算机系统，该组预测模型使用所利用的特征的可分解的分层结构来生成更容易解释的结果，所利用的特征被分组成不同粒度。

2、许多领域(例如医学领域)试图结合使用预测机器学习模型来执行需要数据分析的任务，并且还需要使用该分析的结果作为未来动作的基础。通常，预测机器学习模型由神经网络或其他机器学习算法生成并在其上运行，该神经网络或其他机器学习算法可以被实现为被配置为运行一组机器学习算法的可编程计算机。神经网络结合了来自各种学科的知识，包括神经生理学、认知科学/心理学、物理学(统计力学)、控制理论、计算机科学、人工智能、统计学/数学、模式识别、计算机视觉、并行处理和硬件(例如，数字/模拟/vlsi/光学)。

3、神经网络和其它机器学习算法的基本功能是通过一种机器感知解释非结构化数据来识别模式。处于其本地形式的非结构化真实世界数据(例如，图像、声音、文本或时序数据)被转换成可由计算机理解和操纵的数值形式(例如，具有幅度和方向的向量)。机器学习算法对真实世界数据向量执行基于学习的分析的多次迭代，直到发现并学习了包含在真实世界数据向量中的模式(或关系)。所学习的模式/关系用作预测模型，其可用于执行各种任务，包括例如对真实世界数据的预测。预测任务通常取决于使用标记的数据集来训练神经网络(即，模型)或其他机器学习模型以识别标记与数据之间的相关性。这被称为受监督的学习。

4、虽然简单的预测模型可以使用通用线性模型或决策树模型来自我解释，但是对于更复杂的模型结构来说，理解针对更复杂的任务生成的机器学习模型结果可能是具有挑战性的。为执行复杂任务(例如，在线帖子的情感分析)所开发的机器学习模型通常是“黑盒”模型，因为被分配给该模型的任务与由该模型生成的结果之间的关系是不清楚的。但是随着任务变得更加复杂，模型的结果与模型被设计为执行的任务之间的关系可能是不清楚的。

技术实现思路

1、用于从机器学习模型提供可解释预测的计算机实现的方法包括：接收表示由一个或多个预测模型用于生成预测的集合(y)的特征的集合(x)的分层结构的数据结构。该方法包括通过基于分层结构将可解释性分配给预测模型的每个预测yi来构建对应于预测模型的可解释性模型。分配可解释性包括：使用分层结构将输入数据的特征的集合(x)分解成多个分区xj，其中，n是分区的数量。此外，使用分层结构将每个分区分解成多个子分区，直到获得原子子分区。针对每个分区根据子分区的预测分数来计算分数，其中，预测分数表示子分区之间的交互。此外，输出基于可解释性模型的由预测模型提供的预测的解释。解释表示由预测模型用于生成预测的一个或多个特征的权重。

2、本公开的其他实施例在计算机系统和计算机程序产品中实现上述方法的特征。

3、通过本公开的技术实现附加的技术特征及益处。本公开的实施例和方面在本文中详细描述，并且被认为是所要求保护的主题的一部分。为了更好地理解，参考详细描述和附图。

技术特征：

1.一种用于从机器学习模型提供可解释预测的计算机实现的方法，所述方法包括：

2.根据权利要求1所述的计算机实现的方法，其中，所述特征的分区是所述输入数据的互斥子集。

3.根据权利要求1所述的计算机实现的方法，还包括基于每个分区的所述预测分数来生成所述输入数据的总分数。

4.根据权利要求1所述的计算机实现的方法，其中，生成所述分层结构还包括：

5.根据权利要求1所述的计算机实现的方法，还包括由所述处理器基于针对所选择的特征的所述预测分数来识别推荐动作。

6.根据权利要求1所述的计算机实现的方法，其中，每个分区与对应的可解释性模型相关联。

7.根据权利要求1所述的计算机实现的方法，其中，所述可解释性模型是注意力模型。

8.一种系统，包括：

9.根据权利要求8所述的系统，其中，所述特征的分区是所述输入数据的互斥子集。

10.根据权利要求8所述的系统，其中，所述方法还包括基于每个分区的所述预测分数来生成所述输入数据的总分数。

11.根据权利要求8所述的系统，其中，生成所述分层结构还包括：

12.根据权利要求8所述的系统，其中，所述方法还包括基于针对所选择的特征的所述预测分数来识别推荐动作。

13.根据权利要求8所述的系统，其中，每个分区与对应的可解释性模型相关联。

14.根据权利要求8所述的系统，其中，所述可解释性模型是注意力模型。

15.一种计算机程序产品，包括计算机可读存储介质，所述计算机可读存储介质具有随其体现的程序指令，所述程序指令能够由一个或多个处理器执行以使所述一个或多个处理器执行一种方法，所述方法包括：

16.根据权利要求15所述的计算机程序产品，其中，所述特征的分区是所述输入数据的互斥子集。

17.根据权利要求15所述的计算机程序产品，其中，所述方法还包括基于每个分区的所述预测分数来生成所述输入数据的总分数。

18.根据权利要求15所述的计算机程序产品，其中，生成所述分层结构还包括：

19.根据权利要求15所述的计算机程序产品，其中，每个分区与对应的可解释性模型相关联。

20.根据权利要求15所述的计算机程序产品，其中，所述可解释性模型是注意力模型。

技术总结
用于从机器学习模型提供可解释预测的计算机实现的方法包括接收表示由一个或多个预测模型用于生成预测的集合(Y)的特征的集合(X)的分层结构的数据结构。通过基于分层结构将可解释性分配给每个预测Y<subgt;i</subgt;来构建对应于预测模型的可解释性模型。分配可解释性包括使用分层结构将X分解成多个分区X<subgt;j</subgt;，其中，N是分区的数量。此外，使用分层结构将每个分区分解成多个子分区，直到获得原子子分区。针对每个分区根据子分区的预测分数来计算分数，其中，预测分数表示子分区之间的交互。此外，输出预测的解释。

技术研发人员：周念军,W·M·吉福德,李大昕,P·马佐勒尼,P·穆拉里
受保护的技术使用者：国际商业机器公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周念军 W
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：电子设备及电声转换装置的制作方法
上一篇：酯改性的交联有机硅组合物的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。