本说明书实施例属于计算机,尤其涉及一种使用树模型的方法和装置。
背景技术:
1、在机器学习技术领域中,包括很多种树模型。树模型通常指的是一类使用树状结构进行数据分割和决策的算法,这些树模型通常可用于解决分类、回归和其他预测问题。在一种树模型使用场景中,树模型的模型持有方(例如交易平台、支付平台等)拥有模型的数据,包括模型参数、模型架构等,模型持有方的客户拥有特征数据,为数据持有方。模型持有方希望使用自己的树模型对客户的数据进行预测,得到预测标签,然而,客户也不希望泄露自身的数据。在该情况下,需要模型持有方将模型提供给客户以进行模型预测,因此,模型持有方需要在将模型提供给客户时对模型进行保护。
技术实现思路
1、本发明的目的在于提供一种使用树模型的方法,以保护模型方的模型。
2、本说明书第一方面提供一种使用树模型的方法,由模型方执行,所述树模型中包括决策树,所述方法包括:
3、将与树模型对应的多个密态树模型发送给数据方,所述多个密态树模型包括第一密态树模型和第二密态树模型,所述第一密态树模型中包括第一密态树,所述第二密态树模型中包括第二密态树,所述第一密态树通过对所述决策树的每个叶子节点的值增加扰动值而生成,所述第二密态树基于所述第一密态树生成,所述模型方记录有指示信息和与所述扰动值对应的扰动信息,所述指示信息用于指示在由所述多个密态树模型输出的多个密态模型分数中的与所述第一密态树模型对应的密态模型分数;
4、从所述数据方接收由所述多个密态树模型针对目标对象的特征数据输出的多个密态模型分数;
5、基于所述指示信息,从所述多个密态模型分数中获取与所述第一密态树模型对应的第一密态模型分数;
6、基于所述扰动信息对所述第一密态模型分数进行处理,得到所述树模型的预测结果。
7、本说明书第二方面提供一种使用树模型的装置,部署于模型方,所述树模型中包括决策树,所述装置包括:
8、发送单元,用于将与树模型对应的多个密态树模型发送给数据方,所述多个密态树模型包括第一密态树模型和第二密态树模型,所述第一密态树模型中包括第一密态树,所述第二密态树模型中包括第二密态树,所述第一密态树通过对所述决策树的每个叶子节点的值增加扰动值而生成,所述第二密态树基于所述第一密态树生成,所述模型方记录有指示信息和与所述扰动值对应的扰动信息,所述指示信息用于指示在由所述多个密态树模型输出的多个密态模型分数中的与所述第一密态树模型对应的密态模型分数;
9、接收单元,用于从所述数据方接收由所述多个密态树模型针对目标对象的特征数据输出的多个密态模型分数;
10、获取单元,用于基于所述指示信息,从所述多个密态模型分数中获取与所述第一密态树模型对应的第一密态模型分数;
11、处理单元,用于基于所述扰动信息对所述第一密态模型分数进行处理,得到所述树模型的预测结果。
12、本说明书第三方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。
13、本说明书第四方面提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。
14、本说明书第五方面提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现第一方面所述方法的步骤。
15、在本说明书实施例提供的方案中,通过对树模型的决策树中的叶子节点的值进行扰动,得到第一密态树,基于该第一密态树生成第一密态树模型,以保护树模型的叶子节点,通过新增包括第二密态树的第二密态树模型,以保护树模型中的中间节点。数据方基于该多个密态树模型进行预测,不会获知树模型的任何数据,数据方通过将多个密态树模型输出的多个密态分数发送给模型方,模型方可基于该多个密态分数得到树模型的真实预测结果。
1.一种使用树模型的方法,由模型方执行,所述树模型中包括决策树,所述方法包括:
2.根据权利要求1所述的方法,所述树模型包括n棵决策树,所述扰动信息包括n个随机数之和,所述n个随机数与所述n棵决策树分别对应;
3.根据权利要求1或2所述的方法,所述扰动值的取值范围大于或者等于第一值、且小于或者等于第二值,所述第一值为所述树模型包括的全部叶子节点的值中的最小值,所述第二值为所述树模型包括的全部叶子节点的值中的最大值。
4.根据权利要求2所述的方法,所述第二密态树的叶子节点的取值范围大于或者等于第三值、且小于或者等于第四值,所述第三值为所述树模型包括的全部叶子节点的经扰动的值中的最小值,所述第四值为所述树模型包括的全部叶子节点的经扰动的值中的最大值。
5.根据权利要求5所述的方法,所述第二密态树中包括的分裂特征基于所述n棵决策树中包括的分裂特征及其出现次数确定,所述第二密态树中的各个分裂特征的分裂值基于所述n棵决策树中的该分裂特征的分裂值的取值范围选取。
6.根据权利要求2所述的方法,各个第一密态树模型中包括k棵第一密态树或k+1棵第一密态树,所述k基于n和g确定,每个所述第二密态树模型中包括k棵或k+1棵第二密态树。
7.根据权利要求2所述的方法,所述多个密态树模型中包括m个第二密态树模型,所述多个密态树模型基于随机确定的顺序排列,所述指示信息包括与所述顺序对应的指示值序列。
8.根据权利要求2所述的方法,所述树模型包括激活层,用于基于所述决策树输出的分数进行分类,
9.根据权利要求1所述的方法,还包括:对所述决策树的每个叶子节点的值增加扰动值,得到第一密态树,基于所述第一密态树生成第二密态树,基于所述第一密态树生成第一密态树模型,基于所述第二密态树生成第二密态树模型,记录与所述扰动值对应的扰动信息和所述指示信息。
10.一种使用树模型的装置,部署于模型方,所述树模型中包括决策树,所述装置包括:
11.一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1-9中任一项所述方法的步骤。
12.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。