数据处理方法、装置及设备与流程

文档序号:31347507发布日期:2022-08-31 12:02阅读:47来源:国知局
数据处理方法、装置及设备与流程

1.本文件涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及设备。


背景技术:

2.随着计算机技术的快速发展,人工智能系统的应用场景越来越广泛,如人脸识别、自动驾驶等,而人工智能系统的核心则是由深度学习算法构建的模型,为提高人工智能系统的安全性,需要对深度学习算法构建的模型进行隐私保护处理。
3.但是,在模型结构日趋复杂的情况下,对载体对象的可隐写空间的要求较高,模型隐写的效果较差,同时由于数据处理量较大,也会导致模型隐写的处理效率低,因此,需要一种能够在模型隐写场景中,提高模型隐写效果和模型隐写效率的解决方案。


技术实现要素:

4.本说明书实施例的目的是提供一种能够在模型隐写场景中,提高模型隐写效果和模型隐写效率的解决方案。
5.为了实现上述技术方案,本说明书实施例是这样实现的:
6.第一方面,本说明书实施例提供了一种数据处理方法,包括:获取待隐写的目标模型;基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
7.第二方面,本说明书实施例提供了一种数据处理方法,包括:接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回
报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
8.第三方面,本说明书实施例提供了一种数据处理装置,包括:模型获取模块,用于获取待隐写的目标模型;类确定模块,用于基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;对象确定模块,用于基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;数据发送模块,用于基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
9.第四方面,本说明书实施例提供了一种数据处理装置,包括:数据获取模块,用于接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;提取模块,用于基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;业务处理模块,用于基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
10.第五方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述
处理器:获取待隐写的目标模型;基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
11.第六方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
12.第七方面,本说明书实施例提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取待隐写的目标模型;基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对
所述历史模型进行写入处理的损失值确定;基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
13.第八方面,本说明书实施例提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
附图说明
14.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
15.图1a为本说明书一种数据处理方法实施例的流程图;
16.图1b为本说明书一种数据处理方法的处理过程示意图;
17.图2为本说明书又一种数据处理方法的处理过程示意图;
18.图3a为本说明书又一种数据处理方法实施例的流程图;
19.图3b为本说明书又一种数据处理方法的处理过程示意图;
20.图4为本说明书一种数据处理过程的示意图;
21.图5为本说明书一种数据处理装置实施例的结构示意图;
22.图6为本说明书又一种数据处理装置实施例的结构示意图;
23.图7为本说明书一种数据处理设备的结构示意图。
具体实施方式
24.本说明书实施例提供一种数据处理方法、装置及设备。
25.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明
书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
26.实施例一
27.如图1a和1b所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务端,该服务端可以是服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
28.在s102中,获取待隐写的目标模型。
29.其中,待隐写的目标模型可以是基于历史业务数据对由深度学习算法构建的模型进行训练得到的,能够用于处理预定业务的模型,例如,目标模型可以是基于历史资源转移业务数据对由神经网络学习算法构建的分类模型进行训练得到的,能够用于确定执行资源转移业务是否存在风险的模型。
30.在实施中,随着计算机技术的快速发展,人工智能系统的应用场景越来越广泛,如人脸识别、自动驾驶等,而人工智能系统的核心则是由深度学习算法构建的模型,为提高人工智能系统的安全性,需要对深度学习算法构建的模型进行隐私保护处理。例如,可以通过增加不必要的操作的方式(如将模型的模型权重加上数a,在减去数a等),对模型的结构进行处理,在将处理后的模型写入载体对象,使得攻击者无法根据载体对象准确定位模型的有效结构,以实现对该模型的隐私保护处理。
31.但是,由于需要增加过多不必要的操作,在模型结构日趋复杂的情况下,对载体对象的可隐写空间的要求较高,这就会导致模型隐写的效果较差,同时由于数据处理量较大,也会导致模型隐写的处理效率低,因此,需要一种能够在模型隐写场景中,提高模型隐写效果和模型隐写效率的解决方案。为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
32.以待隐写的目标模型为用于确定执行资源转移业务是否存在风险的模型为例,目标模型可以是服务端基于预定数量的历史资源转移业务数据进行训练得到,目标设备可以是能够为用户提供资源转移业务的机构所使用的客户端,由于每个机构所拥有的用户私有数据可能存在数据量较小,数据质量较差的问题,而服务端的数据量大,数据处理能力强,因此,服务端可以将目标模型发送给目标设备,以解决目标设备本地训练得到的模型可能存在模型效果较差的问题,为保护目标模型在数据传输过程中的安全性,可以对目标模型进行隐写处理。
33.在s104中,基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类。
34.其中,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值可以由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,候选载体类可以对应一个或多个载体对象,载体对象可以为任意能够写入待隐写数据的对象,如图像、视频、音频等,例如,载体对象可以为载体图像,可以将待隐写数据写入载体图像的某些像素点中,这样,得到的写入后的载体图像的峰值
信噪比(peak signal to noise ratio,psnr)不会低于预设噪声阈值,即写入后的载体图像在视觉上有很好的效果。
35.在实施中,可以根据目标模型的模型大小、用于处理的预定业务的类型(如用于处理目标业务的)等,确定与目标模型对应的候选载体类。
36.例如,以载体对象为载体图像为例,假设每个像素点的原始信息为8bit,在载体图像的psnr不低于预设噪声阈值的情况下,每个像素点可以提供4bit用于写入待隐写数据,那么,可以将编码后的模型权重和编码后的模型结构写入载体对象的若干像素点的4bit内,因此,为使载体图像的psnr不低于预设噪声阈值,可以根据待隐写数据的大小,将载体对象划分为多个候选载体类。在获取到待隐写的目标模型后,可以根据目标模型的模型大小,确定与目标模型对应的候选载体类。
37.或者,由于不同的业务对模型隐写的准确性要求不同,如资源转移风控场景下对模型隐写准确性的要求,高于即时通讯风控场景下对模型隐写准确性的要求,因此,可以根据业务需求,将多个载体对象划分为不同的候选载体类,在获取到待隐写的目标模型后,可以根据目标模型用于处理的预定业务的业务类型,确定与目标模型对应的候选载体类。
38.上述与目标模型对应的候选载体类的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不作具体限定。
39.在确定了与目标模型对应的候选载体类后,可以基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类。
40.这样,在载体对象的数量较大的情况下,可以先根据候选载体类确定与目标模型对应的目标载体类,可以提高用于对目标模型进行写入处理的载体对象的确定效率,同时,也可以提高对对目标模型进行写入处理的载体对象的确定准确性。
41.在s106中,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象。
42.其中,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定。
43.在实施中,可以通过预先训练的载体类别确定模型,确定与历史模型对应的历史载体类,然后在通过目标模型和历史载体类中的历史载体对象,对载体对象确定模型进行训练,得到训练后的载体对象确定模型。在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象。
44.在s108中,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备。
45.其中,隐写模型可以是由深度学习算法构建的用于将数据隐写到载体对象中的模型,写入后的载体对象可以用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。
46.在实施中,例如,目标模型可以是用于确定执行资源转移业务是否存在风险的模型,目标业务即可以为资源转移业务,服务端可以将写入后的载体对象发送给目标设备,目
标设备可以对写入后的载体对象进行提取处理,以根据提取出的数据确定目标模型,在基于得到的目标模型以及资源转移业务的业务数据,确定执行资源转移业务是否存在风险。
47.本说明书实施例提供一种数据处理方法,获取待隐写的目标模型,基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备,写入后的载体对象用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。这样,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
48.实施例二
49.本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务端,该服务端可以是服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
50.在s102中,获取待隐写的目标模型。
51.在s202中,获取历史载体对象和历史模型。
52.其中,历史模型可以为与目标模型的模型结构相同,模型权重不同的模型,例如,目标模型可以为由3层卷积神经网络构建的分类模型,且每层卷积层都包含3个用于识别数据的特定特征的滤波器,历史模型也可以为由3层卷积神经网络构建的分类模型,且每层卷积层都包含3个用于识别数据的特定特征的滤波器,但历史模型的滤波器的权重值与目标模型的滤波器的权重值可以不同。历史载体对象中包括与历史模型对应的载体对象。
53.在s204中,基于历史载体对象的特征向量,对历史载体对象进行聚类处理,得到历史载体类。
54.其中,每个史载体类对应一个或多个历史载体对象。
55.在实施中,可以基于预设特征提取模型对历史载体对象进行特征提取处理,得到每个历史载体对象的特征向量,其中,以历史载体对象为载体图像为例,预设特征提取模型可以是基于可视化数据库(如imagenet)中的图像对由预设机器学习算法构建的模型进行训练得到,用于对图像进行特征提取处理。
56.可以基于预设聚类算法(如k-means算法、dbscan算法、knn算法等)和历史载体对象的特征向量,对历史载体对象进行聚类处理,得到多个历史载体类。
57.在s206中,基于每两个历史载体类的特征向量之间的距离,确定目标距离矩阵,并基于目标距离矩阵确定第一动作集合。
58.在实施中,可以根据每个历史载体类对应的历史载体对象,确定每个历史载体类的特征向量,如可以将历史载体类对应的历史载体对象的特征向量的均值,确定为该历史载体类的特征向量,历史载体类的特征向量的确定方法可以有多种,本说明书实施例对历史载体类的特征向量的确定方法不做具体限定。
59.可以基于预设距离确定算法(如曼哈顿距离算法、欧氏距离算法等),确定每两个历史载体类的特征向量之间的距离,再由每两个历史载体类的特征向量之间的距离,构建目标距离矩阵,假设历史载体类有k个,则可以构建k*k的目标距离矩阵。
60.在构建了目标距离矩阵后,可以基于目标距离矩阵,构建第一动作集合,例如,第一动作集合中可以包括:动作1(选择与当前历史载体类之间的距离小于第一预设距离的历史载体类)、动作2(选择与当前历史载体类之间的距离不小于第一预设距离且小于第二预设距离的历史载体类)、动作3(选择与当前历史载体类之间的距离不小于第二预设距离且小于第三预设距离的历史载体类)、动作4(选择当前历史载体类不变)等。
61.上述第一动作集合的构建方法是一种可选地、可实现的构建的方法,在实际应用场景中,还可以有多种不同的构建方法,可以根据实际应用场景的不同选取不同的构建方法,本说明书实施例对此不做具体限定。
62.在s208中,获取第一模型和第三载体对象。
63.其中,第一模型的模型数据可以包括第一模型的模型结构和/或模型权重。
64.在s210中,基于第一模型的模型数据、第三载体对象以及预设特征提取模型,对第一隐写模型和第一提取模型进行训练,得到训练后的第一隐写模型和第一提取模型。
65.在实施中,可以将第一模型的模型数据和第三载体对象输入第一隐写模型,得到写入后的第三载体对象,再将写入后的第三载体对象输入第一提取模型,得到提取的模型数据,然后分别将第三载体对象和写入后的第三载体对象输入预设特征提取模型,得到第三载体对象的特征向量,以及写入后的第三载体对象的特征向量,然后基于预设损失函数、第三载体对象、写入后的第三载体对象、第一模型的模型数据、提取的模型数据、第三载体对象的特征向量,以及写入后的第三载体对象的特征向量,确定第一损失值,最后,基于第一损失值,确定第一隐写模型和第一提取模型是否收敛,如果未收敛,则基于第一模型的模型数据和第三载体对象继续对第一隐写模型和第一提取模型进行训练,直到第一隐写模型和第一提取模型收敛,得到训练后的第一隐写模型和第一提取模型。
66.在s212中,基于训练后的第一隐写模型、训练后的第一提取模型和预设特征提取模型,确定每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值。
67.在实施中,可以参见上述确定第一损失值的方法,基于训练后的第一隐写模型、训练后的第一提取模型和预设特征提取模型,确定每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值。
68.在s214中,基于每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值,确定在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值。
69.在实施中,可以通过reward函数,以及每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值,确定在强化学习过程中确定选择第一动作集合中的任一动
作带来的第一回报值,如选中的第n个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值越小,则对应的动作的第一回报值越大。
70.在s216中,基于第一动作集合和第一回报值,对载体类别确定模型进行训练,得到训练后的载体类别确定模型。
71.其中,目标载体类可以包括第一载体类和第二载体类,目标载体对象可以包括基于第一载体类确定的第一载体对象和基于第二载体类确定的第二载体对象,写入后的载体对象可以包括写入目标模型的模型结构的第一载体对象,以及写入目标模型的模型权重的第二载体对象,载体类别确定模型可以是基于深度强化学习(deep q-learning,dqn)算法构建的模型。
72.在s218中,对目标模型的模型结构进行编码处理,得到编码后的模型结构,并基于预先训练的载体类别确定模型和编码后的模型结构,确定候选载体类中与编码后的模型结构对应的第一载体类。
73.在实施中,可以基于预设编码规则,对目标模型的模型结构进行编码处理,以得到编码后的模型结构,例如,假设预设编码规则为可以基于目标模型的类型、层数、输入通道以及输出通道的数量进行编码,若目标模型的模型结构为3*3的卷积层,输入通道有128个,输出通道有156个,则该目标模型的编码后的模型结构可以为0001030301280256,其中,0001表示该目标模型为卷积模型,0303表示该目标模型的层数为3*3,0128表示该目标模型的输入通道有128个,0256即可以表示该目标模型的输出通道有256个。
74.上述对目标模型的模型结构进行编码的处理方式是一种可选地、可实现的处理方法,在实际应用场景中,还可以有多种不同的处理方式,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不做具体限定。
75.可以基于预先训练的载体类别确定模型和编码后的模型结构,确定候选载体类中与编码后的模型结构对应的第一载体类。
76.在s220中,基于预先训练的载体类别确定模型和目标模型的模型权重,确定候选载体类中与目标模型的模型权重对应的第二载体类。
77.在实施中,由于模型权重本身即为数据信息,因此可以直接将模型权重输入预先训练的载体类别确定模型,确定候选载体类中与目标模型的模型权重对应的第二载体类,而不需要对模型权重进行编码处理。
78.另外,若目标模型较大,可以对目标模型的每一层的模型权重,确定一个载体类,即第二载体类可以包括多个子类,可以将目标模型每一层的模型权重,分别输入到预先训练的载体类别确定模型,得到与每一层的模型权重对应的子类。
79.此外,上述确定第二载体类中的子类的方法还可以有多种,如可以对目标模型的模型权重进行聚类处理,得到多个权重类,在基于预先训练的载体类别确定模型,确定与每个权重类对应的子类等,可以根据实际场景的不同选取不同的确定方法,本说明书实施例对此不造具体限定。
80.在s222中,基于预先训练的载体对象确定模型,确定第一载体类中与编码后的模型结构对应的第一载体对象。
81.在s224中,基于预先训练的载体对象确定模型,确定第二载体类中与目标模型的模型权重对应的第二载体对象。
82.在实施中,若第二载体类包括多个子类,且每个子类是由目标模型的每层的模型权重确定的,则可以基于预先训练的载体对象确定模型,确定每个子类中与目标模型的每层模型权重对应的第二载体对象。
83.在s226中,获取第二模型和第三载体类。
84.其中,第二模型的模型数据可以包括第二模型的模型结构和/或模型权重。
85.在s228中,基于预先训练的载体类别确定模型,确定第三载体类中与第二模型对应的第四载体类。
86.在s230中,基于预先训练的载体对象确定模型,确定第四载体类中与第二模型对应的第四载体对象。
87.在s232中,基于第二模型、第四载体对象以及预设特征提取模型,对隐写模型和第二提取模型进行训练,得到训练后的隐写模型。
88.在实施中,为提高隐写模型的隐写效果,可以通过预先训练的载体类别确定模型以及预先训练的载体对象确定模型,确定第二模型对应的第四载体对象,这样,可以通过第二模型和第四载体对象,对隐写模型进行训练。
89.此外,在实际应用中,上述s232的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤五处理:
90.步骤一,将第二模型的模型数据和第四载体对象输入隐写模型,得到写入后的第四载体对象。
91.步骤二,将写入后的第四载体对象输入第二提取模型,得到提取的模型数据。
92.步骤三,分别将第四载体对象和写入后的第四载体对象输入预设特征提取模型,得到第四载体对象的特征向量,以及写入后的第四载体对象的特征向量。
93.步骤四,基于预设损失函数、第四载体对象、写入后的第四载体对象、第二模型的模型数据、提取的模型数据、第四载体对象的特征向量,以及写入后的第四载体对象的特征向量,确定模型损失值。
94.在实施中,可以基于第四载体对象和写入后的第四载体对象,确定第一子损失值,再基于第二模型的模型数据和提取的模型数据,确定第二子损失值,然后再基于第四载体对象的特征向量和写入后的第四载体对象的特征向量,确定第三子损失值,最后,可以基于第一子损失值、第二子损失值和第三子损失值,确定模型损失值。
95.如,可以将第一子损失值、第二子损失值和第三子损失值代入下列公式,
96.l
total
=l
consistency-image
+l
recover
+l
consistency-feature
97.得到模型损失值,其中,l
total
为模型损失值,l
consistency-image
为第一子损失值,l
recover
为第二子损失值,l
consistency-fenture
为第三子损失值。
98.这样,可以通过第一子损失值,约束隐写前后的载体对象的一致性,通过第二子损失值,约束回复得到的写入数据的准确性,通过第三子损失值,约束写入处理前后的载体对象的一致性。
99.步骤五,基于模型损失值,确定隐写模型和第二提取模型是否收敛,如果未收敛,则可以基于第二模型的模型数据以及第四载体对象继续对隐写模型和第二提取模型进行训练,直到隐写模型和第二提取模型收敛,得到训练后的隐写模型。
100.在s108中,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结
构写入所述目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备。
101.其中,写入后的载体对象可以用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。
102.本说明书实施例提供一种数据处理方法,获取待隐写的目标模型,基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备,写入后的载体对象用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。这样,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
103.实施例三
104.如图3a和3b所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为目标设备,该目标设备可以是服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
105.在s302中,接收服务端发送的写入后的载体对象。
106.其中,写入后的载体对象可以为服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,目标载体对象可以为服务端基于预先训练的载体对象确定模型,确定的目标载体类中与目标模型对应的载体对象,目标载体类可以为服务端基于预先训练的载体类别确定模型,确定的候选载体类中与目标模型对应的载体类,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值可以由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定。
107.在s304中,基于预设提取模型对写入后的载体对象进行提取处理,得到目标模型的模型权重和模型结构。
108.其中,预设提取模型可以是服务端发送的训练后的提取模型,该提取模型可以如
上述实施例二中用于对隐写模型和第二提取模型进行训练得到的提取模型。
109.在实施中,目标设备还可以接收服务端发送的提取模型,并基于该提取模型对写入后的载体对象进行提取处理,以得到目标模型的模型权重和目标模型的模型结构。
110.此外,若载体对象包括第一载体对象和第二载体对象,写入后的载体对象包括写入目标模型的模型结构的第一载体对象,以及写入目标模型的模型权重的第二载体对象,那么,目标设备可以基于提取模型对第一载体对象和第二载体对象进行提取处理,得到目标模型的模型结构和模型权重。
111.若得到的模板模型的模型结构是服务端基于预设编码规则进行编码处理得到的编码后的模型结构,则目标设备可以根据服务端发送的预设编码规则,确定目标模型的模型结构,然后可以将得到的模型权重输入模型结构,可以得到目标模型。
112.在s306中,基于目标模型的模型权重和模型结构,确定目标模型,并基于目标模型对目标业务进行处理。
113.本说明书实施例提供一种数据处理方法,接收服务端发送的写入后的载体对象,写入后的载体对象为服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,目标载体对象为服务端基于预先训练的载体对象确定模型,确定的目标载体类中与目标模型对应的载体对象,目标载体类为服务端基于预先训练的载体类别确定模型,确定的候选载体类中与目标模型对应的载体类,载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预设提取模型对写入后的载体对象进行提取处理,得到目标模型的模型权重和模型结构,基于目标模型的模型权重和模型结构,确定目标模型,并基于目标模型对目标业务进行处理。这样,由于服务端是基于预先训练的载体类别确定模型,确定的与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定的目标载体类中与目标模型对应的目标载体对象,因此,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,服务端再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率,目标设备就可以基于得到的目标模型,对目标业务进行处理,提高业务处理效率和准确性。
114.实施例四
115.本说明书实施例提供一种数据处理系统,该数据处理系统包括服务端和目标设备,该服务端可以是服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,该目标设备可以是服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
116.服务端可以用于获取第一模型和第三载体对象,第一模型的模型数据可以包括第一模型的模型结构和/或模型权重,基于第一模型的模型数据、第三载体对象以及预设特征提取模型,对第一隐写模型和第一提取模型进行训练,得到训练后的第一隐写模型和第一
提取模型,在基于训练后的第一隐写模型、训练后的第一提取模型和预设特征提取模型,确定每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值。
117.此外,服务器还可以基于第一模型和第三载体对象和预设特征提取模型,对隐写模型和第二提取模型进行预训练,得到预训练后的隐写模型和第二提取模型。
118.其中,第一隐写模型和第一提取模型可以为轻量级模型,隐写模型和第二提取模型可以为标准模型,即第一隐写模型和隐写模型的模型结构可以相同,而第一隐写模型每一层的通道数可以比隐写模型每一层的通道数少,例如,第一隐写模型和隐写模型的模型结构都可以为16层的unet,而第一隐写模型每一层的通道数仅为隐写模型每一层的通道数的1/4,即第一隐写模型的运算量仅为隐写模型的1/16。
119.服务端在得到训练后的第一隐写模型、训练后的第一提取模型后,可以基于历史载体对象的特征向量,对历史载体对象进行聚类处理,得到历史载体类,每个历史载体类对应一个或多个历史载体对象,基于每两个历史载体类的特征向量之间的距离,确定目标距离矩阵,并基于目标距离矩阵确定第一动作集合,基于每个历史载体类对应的历史载体对象对历史模型进行写入处理的损失值,确定在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,基于第一动作集合和第一回报值,对载体类别确定模型进行训练,得到训练后的载体类别确定模型。
120.同样的,服务端可以基于训练后的载体类别确定模型,确定历史载体类中与历史模型对应的载体类,在基于历史模型、与历史模型对应的载体类中的历史载体对象,对载体对象确定模型进行训练,得到训练后的载体对象确定模型。其中,对载体对象确定模型的训练过程可以参见上述对载体类别确定模型的训练过程,此处不再赘述。
121.服务端在得到训练后的载体类别确定模型以及训练后的载体对象确定模型,可以获取第二模型和第三载体类,然后基于预先训练的载体类别确定模型,确定第三载体类中与第二模型对应的第四载体类,以及基于预先训练的载体对象确定模型,确定第四载体类中与第二模型对应的第四载体对象,最后,基于第二模型、第四载体对象以及预设特征提取模型,对预训练的隐写模型和预训练的第二提取模型进行训练,得到训练后的隐写模型。
122.服务端,还用于获取待隐写的目标模型;基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备。
123.由于可以用于进行模型训练的载体对象的数量有限,因此,如图4所示,服务端可以先对隐写模型进行预训练(即上述标准模型和轻量级模型,然后在通过轻量级模型对载体类别确定模型训练,以及基于训练后的载体类型确定模型对载体对象确定模型进行训练,然后,可以通过载体类型确定模型和载体对象确定模型,对隐写模型进行优化。
124.目标设备,用于基于预设提取模型对写入后的载体对象进行提取处理,得到目标模型的模型权重和模型结构,再基于目标模型的模型权重和模型结构,确定目标模型,并基于目标模型对目标业务进行处理。
125.本说明书实施例提供一种数据处理系统,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载
体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
126.实施例五
127.以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图5所示。
128.该数据处理装置包括:模型获取模块501、类确定模块502、对象确定模块503和数据发送模块504,其中:
129.模型获取模块501,用于获取待隐写的目标模型;
130.类确定模块502,用于基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;
131.对象确定模块503,用于基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;
132.数据发送模块504,用于基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
133.本说明书实施例中,所述目标载体类包括第一载体类和第二载体类,所述目标载体对象包括基于所述第一载体类确定的第一载体对象和基于所述第二载体类确定的第二载体对象,所述写入后的载体对象包括写入所述目标模型的模型结构的第一载体对象,以及写入所述目标模型的模型权重的第二载体对象。
134.本说明书实施例中,所述类确定模块502,用于:
135.对所述目标模型的模型结构进行编码处理,得到编码后的模型结构,并基于所述预先训练的载体类别确定模型和所述编码后的模型结构,确定所述候选载体类中与所述编码后的模型结构对应的第一载体类;
136.基于所述预先训练的载体类别确定模型和所述目标模型的模型权重,确定所述候选载体类中与所述目标模型的模型权重对应的第二载体类;
137.所述对象确定模块503,包括:
138.基于所述预先训练的载体对象确定模型,确定所述第一载体类中与所述编码后的模型结构对应的第一载体对象;
139.基于所述预先训练的载体对象确定模型,确定所述第二载体类中与所述目标模型的模型权重对应的第二载体对象。
140.本说明书实施例中,所述装置,还包括:
141.第一获取模块,用于获取历史载体对象和所述历史模型;
142.聚类模块,用于基于所述历史载体对象的特征向量,对所述历史载体对象进行聚类处理,得到所述历史载体类,每个所述历史载体类对应一个或多个所述历史载体对象;
143.集合确定模块,用于基于每两个所述历史载体类的特征向量之间的距离,确定目标距离矩阵,并基于所述目标距离矩阵确定所述第一动作集合;
144.回报确定模块,用于基于每个所述历史载体类对应的历史载体对象对所述历史模型进行写入处理的损失值,确定在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值;
145.第一训练模块,用于基于所述第一动作集合和所述第一回报值,对所述载体类别确定模型进行训练,得到训练后的载体类别确定模型。
146.本说明书实施例中,所述装置,还包括:
147.第二获取模块,用于获取第一模型和第三载体对象,所述第一模型的模型数据包括所述第一模型的模型结构和/或模型权重;
148.第二训练模块,用于基于所述第一模型的模型数据、所述第三载体对象以及预设特征提取模型,对第一隐写模型和第一提取模型进行训练,得到训练后的第一隐写模型和第一提取模型;
149.损失确定模块,用于基于所述训练后的第一隐写模型、所述训练后的第一提取模型和所述预设特征提取模型,确定所述每个所述历史载体类对应的历史载体对象对所述历史模型进行写入处理的损失值。
150.本说明书实施例中,所述装置,还包括:
151.第三获取模块,用于获取第二模型和第三载体类;
152.第一确定模块,用于基于所述预先训练的载体类别确定模型,确定所述第三载体类中与所述第二模型对应的第四载体类;
153.第二确定模块,用于基于所述预先训练的载体对象确定模型,确定所述第四载体类中与所述第二模型对应的第四载体对象;
154.第三训练模块,用于基于所述第二模型、所述第四载体对象以及所述预设特征提取模型,对所述隐写模型和第二提取模型进行训练,得到训练后的隐写模型。
155.本说明书实施例中,所述第三训练模块,用于:
156.将所述第二模型的模型数据和所述第四载体对象输入所述隐写模型,得到写入后的第四载体对象;
157.将所述写入后的第四载体对象输入所述第二提取模型,得到提取的模型数据;
158.分别将所述第四载体对象和所述写入后的第四载体对象输入所述预设特征提取模型,得到所述第四载体对象的特征向量,以及所述写入后的第四载体对象的特征向量;
159.基于预设损失函数、所述第四载体对象、所述写入后的第四载体对象、所述第二模型的模型数据、所述提取的模型数据、所述第四载体对象的特征向量,以及所述写入后的第四载体对象的特征向量,确定模型损失值;
160.基于所述模型损失值,确定所述隐写模型和所述第二提取模型是否收敛,如果未收敛,则基于所述第二模型的模型数据以及所述第四载体对象继续对所述隐写模型和所述
第二提取模型进行训练,直到所述隐写模型和所述第二提取模型收敛,得到所述训练后的隐写模型。
161.本说明书实施例中,所述第三训练模块,用于:
162.基于所述第四载体对象和所述写入后的第四载体对象,确定第一子损失值;
163.基于所述第二模型的模型数据和所述提取的模型数据,确定第二子损失值;
164.基于所述第四载体对象的特征向量和所述写入后的第四载体对象的特征向量,确定第三子损失值;
165.基于所述第一子损失值、所述第二子损失值和所述第三子损失值,确定所述模型损失值。
166.本说明书实施例提供一种数据处理装置,获取待隐写的目标模型,基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备,写入后的载体对象用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。这样,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
167.实施例六
168.以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图6所示。
169.该数据处理装置包括:数据获取模块601、提取模块602和业务处理模块603,其中:
170.数据获取模块601,用于接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集
合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;
171.提取模块602,用于基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;
172.业务处理模块603,用于基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
173.本说明书实施例提供一种数据处理装置,接收服务端发送的写入后的载体对象,写入后的载体对象为服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,目标载体对象为服务端基于预先训练的载体对象确定模型,确定的目标载体类中与目标模型对应的载体对象,目标载体类为服务端基于预先训练的载体类别确定模型,确定的候选载体类中与目标模型对应的载体类,载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预设提取模型对写入后的载体对象进行提取处理,得到目标模型的模型权重和模型结构,基于目标模型的模型权重和模型结构,确定目标模型,并基于目标模型对目标业务进行处理。这样,由于服务端是基于预先训练的载体类别确定模型,确定的与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定的目标载体类中与目标模型对应的目标载体对象,因此,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,服务端再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率,目标设备就可以基于得到的目标模型,对目标业务进行处理,提高业务处理效率和准确性。
174.实施例七
175.基于同样的思路,本说明书实施例还提供一种数据处理设备,如图7所示。
176.数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在数据处理设备上执行存储器702中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入输出接口705,一个或一个以上键盘706。
177.具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置
以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
178.获取待隐写的目标模型;
179.基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定;
180.基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;
181.基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象,将所述写入后的载体对象发送给目标设备,所述写入后的载体对象用于触发所述目标设备基于所述写入后的载体对象得到所述目标模型,以基于所述目标模型对目标业务进行处理。
182.可选地,所述目标载体类包括第一载体类和第二载体类,所述目标载体对象包括基于所述第一载体类确定的第一载体对象和基于所述第二载体类确定的第二载体对象,所述写入后的载体对象包括写入所述目标模型的模型结构的第一载体对象,以及写入所述目标模型的模型权重的第二载体对象。
183.可选地,所述基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类,包括:
184.对所述目标模型的模型结构进行编码处理,得到编码后的模型结构,并基于所述预先训练的载体类别确定模型和所述编码后的模型结构,确定所述候选载体类中与所述编码后的模型结构对应的第一载体类;
185.基于所述预先训练的载体类别确定模型和所述目标模型的模型权重,确定所述候选载体类中与所述目标模型的模型权重对应的第二载体类;
186.所述基于预先训练的载体对象确定模型,确定所述目标载体类中与所述目标模型对应的目标载体对象,包括:
187.基于所述预先训练的载体对象确定模型,确定所述第一载体类中与所述编码后的模型结构对应的第一载体对象;
188.基于所述预先训练的载体对象确定模型,确定所述第二载体类中与所述目标模型的模型权重对应的第二载体对象。
189.可选地,在所述基于预先训练的载体类别确定模型,确定候选载体类中与所述目标模型对应的目标载体类之前,还包括:
190.获取历史载体对象和所述历史模型;
191.基于所述历史载体对象的特征向量,对所述历史载体对象进行聚类处理,得到所述历史载体类,每个所述历史载体类对应一个或多个所述历史载体对象;
192.基于每两个所述历史载体类的特征向量之间的距离,确定目标距离矩阵,并基于所述目标距离矩阵确定所述第一动作集合;
193.基于每个所述历史载体类对应的历史载体对象对所述历史模型进行写入处理的损失值,确定在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值;
194.基于所述第一动作集合和所述第一回报值,对所述载体类别确定模型进行训练,得到训练后的载体类别确定模型。
195.可选地,在所述基于每个所述历史载体类对应的历史载体对象对所述历史模型进行写入处理的损失值之前,还包括:
196.获取第一模型和第三载体对象,所述第一模型的模型数据包括所述第一模型的模型结构和/或模型权重;
197.基于所述第一模型的模型数据、所述第三载体对象以及预设特征提取模型,对第一隐写模型和第一提取模型进行训练,得到训练后的第一隐写模型和第一提取模型;
198.基于所述训练后的第一隐写模型、所述训练后的第一提取模型和所述预设特征提取模型,确定所述每个所述历史载体类对应的历史载体对象对所述历史模型进行写入处理的损失值。
199.可选地,在所述基于预先训练的隐写模型,将所述待隐写的目标模型的模型权重和模型结构写入所述目标载体对象,得到写入后的载体对象之前,还包括:
200.获取第二模型和第三载体类;
201.基于所述预先训练的载体类别确定模型,确定所述第三载体类中与所述第二模型对应的第四载体类;
202.基于所述预先训练的载体对象确定模型,确定所述第四载体类中与所述第二模型对应的第四载体对象;
203.基于所述第二模型、所述第四载体对象以及所述预设特征提取模型,对所述隐写模型和第二提取模型进行训练,得到训练后的隐写模型。
204.可选地,所述基于所述第二模型、所述第四载体对象以及所述预设特征提取模型,对所述隐写模型和第二提取模型进行训练,得到训练后的隐写模型,包括:
205.将所述第二模型的模型数据和所述第四载体对象输入所述隐写模型,得到写入后的第四载体对象;
206.将所述写入后的第四载体对象输入所述第二提取模型,得到提取的模型数据;
207.分别将所述第四载体对象和所述写入后的第四载体对象输入所述预设特征提取模型,得到所述第四载体对象的特征向量,以及所述写入后的第四载体对象的特征向量;
208.基于预设损失函数、所述第四载体对象、所述写入后的第四载体对象、所述第二模型的模型数据、所述提取的模型数据、所述第四载体对象的特征向量,以及所述写入后的第四载体对象的特征向量,确定模型损失值;
209.基于所述模型损失值,确定所述隐写模型和所述第二提取模型是否收敛,如果未收敛,则基于所述第二模型的模型数据以及所述第四载体对象继续对所述隐写模型和所述第二提取模型进行训练,直到所述隐写模型和所述第二提取模型收敛,得到所述训练后的隐写模型。
210.可选地,所述基于预设损失函数、所述第四载体对象、所述写入后的第四载体对象、所述第二模型的模型数据、所述提取的模型数据、所述第四载体对象的特征向量,以及所述写入后的第四载体对象的特征向量,确定模型损失值,包括:
211.基于所述第四载体对象和所述写入后的第四载体对象,确定第一子损失值;
212.基于所述第二模型的模型数据和所述提取的模型数据,确定第二子损失值;
213.基于所述第四载体对象的特征向量和所述写入后的第四载体对象的特征向量,确定第三子损失值;
214.基于所述第一子损失值、所述第二子损失值和所述第三子损失值,确定所述模型损失值。
215.此外,具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
216.接收服务端发送的写入后的载体对象,所述写入后的载体对象为所述服务端基于预先训练的隐写模型将待隐写的目标模型的模型权重和模型结构写入目标载体对象得到,所述目标载体对象为所述服务端基于预先训练的载体对象确定模型,确定的目标载体类中与所述目标模型对应的载体对象,所述目标载体类为所述服务端基于预先训练的载体类别确定模型,确定的候选载体类中与所述目标模型对应的载体类,所述载体类别确定模型为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择所述第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,所述第一回报值由每个所述历史载体类中的载体对象对历史模型进行写入处理的损失值确定,所述载体对象确定模型为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择所述第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,所述第二回报值由每个所述历史载体对象对所述历史模型进行写入处理的损失值确定;
217.基于预设提取模型对所述写入后的载体对象进行提取处理,得到所述目标模型的模型权重和模型结构;
218.基于所述目标模型的模型权重和模型结构,确定所述目标模型,并基于所述目标模型对目标业务进行处理。
219.本说明书实施例提供一种数据处理设备,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
220.实施例七
221.本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且
能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
222.本说明书实施例提供一种计算机可读存储介质,获取待隐写的目标模型,基于预先训练的载体类别确定模型,确定候选载体类中与目标模型对应的目标载体类,载体类别确定模型可以为基于由历史载体类确定的第一动作集合,以及在强化学习过程中确定选择第一动作集合中的任一动作带来的第一回报值,对由强化学习算法构建的模型进行训练得到,第一回报值由每个历史载体类中的载体对象对历史模型进行写入处理的损失值确定,基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,载体对象确定模型可以为基于由历史载体对象确定的第二动作集合,以及在强化学习过程中确定选择第二动作集合中的任一动作带来的第二回报值,对由强化学习算法构建的模型进行训练得到,第二回报值可以由每个历史载体对象对历史模型进行写入处理的损失值确定,基于预先训练的隐写模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,得到写入后的载体对象,将写入后的载体对象发送给目标设备,写入后的载体对象用于触发目标设备基于写入后的载体对象得到目标模型,以基于目标模型对目标业务进行处理。这样,可以基于预先训练的载体类别确定模型,确定与目标模型对应的目标载体类,在基于预先训练的载体对象确定模型,确定目标载体类中与目标模型对应的目标载体对象,可以提高用于对目标模型进行写入处理的目标载体对象的确定准确性和确定效率,再通过预先训练的载体对象确定模型,将待隐写的目标模型的模型权重和模型结构写入目标载体对象,可以在模型隐写场景中,提高模型隐写效果和模型隐写效率。
223.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
224.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl
(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
225.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
226.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
227.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
228.本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
229.本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
230.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
231.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
232.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
233.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
234.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
235.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
236.本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
237.本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
238.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
239.以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何
修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1