本发明涉及数据发布隐私保护,具体是一种基于有限状态机和多目标学习的数据发布方法及系统。
背景技术:
1、在大数据生命周期中,至关重要的一步就是数据发布,数据发布将组织或个人有限的数据共享变成海量的数据流,供相关人员进行研究和使用。但诸如科研、医疗等数据中包含大量敏感信息,直接发布将对数据发布者生命财产安全造成极大的威胁。
2、现有的数据安全方法统一对数据进行隐私保护处理,然后进行集中传输,没有考虑到数据机密性、可用性、传输速率和完整性。为此,如何在满足数据特征的情况下进行安全高效的数据发布是当前研究的热点。
3、对此,本发明提供了一种基于有限状态机和多目标学习的数据发布方法及系统,以解决上述问题。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于有限状态机和多目标学习的数据发布方法及系统,解决了上述问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种基于有限状态机和多目标学习的数据发布方法,
3、具体步骤如下:
4、步骤1:通过对系统进行分析,采用有限状态机进行系统状态转换和系统所需应对事件分析,设计状态转换过程;
5、步骤2:数据到达数据发布系统,系统发起弹窗询问用户是否进行个性化选择;
6、步骤3:若进行个性化选择,则跳转至用户交互界面,给定权重并采用强化学习对剩余目标进行排序;
7、步骤4:若未选择个性化,则跳转至非交互界面,采用博弈论对多个目标进行排序;
8、步骤5:根据给出的多目标优选集,结合数据处理策略,对待发布数据进行隐私保护处理和传输处理;
9、步骤6:处理完成的数据到达发送端口,根据多目标优选集对途径路由进行选择;
10、步骤7:根据途径路由的参数特征,利用智能优化算法进行最优路径选择;
11、步骤8:通过选择的最优路径对数据实现安全高效的发布。
12、优选的,所述状态转换过程设计如下:
13、状态定义:
14、(1)init:框架初始化状态;
15、(2)mu:交互排序态,用户选择数据发布目标,采用强化学习对多目标进行排序;
16、(3)umu:非交互排序态,用户未选择数据发布目标,系统采用博弈论方法对多目标进行排序;
17、(4)op:数据操作态,根据交互态或非交互态结果对即将发布的数据进行处理,包括隐私保护处理和传输处理;
18、(5)rp:路径规划态,根据多目标排序结果选择合理的途径路由,通过智能优化算法对途径路由进行寻优;
19、(6)end:终止态,得到最佳路径,进行数据发布,表示系统完成一次数据发布任务;
20、事件定义:
21、e1:数据到达系统;
22、e2:用户选择交互;
23、e3:用户选择非交互;
24、e4:强化学习排序完成;
25、e5:博弈论排序完成;
26、e6:数据操作完成;
27、e7:路径规划完成;
28、动作定义:
29、a1:发起弹窗,是否进行个性化选择;
30、a2:记录选择,生成带选择的目标函数,进行排序;
31、a3:直接生成目标函数,进行排序;
32、a4:执行相关数据操作;
33、a5:执行路径寻优操作;
34、a6:数据转发;
35、状态转换过程设计:
36、(1)在事件e1下,状态保持初始态,执行动作a1;
37、(2)在事件e2下,状态由初始态转至交互排序态,执行动作a2;
38、(3)在事件e3下,状态由初始态转至非交互排序态,执行动作a3;
39、(4)在事件e4下,状态由交互排序态转至数据操作态,执行动作a4;
40、(5)在事件e5下,状态由非交互排序态转至数据操作态,执行动作a4;
41、(6)在事件e6下,状态由数据操作态转至路径规划态,执行动作a5;
42、(7)在事件e7下,状态由路径规划态转至终止态,执行动作a6。
43、优选的,一种基于有限状态机和多目标学习的数据发布系统,应用于如权利要求1-2的任一项所述的一种基于有限状态机和多目标学习的数据发布方法,包括
44、有限状态机设计,通过引入有限状态机,进行系统行为建模,用于描述在系统内所经历的状态序列,以及系统如何响应来自外界的各种事件;
45、多目标划分,主要包括传输目标划分和处理策略划分;
46、排序策略,根据用户选择与否,分为交互式和非交互式场景,交互式场景下,用户进行个性化选择目标,并利用强化学习排序策略对剩余目标进行排序;非交互式场景下,采用博弈论多目标排序方法对多目标进行排序;
47、数据处理,根据排序策略给出的多目标最优集,利用处理策略对数据进行处理;
48、路径规划,将路由特征结合给出每个路由的权重系数,利用智能优化算法进行路径规划,选择出符合多目标的最优发布路径,得到路由路径。
49、优选的,所述多目标划分如下:根据发布数据特征将目标划分为数据机密性目标、数据可用性目标、数据传输速率目标和数据完整性目标;
50、所述数据机密性和数据可用性、数据传输速率和数据完整性相悖。在设计数据处理策略时,将数据机密性和数据可用性、数据传输速率和数据完整性两两进行划分,
51、隐私保护策略设计如下:
52、(1)高机密性+高可用性:加密计算;
53、(2)高机密性+中可用性:分布式计算;
54、(3)中机密性+中可用性:数据干扰;
55、(4)中机密性+低可用性:数据匿名;
56、(5)低机密性+低可用性:直接计算;
57、传输策略设计如下:
58、(1)高传输速率+高完整性:无损压缩;
59、(2)高传输速率+低完整性:有损压缩;
60、(3)低传输速率+低完整性:普通传输。
61、优选的,所述强化学习排序策略设计如下:所述强化学习排序策略应用于交互状态下,当用户选择某一目标为最优目标时,利用强化学习排序策略对剩余目标进行排序,具体步骤如下:
62、步骤s1:用户选择数据发布目标s,包括:数据机密性目标、数据可用性目标、数据传输速率目标和数据完整性目标;
63、步骤s2:设计目标函数,将数据发布目标s设定为优化目标,即强化学习排序策略的目标为寻找使得数据发布目标s最大的排序策略;
64、步骤s3:对目标函数进行学习,设计奖励机制,满足奖励机制的情况下,各个目标才能获得奖励;
65、步骤s4:循环步骤3,直至达到设定循环次数;
66、步骤s5:输出最优多目标排序结果,根据结果执行相应的隐私保护策略和传输策略。
67、奖励机制设计如下:
68、
69、优选的,所述博弈论多目标排序设计如下:所述博弈论多目标排序应用于非交互状态下,用户没有特定的数据发布要求下,选择博弈论对多个目标进行排序,具体步骤如下:
70、步骤s1:设计目标函数,用户没有特定的目标,目标函数设计为使得系统最优的多个目标排序结果;
71、步骤s2:采用博弈论方法对多目标进行排序,这里采用纳什均衡进行多目标排序;
72、步骤s3:循环步骤2,直至达到设定循环次数;
73、步骤s4:输出最优多目标排序结果,根据结果执行相应的隐私保护策略和传输策略。
74、优选的,所述路由路径设计如下:
75、步骤s1:根据多目标排序结果和用户发送的关于路径规划的请求信息进行路径规划,所述请求信息包括源点、目的点;
76、步骤s2:根据请求信息确定一条由源点到目的点的路径,令智能优化算法迭代次数k为0;
77、步骤s3:采集各个中间路由的特征,包括吞吐量、等待时间和路由器状态等,并给出相应的权重值w;
78、步骤s4:根据路径中的各个中间路由权重值及迭代次数k判断路径是否满足第一预设条件,当满足第一预设条件时,向用户发送路径,否则执行步骤5;
79、步骤s5:对路径进行优化调度,得到新的路径,将迭代次数k加1,并返回步骤3。
80、有益效果
81、本发明提供了一种基于有限状态机和多目标学习的数据发布方法及系统。与现有技术相比具备以下有益效果:
82、(1)、该基于有限状态机和多目标学习的数据发布方法及系统,将数据发布流程细化,并针对不同目标的数据给出相应的处理策略,最大化地保证数据发布的目的;并利用强化学习和博弈论给出最优的多目标排序,更加合理的对数据进行针对性处理;最后利用智能优化算法给出最佳数据发布路径。
83、(2)、该基于有限状态机和多目标学习的数据发布方法及系统,用以解决数据发布过程中存在的数据机密性问题、数据可用性问题、传输速率和数据完整性问题。提出的方法和系统,可应用于交互式场景和非交互式场景下;考虑到数据机密性、可用性、传输速率和完整性等多目标数据发布需求,应用强化学习和博弈论理论对多目标进行排序,给出最优数据发布策略;根据排序结果对数据执行相应的隐私保护策略和传输策略;同时,采用优化算法对数据发布路径进行寻优,确保安全高效的执行数据发布任务。