本发明属于计算机,具体涉及一种基于组合多臂老虎机和双边拍卖的数据交易方法。
背景技术:
1、典型的数据交易系统包括一个驻留在云上的平台。通过该平台,服务请求者可以公布自己的感知任务,并招募移动用户(即工作人员)来完成这些任务。一般来说,由于不同的智能手机和移动行为,即使是相同的任务,员工也可能会产生不同的感知质量。因此,招聘工人以达到更高的完工质量或更低的成本是mcs中最重要的问题之一。近年来在设计工人招聘或任务分配算法方面做了大量的工作。然而,大多数现有的工作假设工人的感知素质是事先已知的,这在实践中是不正确的。
2、因此,基于上述条件已知的假设设计的数据交易系统经常只能得到社会效益的次优解,不能实现社会效益的最大化。
技术实现思路
1、本发明实施例提供了一种基于组合多臂老虎机和双边拍卖的数据交易方法,可以解决基于工人数据质量已知的假设设计的数据交易系统经常只能得到社会效益的次优解,不能实现社会效益的最大化的问题。
2、第一方面,本发明实施例提供的一种基于组合多臂老虎机和双边拍卖的数据交易方法,所述方法应用于数据交易系统,所述数据交易系统包括数据平台和运营端,所述方法包括:
3、基于组合多臂老虎机算法,数据平台从数据质量未知的数据提供者中选择数据工人,其中,数据工人的数据质量较高;
4、基于双边拍卖算法,运营端确定每个数据请求者的最佳收益和最佳支付成本;
5、其中,最佳收益为数据请求者从数据平台获取的收益,数据请求者的最佳支付成本为数据请求者支付给数据平台的费用,最佳支付成本是根据数据平台的最佳数据提供量确定的,数据平台提供的数据是由数据工人获取的,根据最佳收益和最佳支付成本得到的社会效益最大。
6、根据本发明提供的方法,通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。
7、在第一方面的一种可能的实现方式中,数据平台可以选取每一个数据提供者进行在线学习,得到所有数据提供者的初始置信上界指数;然后基于多臂老虎机算法,根据数据提供者的第t-1个质量成本比,选取k个数据提供者进行第t轮在线学习,以更新每个数据提供者的第t个置信上界指数,并根据第t个置信上界指数确定第t个质量成本比;一直基于多臂老虎机算法,进行在线学习,直至预算消耗尽为止;最后将第t个质量成本比较高的前k个数据提供者,确定为数据工人。
8、示例性的,数据提供者在进行在线学习时需执行至少一个数据获取任务。数据提供者在执行数据获取任务时消耗部分预算。
9、示例性的,t=1,2……t,第0个置信上界指数为初始置信上界指数。初始置信上界指数和置信上界指数是根据数据提供者执行数据获取任务时获取到的数据的数据质量确定的。
10、在第一方面的一种可能的实现方式中,数据平台可以选取第t-1个质量成本比较高的前k个数据提供者,进行第t轮在线学习,得到第k个学习者的第t个任务执行次数,和第k个学习者在执行第m个数据获取任务时获取到的数据的数据质量;根据第k个学习者的第t-1个置信上界指数、第k个学习者的第t个任务执行次数,和第k个学习者在执行数据获取任务时获取到的数据的数据质量,确定第k个学习者的第t个置信上界指数;根据非学习者的第t-1个置信上界指数,确定非学习者的第t个置信上界指数。
11、示例性的,学习者为进行第t轮在线学习的数据提供者,k=1,2……k,m=1,2……mn,mn为第n个数据提供者的任务执行次数,任务执行次数为学习者进行第t轮在线学习时执行的数据获取任务的总数。
12、示例性的,非学习者为未进行第t轮在线学习的数据提供者。
13、在第一方面的一种可能的实现方式中,数据提供者的第t个置信上界指数可以满足下述公式:
14、
15、
16、其中,为第n个数据提供者的第t个置信上界指数;为可加性因子;为在进行前t轮在线学习时,第n个数据提供者执行的数据获取任务的总数;α为一个正的超参数;为数据提供者的第t个数据质量均值,φn,t=0表示第n个数据提供者为非学习者,φn,t=1表示第n个数据提供者为学习者,mn为第n个数据提供者的任务执行次数,为第n个数据提供者在进行第t轮在线学习时执行的第m个数据获取任务的数据质量。
17、在第一方面的一种可能的实现方式中,运营端可以基于双边拍卖算法,确定多个数据请求者的最佳数据请求量和数据平台提供给每个数据请求者的最佳数据提供量;根据数据请求者的最佳数据请求量,确定数据请求者的最佳支付成本;根据数据平台的最佳数据提供量,确定数据请求者的最佳收益。
18、在第一方面的一种可能的实现方式中,运营端可以根据数据请求者的第i个第一拉格朗日乘子、学习率、第i个数据请求量及数据平台的第i个数据提供量,确定数据请求者的第i+1个第一拉格朗日乘子;根据学习率、第i个第二拉格朗日乘子及第i个数据提供量,确定第i+1个第二拉格朗日乘子;分别确定数据提供者的第i+1个第一拉格朗日乘子的第一差值比率是否小于第一阈值,第i+1个第二拉格朗日乘子的第二差值比率是否小于第二阈值;若数据提供者的第i+1个第一拉格朗日乘子的第一差值比率小于第一阈值,并且第i+1个第二拉格朗日乘子的第二差值比率小于第二阈值,则将数据请求者的第i个数据请求量确定为数据请求者的最佳数据请求量,并将数据平台的第i个数据提供量确定为最佳数据提供量。
19、在第一方面的一种可能的实现方式中,在确定最佳数据请求量之前,运营端可以基于第一分配模型,根据数据请求者的第i-1个数据请求量,确定运营端分配给数据请求者的第i个数据请求分配量;根据数据请求者的第i个第一拉格朗日乘子和第i个数据请求分配量,确定数据请求者第i次出价的第i个数据请求量;基于第二分配模型,根据数据平台的第i-1个数据提供量,确定运营端分配给数据平台的第i个数据提供分配量;根据第i个第二拉格朗日乘子和数据请求者的第i个第一拉格朗日乘子及第i个数据提供分配量,确定数据平台第i次出价时对数据请求者的第i个数据提供量。
20、根据本发明提供的方法,通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。进一步的,基于数据提供者的ucb指数来选择数据工人,能够实现多臂老虎机问题中探索和利用之间的权衡;使用ucb指数和成本的比值,即质量成本比,选择数据工人,能够确保拍卖机制的真实性;通过第一分配模型和第二分配模型确定下一轮数据平台和数据请求者的出价,能够诱导数据请求者和数据平台以真实的方式投标。
21、第二方面,本发明实施例提供了一种数据交易系统,所述数据交易系统包括数据平台和运营端;
22、数据平台用于:基于组合多臂老虎机算法,从数据质量未知的数据提供者中选择数据工人,其中,数据工人的数据质量较高;
23、运营端用于:基于双边拍卖算法,确定每个数据请求者的最佳收益和最佳支付成本;
24、其中,最佳收益为数据请求者从数据平台获取的收益,数据请求者的最佳支付成本为数据请求者支付给数据平台的费用,最佳支付成本是根据数据平台的最佳数据提供量确定的,数据平台提供的数据是由数据工人获取的,根据最佳收益和最佳支付成本得到的社会效益最大。
25、第三方面,本发明实施例提供了一种电子设备,包括处理器和存储器,其中,存储器用于存储计算机程序;处理器可以用于执行存储在存储器中的计算器程序(指令),以实现上述第一方面的方法。
26、第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储由计算机程序,当计算机程序被执行时,可以实现如上述第一方面的方法。
27、可以理解的是上述第二方面至第四方面的有益效果可以参见上述第一方面的相关描述,在此不赘述。
28、本发明实施例与现有技术相比存在的有益效果是:根据本发明提供的方法,通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。