一种以算法模型作为数据载体的数据交易平台及方法与流程

文档序号:24041104发布日期:2021-02-23 16:50阅读:71来源:国知局
一种以算法模型作为数据载体的数据交易平台及方法与流程

[0001]
本发明涉及数据安全领域,能够解决在不可信执行环境下进行数据交易的数据安全问题,使得数据交易流程便捷、可控、安全。


背景技术:

[0002]
目前世界各国家、地区的数据交易模式依据数据交易平台的作用不同,可以区分为基于处理型中介的数据交易模式和纯粹中介型数据交易模式。基于处理型中介的数据交易模式以数据分析结果为交易对象,交易流程不涉及原始数据。其缺点在于数据分析结果过于简单、固定,后续可操作性、可分析性不足。该数据交易模式对于专业性、跨行业性行业领域作用过于微弱,数据交易主体的参与积极性不强。纯粹中介型数据交易模式指不存储、分析数据而仅仅作为交易渠道的交易模式,对象包括原始数据、组合数据以及数据分析结果。其缺点在于交易平台仅仅沦为交易渠道,对于数据买卖双方需求、交易情况无法有效获悉。一方面该数据交易模式使得原始数据中敏感信息存在泄露风险,而平台等相关方无法实施有效监管、治理。另一方面数据安全性缺陷也使得数据所有者存在较大交易风险,数据所有者进行交易的积极性不强。此外是跨境数据流通中数据“被遗忘权”、数据归属等问题纯粹中介型数据交易模式均无法规避,使得该模式无法在跨境数据流通得到有效实施。


技术实现要素:

[0003]
(一)解决的技术问题
[0004]
针对现有技术的不足,本发明提供了一种以算法模型作为数据载体的数据交易平台及方法。
[0005]
(二)技术方案
[0006]
为实现上述目的,本发明提供如下技术方案:本发明的一种以算法模型作为数据载体的数据交易平台,包括:
[0007]
数据管理模块:包括平台数据库及第三方上传数据,第三方上传数据进行脱敏处理后连接平台数据库,所述平台数据库对数据基本内容、数据容量、数据敏感程度等信息进行描述;
[0008]
开发环境模块:内置开发环境并连接开发者,限制数据外传;
[0009]
模型开发模块:连接数据管理模块及开发环境模块,通过下载数据集到开发环境对数据集按建模需要进行数据清洗、调整,经调整后的数据可进行上传,所有数据将完整保留在开发机器上直至开发完成,开发完成后数据将被格式化;
[0010]
模型需求模块:发布算法模型需求,包括具体分析目的、数据需求、交易期限、奖励金额以及评估验收程序,同时生成并发布智能合约;
[0011]
模型交易模块:获取模型开发模块的模型结构,在指定交易期限内依据排名顺序选取排名高者进行算法模型交易,如未满足需求则驳回并将信息反馈给模型开发模块。
[0012]
开发环境模块还包含模型训练数据构建子模块,为沙盒提供模型训练需要使用的
数据环境,为保证真实数据源的安全问题,采用对真实数据源进行备份的方式构建训练用数据,以主备的方式快速恢复训练用数据环境,数据集从开发环境所联通的平台云盘中获取。
[0013]
本发明改进有,数据管理模块、开发环境模块、模型开发模块、模型需求模块及模型交易模块内的信息均通过云端传递。
[0014]
本发明改进有,模型开发模块平台所提供的沙盒环境中,且包括模型训练对象部署子模块,模型训练对象部署模块根据预设的配置模板在目标机器上生成沙盒环境,配置模板中包含沙盒环境的基本配置信息。
[0015]
本发明改进有,所述模型交易模块还包括对比模块,在满足算法模型需求方预设的需期望阈值的基础上通过交易规则筛选是否满足交易。
[0016]
本发明改进有,模型交易模块内含托管账户子模块,托管账户模块保存奖励金至交易阶段结束。
[0017]
本发明进一步提供一种以算法模型作为数据载体的数据交易方法,包括以下步骤:
[0018]
步骤1:数据提供方经数据脱敏处理后,在平台数据库上传、存储原始数据,并就数据基本内容、数据容量等信息进行描述;
[0019]
步骤2:算法模型需求方根据数据提供方所提供的描述信息,针对步骤1所述数据发布算法模型需求;
[0020]
步骤3:算法开发方远程登录平台模型开发模块所提供的沙盒环境,通过开发环境模块所联通的平台云盘获取个人所购买的数据集,在模型开发模块中进行模型开发、模型训练,开发完成后将模型、评分结果上传至平台;
[0021]
步骤4:算力提供方可将其机器托管至平台为其他用户提供算力支持并获得收益。算法开发方可根据需求租用托管在平台上的不同性能的机器进行训练模型;
[0022]
步骤5:各算法开发方发布算法模型并由评估验收程序评估、排序,在指定交易期限内依据排名顺序选取排名高者进行算法模型交易,交易由智能合约自动完成并记录交易过程。
[0023]
所述步骤2包括:
[0024]
(1)算法模型需求方将需求发布至平台,需求包含算法模型需求详情部分、算法模型验证程序部分、算法模型开发周期部分、算法模型开发奖励金额。其中需求详情部分指算法模型需求方需提供需求描述和模型功能描述,对算法模型应用场景和预期功能进行说明;模型验证程序部分指算法模型需求方需相应提供测试数据集、评分方式、通过条件等内容,以供模型验收环节中调用并判断算法模型是否符合交易条件;
[0025]
(2)平台自动对算法模型需求方发布的需求进行需求合法性验证,需求合法性验证在算法模型需求方发布需求时自动触发,若需求不合法则通知需求方修改。
[0026]
(3)通过需求合法性验证后,平台根据需求自动生成智能合约。
[0027]
所述步骤2中合法性验证其步骤包括:
[0028]
(1)基于所述区块链上预先建立的服务验证节点,对所述目标服务进行服务验证分析;
[0029]
(2)基于所述共识机制,对服务验证分析结果进行预处理;
[0030]
(3)将所述服务验证分析结果进行归类处理,获得若干类分析结果;
[0031]
(4)判断每类所述分析结果是否都满足对应的预设结果范围,若是,判定所述目标服务合法,并将所述目标服务进行保留;
[0032]
(5)否则,基于服务修改数据库,输出所述目标服务的修改信息给所述服务主,直至修改的目标服务合法。
[0033]
本发明改进有,还包括托管方法,算法模型需求方将奖励金提存至托管账户,至交易阶段结束前该托管账户一直代持有奖励金。
[0034]
本发明改进有,所述步骤1中上传的数据需要经过脱敏处理。
[0035]
本发明改进有,所述步骤2中算法模型需求须通过需求合法性验证。
[0036]
本发明改进有,所述步骤2中算法模型需求自动生成智能合约,并将交易细节记录于区块链。
[0037]
(三)有益效果
[0038]
与现有技术相比,本发明提供了一种以算法模型作为数据载体的数据交易平台及方法,具备以下有益效果:
[0039]
有效解决前述数据交易模式的缺陷,兼具数据聚合、交易记录、管理监督等功能,在监管有效性、数据安全性、交易便捷性方面有所突破。满足数据安全性、数据可监管性、数据可用性基础上,算法模型需求方可以对算法模型进行分析、处理并引入其他训练样本更新算法模型。本发明能够有效推动数据所有者主动、积极共享数据并对数据衍生物确权、赋能,进而为以数据为核心的数字经济激发新动能。
附图说明
[0040]
图1为本发明的系统示意图;
[0041]
图2为本发明的数据管理模块示意图;
[0042]
图3为本发明的模型开发模块示意图;
[0043]
图4为本发明的模型交易模块示意图;
[0044]
图5位本发明的发布需求的模块示意图。
具体实施方式
[0045]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046]
参照附图1至附图5,一种以算法模型作为数据载体的数据交易平台,包括:
[0047]
数据管理模块:包括平台数据库及第三方上传数据,第三方上传数据进行脱敏处理后连接平台数据库,所述平台数据库对数据基本内容、数据容量、数据敏感程度等信息进行描述;
[0048]
开发环境模块:内置开发环境并连接开发者,限制数据外传;
[0049]
模型开发模块:连接数据管理模块及开发环境模块,通过下载数据集到开发环境对数据集按建模需要进行数据清洗、调整,经调整后的数据可进行上传,所有数据将完整保
留在开发机器上直至开发完成,开发完成后数据将被格式化;
[0050]
模型需求模块:发布算法模型需求,包括具体分析目的、数据需求、交易期限、奖励金额以及评估验收程序,同时生成并发布智能合约;
[0051]
模型交易模块:获取模型开发模块的模型结构,在指定交易期限内依据排名顺序选取排名高者进行算法模型交易,如未满足需求则驳回并将信息反馈给模型开发模块。
[0052]
交易参与主体如下:
[0053]
数据提供方:数据提供方在平台数据库上传、存储原始数据,并就数据基本内容、数据容量等信息进行描述;
[0054]
算法模型需求方:算法模型需求方根据数据提供方所提供的信息,在平台发布算法模型需求。其中算法模型需求须附上评估验收所需数据,涵盖目标算法模型输入数据及目标输出结果,以供算法提供方进行验证、评分;
[0055]
算法开发方:算法开发工程师远程登录平台所提供的沙盒环境,通过在开发环境所联通的平台云盘获取个人所购买的数据集,在沙盒环境中进行模型开发,开发完成后将模型、评分结果上传至平台。
[0056]
算力提供方:算力提供方可将其机器托管至平台为其他用户提供算力支持并获得收益;算法开发方可根据需求租用托管在平台上的不同性能的机器进行训练模型。
[0057]
托管账户:算法模型需求方将奖励金提存至托管账户,至交易阶段结束前该托管账户一直持有奖励金。
[0058]
开发环境:算法开发方根据需求租用平台所提供的不同性能级别机器,平台将自动构建运行在所选机器上的开发环境,初始化配置操作系统、基本的软件开发条件。算法开发方可在平台构建环境前根据需求选择环境初始化所需配置的操作系统、软件版本信息等,也可在构建完成环境后自主配置环境信息。算法开发方通过远程登陆形式登入开发环境之中,开发环境中的一切数据将被隔离无法外传。
[0059]
数据:算法开发方可根据建模需求在平台购买不同的数据集,也可自主上传数据集。个人数据集将存储于平台提供的云盘之中,云盘数据仅与开发环境打通,算法开发方在通过远程登录进入开发环境中,才可使用云盘中的数据。通过下载云盘中的数据集到开发环境,对数据集按建模需要进行数据清洗、调整,所调整后的数据可上传至个人云盘,供以后使用。所有数据将完整保留在开发机器上直至开发完成后,数据将被格式化。
[0060]
本实施例中,数据管理模块、开发环境模块、模型开发模块、模型需求模块及模型交易模块内的信息均通过云端传递。
[0061]
本实施例中,模型开发模块位于沙盒环境中。
[0062]
各算法开发方发布算法模型并由评估验收(函数)程序评估、排序,在指定交易期限内依据排名顺序选取排名高者进行算法模型交易(还需满足算法模型需求方预设的需期望阈值),交易由智能合约自动完成并记录交易过程。
[0063]
本发明进一步提供了一种以算法模型作为数据载体的数据交易方法,其特征包括以下步骤:
[0064]
步骤1:数据提供方经数据脱敏处理后,在平台数据库上传、存储原始数据,并就数据基本内容、数据容量等信息进行描述;
[0065]
步骤2:算法模型需求方根据数据提供方所提供的描述信息,针对步骤1所述数据
发布算法模型需求;
[0066]
步骤3:算法开发方远程登录平台模型开发模块所提供的沙盒环境,通过开发环境模块所联通的平台云盘获取个人所购买的数据集,在模型开发模块中进行模型开发、模型训练,开发完成后将模型、评分结果上传至平台;
[0067]
步骤4:算力提供方可将其机器托管至平台为其他用户提供算力支持并获得收益。算法开发方可根据需求租用托管在平台上的不同性能的机器进行训练模型;
[0068]
步骤5:各算法开发方发布算法模型并由评估验收程序评估、排序,在指定交易期限内依据排名顺序选取排名高者进行算法模型交易,交易由智能合约自动完成并记录交易过程。
[0069]
所述步骤2包括:
[0070]
(1)算法模型需求方将需求发布至平台,需求包含算法模型需求详情部分、算法模型验证程序部分、算法模型开发周期部分、算法模型开发奖励金额。其中需求详情部分指算法模型需求方需提供需求描述和模型功能描述,对算法模型应用场景和预期功能进行说明;模型验证程序部分指算法模型需求方需相应提供测试数据集、评分方式、通过条件等内容,以供模型验收环节中调用并判断算法模型是否符合交易条件;
[0071]
(2)平台自动对算法模型需求发布的需求进行需求合法性验证,需求合法性验证在算法模型需求方发布需求时自动触发,若需求不合法则通知需求方修改。
[0072]
(3)通过需求合法性验证后,平台根据需求自动生成智能合约并发布需求。
[0073]
所述区块链通过预先建立的共识机制,对所述服务交易数据进行共识处理,并基于记账节点将共识处理结果记录到所述区块链上。算法模型需求方直接发布需求,算法开发方直接获取需求,有效节省算法模型需求方获取服务的时间,省去中间环节,提高整个过程的透明性。
[0074]
所述步骤2中合法性验证其步骤包括:
[0075]
(1)基于所述区块链上预先建立的服务验证节点,对所述目标服务进行服务验证分析;
[0076]
(2)基于所述共识机制,对服务验证分析结果进行预处理;
[0077]
(3)将所述服务验证分析结果进行归类处理,获得若干类分析结果;
[0078]
(4)判断每类所述分析结果是否都满足对应的预设结果范围,若是,判定所述目标服务合法,并将所述目标服务进行保留;
[0079]
(5)否则,基于服务修改数据库,输出所述目标服务的修改信息给所述服务主,直至修改的目标服务合法。
[0080]
上述服务验证节点是为了对目标服务进行验证分析,粗确定目标服务的合法性,通过对验证分析记过进行预处理,确定目标服务的合法性。
[0081]
上述若干类信息结果,例如为:服务内容虚假类、服务地址虚假类等;
[0082]
上述预设结果范围,例如与服务内容虚假类对应的为,服务内容中的涉及到的技术是否合格,服务内容中的涉及到的具体数据目标是否真实等。
[0083]
上述技术方案的有益效果是:通过对目标服务的合法性进行判断,便于保证其服务的真实性,便于保证用户的财产安全,且通过输出修改信息,便于对目标服务进行修改,来提高其的合法性。
[0084]
进一步的,为了加强交易的安全,本发明也可以采用通过区块链中的智能合约与新的解密密钥传输方案相结合,将数据和货款之间的交换转换为解密密钥和货款之间的交换,在没有可信第三方的情况下,保证数据交易双方的公平性,且大幅降低交易中给第三方的费用,同时避免了交易平台单点失败的情形。智能合约在保证解密密钥有效的情况下,提出的密钥传输协议允许任何人在不暴露底层解密密钥的情况下检查密钥的有效性,从而使买卖双方的公平性可以同时达到。
[0085]
通过这种交易方式有如下优点:
[0086]
数据安全性:基于数据上传阶段脱敏、拆分隐私等预处理以及算法开发阶段处于封闭的沙盒环境中,保证技术层面上原始数据难以被泄露。
[0087]
且由于算法模型自身特性,一方面是通过逆向攻击、推理攻击等常见算法模型攻击方法难以获悉原始数据或训练样本数据,理想状况下也仅能了解部分数据或其统计特征信息。另一方面是逆向攻击、推理攻击等常见算法模型攻击方法具有非经济性,出于经济理性的考量通常不会直接对算法模型进行攻击。
[0088]
数据便捷性:算法模型在使用上较为便捷,算法模型需求方可以根据算法模型针对性的获悉原始数据统计特征信息等内容。甚至可以通过引入新数据更新算法模型,进行后续的分析、操作行为。
[0089]
另一方面是算法模型权属明确且数据安全性能够保障,使得算法模型能够进行多次交易,进而便于数据的流转、使用。
[0090]
数据可控性:算法模型交易由智能合约完成且其交易流程记录、提存于平台区块链,保证交易流程可回溯、可监管。
[0091]
数据提供方所提供的数据以及算法需求方发布的算法模型均存储于平台中心数据库,保证平台方、监管方能够及时对不合规数据或算法模型进行删除。
[0092]
而目前现有技术一般直接对原始数据、组合数据进行交易,其数据泄露的安全风险无法规避。而采取区块链等技术对数据直接进行在线交易,一方面资源消耗过大需要多个数据库同时储存交易数据信息,另一方面也造成数据需求方在使用时的不便;如若仅仅对数据分析结果进行交易,则致使数据的可分析性、可操作性过低而无法满足使用需求。
[0093]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1