本发明涉及数据集成,具体是一种适于交互工序流程管理的多层次化数据集成模型。
背景技术:
1、近几十年来,科学技术的迅猛发展和信息化的推进,使得人类社会所积累的数据量已经超过了过去5000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。随着科技的发展,以及市场竞争压力越来越大,许多行业存在很多问题,比如生产力低下,工作重复度高,容易漏除某项工作,所以越来越多的领域引入交互工序流程去进行作业,越来越多的新型技术加入到交互工序流程管理的领域中,能够让交互工序流程管理模型可以更广泛、高效地服务于各类业务系统。由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息等棘手问题,严重阻碍了交互工序流程的信息收集和信息处理的效率。因此,准确确定交互工序流程数据信息的来源,对获得的数据信息进行清洗和转换,最终组合成完整的交互工序流程,以提高交互工序流程的信息处理效率具有重要的理论和现实意义;
2、如何对上传的数据信息进行数据清洗和数据整合,并进行数据验证,将部分化的数据信息整合成完整的交互工序流程数据信息,是我们需要解决的问题,为此,现提供一种适于交互工序流程管理的多层次化数据集成模型。
技术实现思路
1、本发明的目的在于提供一种适于交互工序流程管理的多层次化数据集成模型,获取交互工序流程数据信息,对其进行数据清洗,将数据清洗后的数据源信息进行数据整合,使得不同的数据源信息能够在一起使用,构成交互工序流程数据信息,并进行数据验证,确定进行数据整合后的数据源信息能够正常使用。
2、本发明需要解决的技术问题为:如何提供一种数据集成模型,能够提高交互工序流程的信息处理效率。
3、本发明的目的可以通过以下技术方案实现:
4、步骤s1:构建交互平台,通过交互平台上传交互工序流程数据源信息,并构建数据源库;
5、步骤s2:根据获得的数据源库,对获得的交互工序流程数据源信息进行数据清洗;
6、步骤s3:获取数据清洗后的交互工序流程数据源信息,对完成数据清洗的数据源信息进行数据整合;
7、步骤s4:对数据整合后的数据源信息进行数据验证。
8、进一步的,构建交互平台,上传客户提供的目标项目和客户需求;
9、设置信息收集端,用于输入目标项目背景信息;
10、设置信息分析模块,根据客户提供的客户需求,对其进行分析,获得客户所需的设计目标;
11、根据获得的设计目标设计方案并实施,获得工序流程,将其分解为若干个流程步骤,识别并提取每个独立的流程步骤作为一个目标流程模块;
12、对获得的目标流程模块进行分组;
13、从目标流程模块分组中各选一个目标流程模块进行随机组合,构成多个目标流程模板;
14、信息分析模块将客户需求、设计目标、设计方案、目标流程模块以及目标流程模板上传至交互平台;
15、构建数据源库,将客户的目标项目和需求、背景信息、设计目标、设计方案、目标流程模块以及目标流程模板上传至数据源库,并标记为数据源信息。
16、所述交互工序流程次序依次为:获取目标项目和需求→收集背景信息→获取设计目标→设计方案→获得目标流程模块→组成目标流程模板,并设置交互工序流程为s。
17、获取数据库内的数据源信息,并对数据源信息进行数据清洗,所述数据清洗包括去除重复数据源信息、填充缺失数据源信息以及删除错误数据源信息;
18、将数据源信息转化为格式统一的字符串,根据交互工序流程次序将数据源信息的字符串依次设置为la、lb、lc、ld、le、lf和lg;
19、所述去除重复数据源信息的过程包括:
20、获取数据源信息的字符串la、lb、lc、ld、le、lf和lg;将字符串末位依次标记为xa、xb、xc、xd、xe、xf和xg;
21、将其与数据源库内的数据源信息进行比较,当la再次出现时,检查字符串末位标记,当字符串末位已经标记为xa时,则该数据源信息la为重复数据源信息,去除该重复数据源信息;相同的,对数据源库内的lb、lc、ld、le、lf和lg比较与la的比较步骤相同。
22、所述填充缺失数据源信息的过程包括:
23、对数据源库内的数据源信息进行筛选,依次与la、lb、lc、ld、le、lf和lg对比;当数据源库内不存在la、lb、lc、ld、le、lf和lg中的任意一个,则数据源信息有缺失,并将缺失的数据源信息填充上。
24、所述删除错误数据源信息的过程包括:
25、获取数据源库内的数据源信息,将其与la、lb、lc、ld、le、lf和lg对比;当获得的数据源信息在la、lb、lc、ld、le、lf和lg中没有匹配的,则该数据源信息为错误数据源信息,并删除错误数据源信息。
26、所述数据整合的过程包括:
27、将数据源信息字符串转换为二进制字符串,所述二进制字符串由若干个0和1字符构成;
28、则字符串la、lb、lc、ld、le、lf和lg依次转换为001、010、011、100、101、110和111;
29、对转换后的二进制字符串进行整合,根据交互工序流程次序,获得交互工序流程的字符串ls=la+lb+lc+ld+le+lf+lg;
30、则交互工序流程的二进制字符串ls为001010011100101110111。
31、对所述数据整合后的数据源信息的数据验证过程包括:
32、根据数据整合后的交互工序二进制字符串ls,获取ls的二进制字符串的字符以及位数;
33、当字符串位数为21时,则数据整合后的二进制字符串没有缺失,将其与ls的二进制字符串从左到右依次进行对比,获取相同位置处的不同字符,将此位置标记为w,计算并取整,标记为w0,计算z=w0+1,则有错误发生的为第z个数据源信息,按照la、lb、lc、ld、le、lf和lg的次序,找出错误的第z个数据源信息,并将其修正为正确的数据源信息;
34、当字符串位数小于或大于21时,则数据整合后的二进制字符串位数错误,删除该二进制字符串,重复步骤s2至步骤s4操作,获得正确位数的二进制字符串;
35、当字符串的字符不为0和1时,则数据整合后的二进制字符串字符异变,删除该二进制字符串,重复步骤s3至步骤s4操作,获得由0和1字符构成的二进制字符串。
36、与现有技术相比,本发明的有益效果是:通过构建交互平台,设置信息接收端和信息分析模块,上传客户的目标项目、客户需求、设计目标、设计方案、目标流程模块以及目标流程模板至交互平台,并构建数据源库,将这些数据信息上传到数据源库中,并标记为数据源信息;对数据源库内的数据源信息进行数据清洗,包括去除重复数据源信息、填充缺失数据源信息以及删除错误数据源信息;获取数据清洗后的数据源信息,将完成数据清洗的数据源信息转化为二进制字符串,对转换后的二进制字符串进行整合,根据交互工序流程次序,获得交互工序流程的字符串;并对数据整合后的数据源信息进行数验证:补全字符串缺失的交互工序流程数据源信息、删除字符串错误的交互工序流程数据源信息以及删除字符异变的交互工序流程数据源信息。
37、实现一种适于交互工序流程管理的多层次化数据集成模型,构建交互平台,上传交互工序流程数据源信息,构建数据源库,对数据源库内的数据源信息进行数据清洗,将数据清洗后的数据源信息进行数据整合,并对数据整合后的数据源信息进行验证,获得正确的数据源信息,以提高交互工序流程信息收集的能力、修正数据信息以及提高信息处理能力。