基于sap的数据抽取方法

文档序号:8381233阅读:3388来源:国知局
基于sap的数据抽取方法
【技术领域】
[0001]本发明涉及通信技术领域,具体地,涉及一种基于SAP的数据抽取方法。
【背景技术】
[0002]SAP-ECC(SAP企业核心组件)作为主要的企业资源管理OLTP(联机事务处理)系统,承载着企业各个部门的大量业务原始单据、明细数据。同时也成为诸如BI/BW等OLAP(联机事务分析)系统的主要数据源。
[0003]由于SAP-ECC中存在大量的原始数据,OLAP系统或其他类似业务系统标准的增量抽取中会包含一大部分报表出具时不需要的凭证信息,重复进行增量抽取时还会包含大量重复抽取的凭证信息,这样会增加不必要的增量抽取的时间,难以满足报表出具对OLAP系统中数据时效性的要求。
[0004]针对上述问题,现有技术中尚无良好解决方案。

【发明内容】

[0005]本发明的目的是提供一种方法,通过从每日海量的新增凭证中筛选出所需的变动凭证信息,以实现通过用户定义的特定逻辑选择方式,基于凭证快速抽取或同步数据。
[0006]为了实现上述目的,本发明提供一种基于SAP的数据抽取方法,该方法包括:从SAP ECC中的凭证数据中,滤除在待出报表账期范围外并且已抽取的凭证数据,并从剩余的凭证数据中提取变更的且感兴趣的凭证数据;以及对所述感兴趣的凭证数据进行鉴别以获得有抽取价值的凭证数据。
[0007]进一步地,所述滤除在待出报表账期范围外并且已抽取的凭证数据,并从剩余的凭证数据中提取变更的且感兴趣的凭证数据的步骤包括:根据待出报表账期范围和凭证数据的账期信息,滤除所述账期范围外的变更的凭证数据;以及在所述账期范围内的变更的凭证数据中提取凭证数据的变更的时间在上一次抽取后的变更的凭证数据。
[0008]进一步地,该方法还包括:监控包含凭证信息修改时间的堆栈表,根据所述堆栈表中的凭证数据修改时间确定变更的凭证数据。
[0009]进一步地,所述有抽取价值的凭证数据包括以下中的至少一者:未加载过的凭证数据、需要重新加载的凭证数据。
[0010]进一步地,该方法还包括:构建对应于所述方法的每个步骤的模型,该模型被配置成以全部凭证数据作为输入,以及以有抽取价值的凭证数据作为输出;以及当所述模型中不存在在途的凭证数据时,确定输出全部有抽取价值的凭证数据。
[0011]进一步地,该方法还包括:将每个步骤划分为多个子任务节点;分配完成子任务节点所需的运算到所述计算机集群中的多个计算机节点进行运算处理;保存所述多个计算机节点运算处理的状态快照;以及当所述子任务节点中断时,根据所述状态快照恢复中断前的子任务节点状态,以及继续执行中断的子任务节点。
[0012]进一步地,该方法还包括:对所述多个计算机节点进行心跳检测;以及将分配到心跳检测无响应的计算机节点的运算再分配到其他计算机节点。
[0013]进一步地,该方法还包括:将所述多个计算机节点的运算处理结果保存到与所述计算机集群中的所有计算机节点连接的共享存储器。
[0014]进一步地,该方法还包括:当执行当前子任务节点的所有计算机节点运算处理完成后,对完成下一个子任务节点所需的运算进行分配。
[0015]进一步地,该方法还包括:根据贪婪算法分配所述完成子任务节点所需的运算。
[0016]通过上述技术方案,能够在SAP ECC端对凭证数据进行筛选,得到有抽取价值的凭证数据,因此,在需要对凭证数据抽取时可以直接抽取有抽取价值的凭证数据,能够极大地缩短抽取时间、提高抽取效率。
[0017]本发明的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。
【附图说明】
[0018]附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的【具体实施方式】一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0019]图1是根据本发明实施方式的基于SAP的数据抽取方法流程图;
[0020]图2是根据本发明示例性实施方式的基于SAP的数据抽取方法流程图;
[0021]图3是根据本发明示例性实施方式的基于SAP的数据抽取方法流程图。
【具体实施方式】
[0022]以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0023]图1是根据本发明实施方式的基于SAP的数据抽取方法流程图。如图1所示,本发明实施方式提供的基于SAP的数据抽取方法可以包括:S101,从SAP ECC中的凭证数据中,滤除在待出报表账期范围外并且已抽取的凭证数据,并从剩余的凭证数据中提取变更的且感兴趣的凭证数据;以及S102对所述感兴趣的凭证数据进行鉴别以获得有抽取价值的凭证数据。通过上述技术方案,能够在SAP ECC端对凭证数据进行筛选,得到有抽取价值的凭证数据,因此,在需要对凭证数据抽取时可以直接抽取有抽取价值的凭证数据,能够极大地缩短抽取时间、提高抽取效率。
[0024]通过上述实施方式,通过设置多重过滤条件,能够从大量待抽取凭证中找到所需的凭证,从而实现对大量待抽取凭证中有价值凭证数据的快速检索,进而大大缩短通过OLAP系统或其他业务系统抽取凭证数据的时间。在实施方式中,感兴趣的凭证数据可以包括感兴趣的公司和/或公司范围的凭证数据。所获得的感兴趣的凭证数据可以定义为有价值的数据。通过定位有价值的数据,并对有价值的数据进行同步,避免了不必要的资源浪费。
[0025]进一步优选地,滤除在待出报表账期范围外并且已在系统间同步(或抽取)的凭证数据,并从剩余的凭证数据中提取变更的且感兴趣的凭证数据的步骤可以包括:根据待出报表账期范围和凭证数据的账期信息,滤除所述账期范围外的变更的凭证数据;以及在所述账期范围内的变更的凭证数据中提取凭证数据的变更的时间在上一次同步后的变更的凭证信息。
[0026]下面结合一个示例性实施方式进一步说明。
[0027]在一个示例性实施方式中,上述筛选和过滤方法可以包括:基于出具报表时帐期的限制要求(例如,某年中的某月),首先对不在当前报表出具的帐期范围内的变动凭证进行过滤,然后再基于凭证的变动时间进行过滤,排除通过标准程序已经同步的凭证数据。考虑到财务业务的实际需要,接着还可以基于凭证的公司代码进行过滤,排除公司代码不在当前报表范围内的凭证数据。显然,通过以上三步骤,可以从海量的变动凭证中屏蔽掉绝大多数的凭证记录。
[0028]执行完以上的三个步骤之后,接着可以针对筛选出来的凭证记录再进行逐条鉴另I」。具体的鉴别步骤可以包括:通过比对持久数据缓存区(PSA)中的历史数据包,定位尚未加载的凭证;通过比对PSA中凭证抽取时间与变动凭证的变动时间,定位需要重新加载的凭证;以及通过BW数据模型中的数据请求包的加载状态与时间,判断属于在途数据的凭证,对于属于在途数据的凭证,需要继续等待完成加载操作。
[0029]通过以上方法,能够将有价值的凭证数据提供给用户,即提供给用户的都是用户需要的凭证数据。当存在数据快速同步需求时,可以选中凭证编号并调用基于凭证抽取的数据源进行凭证数据的抽取,并通过例如
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1