专利名称:一种分析数据记录集合的系统和方法
技术领域:
本发明涉及计算机系统分布式负载均衡技术,并且尤其涉及的分析数据记录集合的系统和方法。
背景技术:
在对数据记录集合的分析过程中,例如,关于银行卡的交易的数据记录,由于不同银行卡的交易的数据记录数量之间的差异,往往会造成计算机系统分布式负载均衡困难,导致计算机系统整体性能下降。通常,数量巨大的数据记录可以通过多个分析单元进行分布式的分析,但是在一些特定的分析情况下,要求每条数据记录的归属主体由同一分析单元进行分析。例如,在银行卡交易分析中要求同一张银行卡的交易必须在同一个分析单元中进行按序连续分析,才能分析出该银行卡的交易行为轨迹。在这种情况下,由于每张银行卡的交易发生的时间是随机的,要求每条数据记录的归属主体由同一分析单元进行分析的前提下,实现多个分析单元的负载均衡成为难点。又如,当分析单元的数量固定而待分析的数据记录的分布情况发生变化时或者当分析单元的数量发生变化时,计算机系统往往难以适应各个分析单元所产生的负载变化,使得难以关联计算机系统的资源,从而导致计算机系统整体性能下降。同时,为适应数据记录分布情况或者分析单元的数量发生变化,通常需要人工调整每个分析单元的分析范围才能重新达到负载均衡。本发明的目的在于改善计算机系统的内部性能,通过计算机执行一种系统内部性能改进程序控制计算机系统内部对象,使得能够灵活地分配待处理的数据记录集合,进而达到理想的负载均衡状态,从而提高计算机系统的处理性能。
发明内容
为解决上述问题,本发明提供一种分析数据记录集合的系统,其特征在于,该系统包括:数据接收模块,配置成接收数据记录集合;静态配置模块,配置成将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录;动态决策模块,配置成根据处理模块的负载情况,将同一数据块中的数据记录分配给同一分析单元;处理模块,包括多个分析单元,该多个分析单元用于接收并分析来自动态决策模块分配的数据记录。在所述公开的方案中,所述静态配置模块包括:属性设定单元,配置成为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定。粒度配置单元,配置成从属性设定单元设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度,数据划分单元,配置成将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。在所述公开的方案中,所述动态决策模块包括:识别单元,配置成识别待分析的数据记录所属的数据块,匹配单元,配置成将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配,分配单元,配置成将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。在所述公开的方案中,所述匹配单元包括匹配关系存储单元用于存储数据块与分析单元的匹配关系,所述匹配单元进一步配置成根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配,所述分配单元进一步配置成根据匹配关系分配所述待分析的数据记录。在所述公开的方案中,所述匹配单元进一步配置成,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。在所述公开的方案中,所述匹配单元配置成将所述数据块与所述分析单元均匀地进行匹配。在所述公开的方案中,所述匹配单元配置成,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。在所述公开的方案中,所述数据划分单元为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中,所述判断单元根据数据块标识符判断待分析的数据记录所属的数据块。在所述公开的方案中,所述处理模块还包括反馈单元,用于向所述动态决策模块反馈分析单元的状态信息,所述状态信息包括分析单元的数量。所述动态决策模块还包括状态存储单元,状态存储单元配置成存储分析单元数量,所述匹配单元根据分析单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配
在所述公开的方案中,所述状态存储单元进一步配置成所述分析单元按序存储对应的自然数标识符,所述数据块标识符是按顺序分配的自然数,所述匹配单元通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。在所述公开的方案中,当所述反馈单元反馈的分析单元的数量发生变化时,所述匹配单元配置成对所述数据块和所述分析单元进行重新匹配。根据本发明的另一个目的,提供一种分析数据记录集合的方法,其特征在于,该方法包括:数据接收过程,在该过程中接收数据记录集合;静态配置过程,在该过程中将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录;动态决策过程,在该过程中根据处理过程的负载情况,将同一数据块中的数据记录分配给同一分析过程;处理过程,包括利用多个分析单元进行分析的过程,分析单元中接收并分析在动态决策过程中分配的数据记录。在所述公开的方案中,所述静态配置过程包括:属性设定过程,在该过程中为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定。粒度配置过程,在该过程中从属性设定过程设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度,数据划分过程,在该过程中将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。在所述公开的方案中,所述动态决策过程包括:识别过程,在该过程中识别待分析的数据记录所属的数据块,匹配过程,在该过程中将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配,分配过程,在该过程中将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。在所述公开的方案中,所述匹配过程包括匹配关系存储过程用于存储数据块与分析单元的匹配关系,所述匹配过程进一步包括根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配,所述分配过程进一步包括根据匹配关系分配所述待分析的数据记录。在所述公开的方案中,所述匹配过程进一步包括,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。在所述公开的方案中,所述在匹配过程中将所述数据块与所述分析单元均匀地进行匹配。在所述公开的方案中,在所述匹配过程中,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。在所述公开的方案中,所述数据划分过程为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中,所述判断过程根据数据块标识符判断待分析的数据记录所属的数据块。在所述公开的方案中,所述处理过程还包括反馈过程,用于向所述动态决策过程反馈分析单元的状态信息,所述状态信息包括分析单元的数量。所述动态决策过程还包括状态存储过程,状态存储过程在该过程中存储分析单元数量,所述匹配过程根据分析单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配。在所述公开的方案中,所述状态存储过程进一步在该过程中所述分析单元按序存储对应的自然数标识符,所述数据块标识符是按顺序分配的自然数,所述匹配过程通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。在所述公开的方案中,当所述反馈过程反馈的分析单元的数量发生变化时,所述匹配过程在该过程中对所述数据块和所述分析单元进行重新匹配。本发明的目的在于改善计算机系统内部性能,通过计算机执行一种系统内部性能改进程序控制计算机系统内部对象,完成对该计算机系统各个组成部分实施的一系列设置或者调整,从而获得计算机系统内部性能改进的效果。
在参照附图阅读了本发明的具体实施方式
以后,本领域技术人员将会更清楚地了解本发明的各个方面。本领域技术人员应当理解的是,这些附图仅仅用于配合具体实施方式
说明本发明的技术方案,而并非意在对本发明的保护范围构成限制。图1是根据本发明一个实施例的分析数据记录集合的系统的组成示意图。图2是根据本发明实施例的分析数据记录集合的方法的步骤流程图。
具体实施例方式下面参照附图,对本发明的具体实施方式
作进一步的详细描述。图1是根据本发明实施例的分析数据记录集合的系统的组成示意图。如图1所示,分析数据记录集合的系统包括数据接收模块、静态配置模块、动态决策模块、处理模块。其中,数据接收模块被配置成接收数据记录集合,该数据记录集合包括一条或多条数据记录。数据接收模块将接收的数据记录集合传送到静态配置模块。静态配置模块被配置成对所述数据记录集合进行预处理,即将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录。动态决策模块从静态配置模块接收被分块的数据记录,并且被配置成根据处理模块的负载情况,将同一数据块中的数据记录分配给处理模块中的同一分析单元。处理模块包括多个分析单元,该多个分析单元用于接收并分析来自动态决策模块分配的数据记录。由于能够利用静态配置模块对数据记录集合进行分块处理,因此,即使当数据记录的分布情况发生变化时,也能够通过静态配置模块灵活地改变数据记录集合的分块模式,使得新的分块模式能够适应数据记录的分布情况的变化,从而使得处理每一个数据库的分析单元的负载均衡。本发明的动态决策模块能够根据处理模块的负载情况动态地调整分配给分析单元的分析任务,因此即使当分析单元的数量发生变化,计算机系统也能适应各个分析单元所产生的负载变化。在上述实施例中,静态配置模块可选地包括属性设定单元、粒度配置单元、数据划分单元,如图1所示。其中,属性设定单元被配置成为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定。示例性地,对于银行卡交易分析的情况,可以将交易数据记录中的银行卡号、发卡行、银行卡性质、银行卡卡号的末位作为数据记录的属性。粒度配置单元被配置成从属性设定单元设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度。对于上述示例,例如,可以将发卡行、银行卡性质、银行卡卡号的末两位选择作为特定属性。数据划分单元,配置成将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。对于上述示例,例如,发卡行为200家银行、银行卡性质为3种、银行卡卡号的末位为10种,那么数据记录集合中的记录可以被划分成600(200X3X10)个数据块。本领域的技术人员可以理解的是,可以根数据记录的分布情况变化来定义数据记录的属性和特定属性。在上述实施例中,动态决策模块可选地包括识别单元、匹配单元、分配单元,如图1所示。其中,识别单元被配置成识别待分析的数据记录所属的数据块。匹配单元被配置成将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配。这里,匹配之后数据块中的数据记录将被分配到相应的分析单元。在匹配完成之后,分配单元被配置成将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。在上述实施例中,匹配单元还可以包括匹配关系存储单元,匹配关系存储单元用于存储数据块与分析单元的匹配关系。可以理解的是,数据块与分析单元是一对一的对应关系。后文将描述,这种匹配关系可以根据处理模块中的分析单元的状态信息发生改变,即重新匹配。匹配单元进一步配置成根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配。分配单元进一步配置成根据匹配关系分配所述待分析的数据记录。在上述实施例中,匹配单元进一步配置成,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。在上述实施例中,匹配单元配置成将所述数据块与所述分析单元均匀地进行匹配。在上述实施例中,匹配单元配置成,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。举例来说,当有P个分析单元时,数据记录集合在静态配置中被划分成N个数据块,在该情况下匹配单元可以将读取的第一条数据记录所属的数据块与第一个分析单元匹配,从而由分配单元将该第一条数据记录交给该第一个分析单元进行分析,当匹配单元读取的第二条数据记录时,如果该第二条数据记录与该第一条数据记录属于相同的数据块,分配单元将仍将该第二条数据记录交给该第一个分析单元进行分析,否则匹配单元将第二条数据记录所属的数据块与下个分析单元匹配,如此循环,数据记录可以被均匀地分配给所有P个分析进程。更具体地,举例来说,匹配单元可以将所述多个分析单元视为循环队列,当判断当前待分析的数据记录所属的数据块与所述多个分析单元中的已经匹配时,所述匹配单元不移动指向所述分析单元循环队列的指针,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的已经匹配时,所述匹配单元将所述指针指向所述分析单元循环队列的下一个分析单元。在上述实施例中,数据划分单元为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中,判断单元根据数据块标识符判断待分析的数据记录所属的数据块。在上述实施例中,所述处理模块还可选地包括反馈单元,所述动态决策模块还可选地包括状态存储单元,如图1所示。其中,反馈单元用于向所述动态决策模块反馈分析单元的状态信息,所述状态信息包括分析单元的数量。状态存储单元配置成存储分析单元数量。所述匹配单元根据分析单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配。 在上述实施例中,所述状态存储单元进一步配置成对所述分析单元按序存储对应的自然数标识符,以及所述数据块标识符是按顺序分配的自然数。在这种情况下,匹配单元可以通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。举例来说,例如当有P个分析单元时,数据记录集合在静态配置中被划分成N个数据块,那么第η个数据块将与第(Ν%Ρ)个分析单元匹配。在上述实施例中,当所述反馈单元反馈的分析单元的数量发生变化时,所述匹配单元配置成对所述数据块和所述分析单元进行重新匹配。可以利用上述实施例中公开的方法来进行重新匹配的过程。
图2是根据本发明实施例的分析数据记录集合的方法的步骤流程图。根据本发明的另一个目的,还提出了一种分析数据记录集合的方法,如图2所示该方法包括:数据接收过程,在该过程中接收数据记录集合;静态配置过程,在该过程中将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录;动态决策过程,在该过程中根据处理过程的负载情况,将同一数据块中的数据记录分配给同一分析过程;处理过程,包括利用多个分析单元进行分析的过程,分析单元中接收并分析在动态决策过程中分配的数据记录。在上述实施例中,所述静态配置过程包括:属性设定过程,在该过程中为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定。粒度配置过程,在该过程中从属性设定过程设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度,数据划分过程,在该过程中将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。在上述实施例中,所述动态决策过程包括:识别过程,在该过程中识别待分析的数据记录所属的数据块,匹配过程,在该过程中将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配,分配过程,在该过程中将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。在上述实施例中,所述匹配过程包括匹配关系存储过程用于存储数据块与分析单元的匹配关系,所述匹配过程进一步包括根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配,所述分配过程进一步包括根据匹配关系分配所述待分析的数据记录。在上述实施例中,所述匹配过程进一步包括,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。在上述实施例中,所述在匹配过程中将所述数据块与所述分析单元均匀地进行匹配。在上述实施例中,在所述匹配过程中,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。在上述实施例中,所述数据划分过程为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中,所述判断过程根据数据块标识符判断待分析的数据记录所属的数据块。在上述实施例中,所述处理过程还包括反馈过程,用于向所述动态决策过程反馈分析单元的状态信息,所述状态信息包括分析单元的数量。所述动态决策过程还包括状态存储过程,状态存储过程在该过程中存储分析单元数量,所述匹配过程根据分析单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配。在上述实施例中,所述状态存储过程进一步在该过程中所述分析单元按序存储对应的自然数标识符,所述数据块标识符是按顺序分配的自然数,所述匹配过程通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。在上述实施例中,当所述反馈过程反馈的分析单元的数量发生变化时,所述匹配过程在该过程中对所述数据块和所述分析单元进行重新匹配。通过以上实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件和/或硬件的方式来实现。本领域中的普通技术人员能够理解,在不偏离本发明的精神和范围的情况下,还可以对本发明的具体实施方式
作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。
权利要求
1.一种分析数据记录集合的系统,其特征在于,该系统包括: 数据接收模块,配置成接收数据记录集合; 静态配置模块,配置成将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录; 动态决策模块,配置成根据处理模块的负载情况,将同一数据块中的数据记录分配给同一分析单元; 处理模块,包括多个分析单元,该多个分析单元用于接收并分析来自动态决策模块分配的数据记录。
2.如权利要求1所述的系统,其特征在于,所述静态配置模块包括: 属性设定单元,配置成为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定, 粒度配置单元,配置成从属性设定单元设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度, 数据划分单元,配置成将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。
3.如权利要求2所述的系统,其特征在于,所述动态决策模块包括: 识别单元,配置成识别待分析的数据记录所属的数据块, 匹配单元,配置成将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配, 分配单元,配置成将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。
4.如权利要求3所述的系统,其特征在于, 所述匹配单元包括匹配关系存储单元用于存储数据块与分析单元的匹配关系, 所述匹配单元进一步配置成根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配, 所述分配单元进一步配置成根据匹配关系分配所述待分析的数据记录。
5.如权利要求4所述的系统,其特征在于,所述匹配单元进一步配置成,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。
6.如权利要求5所述的系统,其特征在于,所述匹配单元配置成将所述数据块与所述分析单元均匀地进行匹配。
7.如权利要求6所述的系统,其特征在于,所述匹配单元配置成,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。
8.如权利要求7所述的系统,其特征在于, 所述数据划分单元为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中, 所述判断单元根据数据块标识符判断待分析的数据记录所属的数据块。
9.如权利要求8所述的系统,其特征在于,所述处理模块还包括反馈单元,用于向所述动态决策模块反馈分析单元的状态信息,所述状态信息包括分析单元的数量, 所述动态决策模块还包括状态存储单元, 状态存储单元配置成存储分析单元数量, 所述匹配单元根据分析单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配。
10.如权利要求9所述的系统,其特征在于, 所述状态存储单元进一步配置成所述分析单元按序存储对应的自然数标识符, 所述数据块标识符是按顺序分配的自然数, 所述匹配单元通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。
11.如权利要求10所述的系统,其特征在于,当所述反馈单元反馈的分析单元的数量发生变化时,所述匹配单元配置成对所述数据块和所述分析单元进行重新匹配。
12.—种分析数据记录集合的方法,其特征在于,该方法包括: 数据接收过程,在该过程中接收数据记录集合; 静态配置过程,在该过程中将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录; 动态决策过程,在该过程中根据处理过程的负载情况,将同一数据块中的数据记录分配给同一分析过程; 处理过程,包括利用多个分析单元进行分析的过程,分析单元中接收并分析在动态决策过程中分配的数据记录。
13.如权利要求12所述的方法,其特征在于,所述静态配置过程包括: 属性设定过程,在该过程中为数据记录设定一个或多个属性,其中,所述一个或多个属性根据数据记录中的一个或多个字段被设定, 粒度配置过程,在该过程中从属性设定过程设定的一个或多个属性选择一个或多个特定属性,其中,所述一个或多个特定属性用作数据划分的粒度, 数据划分过程,在该过程中将具有相同的特定属性的属性值的数据记录划分到同一数据块,使得所述数据记录集合中的记录被划分到多个数据块。
14.如权利要求13所述的方法,其特征在于,所述动态决策过程包括: 识别过程,在该过程中识别待分析的数据记录所属的数据块, 匹配过程,在该过程中将所述识别的待分析的数据记录所属的数据块与所述多个分析单元中的一个匹配, 分配过程,在该过程中将所述待分析的数据记录分配给与其所属的数据块匹配的分析单元。
15.如权利 要求14所述的方法,其特征在于, 所述匹配过程包括匹配关系存储过程用于存储数据块与分析单元的匹配关系, 所述匹配过程进一步包括根据匹配关系判断待分析的数据记录所属的数据块是否已经与所述多个分析单元中的一个匹配,所述分配过程进一步包括根据匹配关系分配所述待分析的数据记录。
16.如权利要求15所述的方法,其特征在于,所述匹配过程进一步包括,当判断当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,将该数据块与所述多个分析单元中的一个匹配,并存储该匹配关系。
17.如权利要求16所述的方法,其特征在于,所述在匹配过程中将所述数据块与所述分析单元均匀地进行匹配。
18.如权利要求17所述的方法,其特征在于,在所述匹配过程中,当该当前待分析的数据记录所属的数据块未与所述多个分析单元中的一个匹配时,按序循环选择所述多个分析单元中的一个,并将该选择的分析单元与该数据块匹配。
19.如权利要求18所述的方法,其特征在于, 所述数据划分过程为每一个数据块设定数据块标识符,其中所述数据块标识符作为添加字段被记录到相应的数据记录中, 所述判断过程根据数据块标识符判断待分析的数据记录所属的数据块。
20.如权利要求19所述的方法,其特征在于, 所述处理过程还包括反馈过程,用于向所述动态决策过程反馈分析单元的状态信息,所述状态信息包括分析单元的数量, 所述动态决策过程还包括状态存储过程, 状态存储过程在该过程中存储分析单元数量, 所述匹配过程根据分析 单元的数量将未进行匹配的数据块与所述多个分析单元进行匹配。
21.如权利要求20所述的方法,其特征在于, 所述状态存储过程进一步在该过程中所述分析单元按序存储对应的自然数标识符, 所述数据块标识符是按顺序分配的自然数, 所述匹配过程通过基于将数据块标识符对应的自然数除以所述分析单元的数量得到的余数所对应的分析单元的自然数标识符来将未与分析单元匹配的当前待分析的数据记录所属的数据块与该对应的分析单元匹配。
22.如权利要求21所述的方法,其特征在于,当所述反馈过程反馈的分析单元的数量发生变化时,所述匹配过程在该过程中对所述数据块和所述分析单元进行重新匹配。
全文摘要
本发明公开分析数据记录集合的系统和方法,该系统包括数据接收模块,配置成接收数据记录集合;静态配置模块,配置成将所述数据记录集合分成多个数据块,其中每个数据块包括一条或多条数据记录;动态决策模块,配置成根据处理模块的负载情况,将同一数据块中的数据记录分配给同一分析单元;处理模块,包括多个分析单元,该多个分析单元用于接收并分析来自动态决策模块分配的数据记录。
文档编号G06F9/50GK103186427SQ201110457130
公开日2013年7月3日 申请日期2011年12月31日 优先权日2011年12月31日
发明者刘健, 陆堃彪 申请人:中国银联股份有限公司