本发明涉及数据处理技术领域,尤其涉及一种数据库迁移方法、装置、电子设备及存储介质。
背景技术:
数据库迁移是项目开发中经常会遇到的问题,比如一些老旧系统的迁移、数据库性能遇到瓶颈、正在使用的数据库价钱太高等,都需要进行数据库迁移。目前,脱o(脱离oracle)已然成为一个大趋势,越来越多的企业都将数据从oracle数据库迁移到mysql数据库上。
现有技术方案中,为了实现数据库迁移,首先要搭建新库,然后改代码,当新数据库上线时,需要停掉所有应用程序,再同步数据,数据同步完成后,发布新版本,并将数据直接迁移到新数据库中。
上述方法存在几个弊端。首先,需要对所有数据进行同步,因此花费的时间较长,经常要花费几个小时,大大降低了系统的可用性;其次,将数据直接迁移到新数据库中,由于数据库之间的差异性,很难及时发现数据的一些格式错误或细微变化,如果上线之后验证有问题,则还要发布新版本来解决,对于对数据的重要性及系统的可用性要求较高的系统来说,风险也较高。
技术实现要素:
鉴于以上内容,有必要提供一种数据库迁移方法、装置、电子设备及存储介质,不仅能够提高数据迁移的速度,同时保证了读写操作的正常执行,并通过校验,进一步保证了新库的稳定性。
一种数据库迁移方法,所述方法包括:
接收数据库迁移指令,所述数据库迁移指令用于触发从旧库迁移数据至新库;
将所述旧库中的数据全量同步至所述新库;
实时检测是否产生新的数据;
当有新的数据产生时,将产生的新数据写入所述旧库;
当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库;
在所述新库上线后,获取实时数据;
将所述实时数据分别写入所述旧库及所述新库;
对所述新库中的数据进行校验;
当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线。
根据本发明优选实施例,所述将所述新数据从所述旧库增量同步至所述新库包括:
获取所述旧库的操作日志;
解析所述操作日志,得到变更的数据;
将所述变更的数据确定为所述新数据;
将所述新数据同步至所述新库。
根据本发明优选实施例,在将所述新数据从所述旧库增量同步至所述新库时,所述方法还包括:
在进行增量同步时,基于异常处理机制进行实时监测;
当监测到有数据异常时,捕获异常的数据;
跳过捕获的数据。
根据本发明优选实施例,所述方法还包括:
记录所述捕获的数据,作为异常数据;
在将所述新数据从所述旧库增量同步至所述新库后,确定所述异常数据的类型;
当所述异常数据为写入失败时,基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,补录调取的数据至所述新库;或者
当所述异常数据为写入错误时,基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,根据调取的数据更新所述异常数据。
根据本发明优选实施例,在将所述实时数据分别写入所述旧库及所述新库时,所述方法还包括:
停止从所述旧库增量同步数据至所述新库。
根据本发明优选实施例,所述方法还包括:
在预设时间内的配置时间点前,将所述新库中的数据与所述旧库中的数据进行全量对比,得到全量对比结果;
在所述预设时间内的所述配置时间点后,将所述新库中的数据与所述旧库中的数据进行增量对比,得到增量对比结果;
在预设时间内,监控所述新库的日志,得到监控结果;
当所述全量对比结果、所述增量对比结果及所述监控结果都没有异常时,确定所述新库通过校验。
根据本发明优选实施例,所述控制所述新库执行读写指令,及控制所述旧库下线包括:
获取配置列表,所述配置列表中存储着读写指令类型与数据库间的对应关系;
根据所述配置列表,从所述新库及所述旧库中确定目标数据库;
在所述目标数据库中执行读写指令;
配置时间后,当确定所述新库读写正常时,控制所述新库执行读写指令;
清理所述旧库数据,及控制所述旧库下线。
一种数据库迁移装置,所述装置包括:
接收单元,用于接收数据库迁移指令,所述数据库迁移指令用于触发从旧库迁移数据至新库;
同步单元,用于将所述旧库中的数据全量同步至所述新库;
检测单元,用于实时检测是否产生新的数据;
写入单元,用于当有新的数据产生时,将产生的新数据写入所述旧库;
所述同步单元,还用于当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库;
获取单元,用于在所述新库上线后,获取实时数据;
所述写入单元,还用于将所述实时数据分别写入所述旧库及所述新库;
校验单元,用于对所述新库中的数据进行校验;
控制单元,用于当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线。
根据本发明优选实施例,所述同步单元将所述新数据从所述旧库增量同步至所述新库包括:
获取所述旧库的操作日志;
解析所述操作日志,得到变更的数据;
将所述变更的数据确定为所述新数据;
将所述新数据同步至所述新库。
根据本发明优选实施例,所述装置还包括:
监测单元,用于在将所述新数据从所述旧库增量同步至所述新库时,在进行增量同步时,基于异常处理机制进行实时监测;
捕获单元,用于当监测到有数据异常时,捕获异常的数据;
跳过单元,用于跳过捕获的数据。
根据本发明优选实施例,所述装置还包括:
记录单元,用于记录所述捕获的数据,作为异常数据;
确定单元,用于在将所述新数据从所述旧库增量同步至所述新库后,确定所述异常数据的类型;
补录单元,用于当所述异常数据为写入失败时,基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,补录调取的数据至所述新库;或者
更新单元,用于当所述异常数据为写入错误时,基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,根据调取的数据更新所述异常数据。
根据本发明优选实施例,所述装置还包括:
停止单元,用于在将所述实时数据分别写入所述旧库及所述新库时,停止从所述旧库增量同步数据至所述新库。
根据本发明优选实施例,所述装置还包括:
对比单元,用于在预设时间内的配置时间点前,将所述新库中的数据与所述旧库中的数据进行全量对比,得到全量对比结果;
所述对比单元,还用于在所述预设时间内的所述配置时间点后,将所述新库中的数据与所述旧库中的数据进行增量对比,得到增量对比结果;
监控单元,用于在预设时间内,监控所述新库的日志,得到监控结果;
所述确定单元,还用于当所述全量对比结果、所述增量对比结果及所述监控结果都没有异常时,确定所述新库通过校验。
根据本发明优选实施例,所述控制单元具体用于:
获取配置列表,所述配置列表中存储着读写指令类型与数据库间的对应关系;
根据所述配置列表,从所述新库及所述旧库中确定目标数据库;
在所述目标数据库中执行读写指令;
配置时间后,当确定所述新库读写正常时,控制所述新库执行读写指令;
清理所述旧库数据,及控制所述旧库下线。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述数据库迁移方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述数据库迁移方法。
由以上技术方案可以看出,本发明能够当接收到数据库迁移指令时,获取旧库及新库,并将所述旧库中的数据全量同步至所述新库,实时检测是否产生新的数据,当有新的数据产生时,将产生的新数据写入所述旧库,当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库,减少了新库上线时迁移数据的总量,进而缩短了所述新库上线的等待时间,在所述新库上线后,获取实时数据,将所述实时数据分别写入所述旧库及所述新库,进而在新库没有完全稳定时,仍然结合使用所述旧库,以确保数据读写正常,进一步对所述新库中的数据进行校验,当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线,进而完成数据库的迁移,不仅提高了数据迁移的速度,同时保证了读写操作的正常执行,并通过校验,进一步保证了新库的稳定性。
附图说明
图1是本发明数据库迁移方法的较佳实施例的流程图。
图2是本发明数据库迁移装置的较佳实施例的功能模块图。
图3是本发明实现数据库迁移方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明数据库迁移方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述数据库迁移方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)、游戏机、交互式网络电视(internetprotocoltelevision,iptv)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloudcomputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtualprivatenetwork,vpn)等。
s10,接收数据库迁移指令。
其中,所述数据库迁移指令用于触发从旧库迁移数据至新库。
在本发明的至少一个实施例中,所述数据库迁移指令可以由相关工作人员触发,例如:开发人员等。
在本发明的至少一个实施例中,所述旧库可以包括oracle数据库等,所述新库可以包括mysql数据库等,本发明不限制。
在本发明的至少一个实施例中,从所述数据库迁移指令中,所述电子设备可以获取到所述新库及所述旧库。
例如:所述数据库迁移指令可以用于将数据从oracle数据库迁移至mysql数据库。
s11,将所述旧库中的数据全量同步至所述新库。
在本发明的至少一个实施例中,为了节约所述新库上线后进行数据同步所耗费的时间,所述电子设备在所述新库上线前将所述旧库中的数据全量同步至所述新库。
具体地,所述电子设备可以采用指定工具将所述旧库中的数据全量同步至所述新库,本发明不限制。
其中,所述指定工具可以包括,但不限于:kettle(水壶)、hkronlinesyncnavigator等。
s12,实时检测是否产生新的数据。
在本发明的至少一个实施例中,与所述旧库相连接的各个系统或终端由于一直处于运行状态,因此还会不断产生新的数据,而这部分新产生的数据也需要写入所述旧库及所述新库,以方便调用。
因此,为了避免新产生的数据被漏写,所述电子设备实时检测是否产生新的数据。
s13,当有新的数据产生时,将产生的新数据写入所述旧库。
在本发明的至少一个实施例中,由于所述新库还没有正式上线使用,因此,所述电子设备首先将产生的新数据写入所述旧库。
通过上述实施方式,在所述新库还没有正式上线前,仍然可以采用所述旧库进行数据的存储。
s14,当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库。
在本发明的至少一个实施例中,在全量同步完后,再执行增量同步,从而避免有数据被重复同步至所述新库,造成所述新库中数据的冗余。
在现有技术方案中,通常采用一次全量同步的方式进行数据库迁移,这种迁移方式在所述新库正式上线前,不仅需要花费大量的时间进行数据写入,降低系统的可用性,还需要停止正在使用的应用程序进行数据初始化,影响应用程序的正常运行。
相比较而言,本方案在所述新库上线前还对数据进行增量同步,这样,在所述新库上线时,则无需再对所述新数据进行迁移,减少了迁移数据的总量,进而缩短了所述新库上线的等待时间,提升了系统的可用性,同时也无需停止与所述新数据对应的应用程序,提升用户体验。
优选地,所述电子设备将所述新数据从所述旧库增量同步至所述新库包括:
所述电子设备获取所述旧库的操作日志,并解析所述操作日志,得到变更的数据,所述电子设备将所述变更的数据确定为所述新数据,并将所述新数据同步至所述新库。
具体地,所述电子设备可以采用配置工具将所述新数据同步至所述新库,本发明不限制。
例如:所述配置工具可以包括,但不限于:oraclegoldengate等。
具体地,所述电子设备采用所述oraclegoldengate搭建所述旧库到所述新库之间的同步链路(gg链路)。
进一步地,所述电子设备解析所述操作日志,并从所述操作日志中确定变更的数据,所述电子设备将所述变更的数据确定为所述新数据,然后,所述电子设备开启所述oraclegoldengate,并基于所述gg链路进行所述新数据的增量同步。
通过上述实施方式,由于是基于所述操作日志进行的增量同步,因此不会有数据的遗漏,并且,由于所述oraclegoldengate是基于日志的结构化数据复制,并读取了所述旧库的操作日志作为同步依据,因此对系统的cpu(centralprocessingunit,中央处理器)消耗不大,对系统性能影响较小。
在本发明的至少一个实施例中,所述电子设备可以分别对所述旧库及所述新库的写入操作添加事务。
其中,所述事务是数据库操作的最小工作单元,是作为单个逻辑工作单元执行的一系列操作,这些操作作为一个整体一起向系统提交,要么都执行、要么都不执行,即:所述事务是一组不可再分割的操作集合(工作逻辑单元),所述电子设备对操作所述新库的支线代码以及操作所述旧库的支线代码分别单独添加事务,则所述新库及所述旧库就不会互相影响,这样,当所述新库的数据写入有异常时,也不会影响到所述旧库的数据写入,所述新库及所述旧库的操作相互独立。
在本发明的至少一个实施例中,在将所述新数据从所述旧库增量同步至所述新库时,所述方法还包括:
在进行增量同步时,所述电子设备基于异常处理机制进行实时监测,当监测到有数据异常时,所述电子设备捕获异常的数据,进一步跳过捕获的数据。
具体地,在进行增量同步时,所述电子设备可以采用try-catch语句执行所述异常处理机制。
进一步地,所述电子设备采用try语句进行实时监测,并采用catch语句捕获所述异常的数据。
在现有技术方案中,当监测到有数据异常时,将终止增量同步,进而对增量同步的效率产生影响,并进一步影响了数据库的迁移效率。
在本实施例中,所述电子设备跳过所述捕获的数据,并继续执行增量同步,以提高数据同步的效率。
但是,由于捕获到了异常,因此,所述电子设备还要对异常进行处理,进而不会对数据的质量产生影响。
具体地,所述方法还包括:
所述电子设备记录所述捕获的数据,作为异常数据,在将所述新数据从所述旧库增量同步至所述新库后,所述电子设备确定所述异常数据的类型,具体地:
(1)当所述异常数据为写入失败时,所述电子设备基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,补录调取的数据至所述新库。
(2)当所述异常数据为写入错误时,所述电子设备基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,根据调取的数据更新所述异常数据。
其中,所述异常数据的类型包括,但不限于:写入失败、写入错误等。
进一步地,通过所述数据标识,能够唯一确定一条数据。
可以理解的是,如果所述异常数据为写入失败,则说明所述新库中可能没有写入相应数据,因此,所述电子设备以所述数据标识为依据,从所述旧库中调取与所述异常数据对应的数据,并补录调取的数据至所述新库,进而避免了数据遗漏,以保证所述新库中数据的全面性。
如果所述异常数据为写入错误,则说明所述新库中可能出现错误数据,因此,所述电子设备基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,并根据调取的数据更新所述异常数据,进而避免了数据错误,以保证所述新库中数据的准确性。
当然,在其他实施例中,所述电子设备还可以获取增量同步的执行日志,并从所述执行日志中获取所述异常数据的写入时间等信息,并根据获取到的信息从所述旧库中调取与所述异常数据对应的数据,本发明不限制。
s15,在所述新库上线后,获取实时数据。
在本发明的至少一个实施例中,由于所述新库上线后,会有新的数据生成(如应用数据、操作数据等),为了保证数据的完整性,所述电子设备需要将这些数据实时写入数据库。
因此,在所述新库上线后,所述电子设备获取实时数据,以便对实时获取到的数据进行及时保存。
s16,将所述实时数据分别写入所述旧库及所述新库。
在本发明的至少一个实施例中,由于所述新库已经上线,因此,所述电子设备无需采用其他工具将所述实时数据写入所述新库,而只需要采用所述新库的内置代码直接写入即可。
在本发明的至少一个实施例中,在将所述实时数据分别写入所述旧库及所述新库时,所述方法还包括:
所述电子设备停止从所述旧库增量同步数据至所述新库。
可以理解的是,在所述新库上线后,所述电子设备会通过代码层对新旧两个数据库进行数据的同步写入,此时,如果不停止从所述旧库增量同步数据至所述新库,则又会从所述旧库同步重复的数据至所述新库,这样所述新库就会有冗余的数据。
进一步地,在本实施例中,所述电子设备还可以停止相关应用程序,以避免由于程序的运行产生数据丢失。
通过上述实施方式,能够有效避免数据冗余,提升所述新库中数据的质量。
s17,对所述新库中的数据进行校验。
在本发明的至少一个实施例中,为了保证所述新库中数据的准确性及全面性,所述电子设备对所述新库中的数据进行校验,具体校验方式将在后面阐述。
s18,当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线。
在本发明的至少一个实施例中,当通过校验时,所述电子设备还可以等待一段时间,再控制所述新库执行读写指令,及控制所述旧库下线,以进一步确保所述新库已经完全稳定。
在本发明的至少一个实施例中,所述方法还包括:
在预设时间内的配置时间点前,所述电子设备将所述新库中的数据与所述旧库中的数据进行全量对比,得到全量对比结果,进一步地,在所述预设时间内的所述配置时间点后,所述电子设备将所述新库中的数据与所述旧库中的数据进行增量对比,得到增量对比结果,在预设时间内,所述电子设备监控所述新库的日志,得到监控结果,并且当所述全量对比结果、所述增量对比结果及所述监控结果都没有异常时,所述电子设备确定所述新库通过校验。
其中,所述预设时间及所述配置时间点可以根据历史数据进行大数据分析而确定,本发明不限制。
具体地,所述电子设备从所述历史数据中获取所有校验时间段,并从所述所有校验时间段中确定最晚校验时间及最早校验时间,所述电子设备以所述最早校验时间为起始时间,以所述最晚校验时间为终止时间,确定所述预设时间。
进一步地,所述电子设备可以采用最小二乘法对所述预设时间内的数据进行处理,得到最优解,并将所述最优解确定为所述配置时间点。
通过上述实施方式,首先结合全量对比技术及增量对比技术,实现对所述新库中数据的检测,再结合日志监控技术,进一步完善数据的校验过程,以实现对所述新库中数据的准确校验。
在本发明的至少一个实施例中,所述控制所述新库执行读写指令,及控制所述旧库下线包括:
所述电子设备获取配置列表,所述配置列表中存储着读写指令类型与数据库间的对应关系,所述电子设备根据所述配置列表,从所述新库及所述旧库中确定目标数据库,并在所述目标数据库中执行读写指令,配置时间后,当确定所述新库读写正常时,所述电子设备控制所述新库执行读写指令,并清理所述旧库数据,及控制所述旧库下线。
例如:所述电子设备修改配置文件的参数,使一部分类型的读写指令在所述新库中执行,另一部分类型的读写指令在所述旧库中执行,然后逐步扩大所述新库对于所述读写指令的执行范围,直到整个系统都从所述新库读写,读写功能都正常后,再修改配置参数,将数据只写入所述新库,不再写入所述旧库。
其中,所述配置列表可以根据历史数据进行大数据分析而配置,本发明不限制。
具体地,所述电子设备获取历史配置数据,并根据所述历史配置数据,计算每种读写指令类型在某种数据库中操作的概率,所述电子设备从计算的概率中确定每种读写指令类型操作的最大概率对应的数据库,并记录对应的数据库与每种读写指令类型的对应关系,所述电子设备进一步根据所述对应关系配置所述配置列表。
例如:当任务a的读写操作在所述旧库中的概率最大时,则所述电子设备记录所述任务a的读写操作在所述旧库中执行。
其中,所述配置时间可以进行自定义配置。
不同于现有技术中直接将数据迁移到所述新库中的方式,本方案能够逐步开放所述新库,避免直接开放所述新库后,有数据异常产生。
由以上技术方案可以看出,本发明能够当接收到数据库迁移指令时,获取旧库及新库,并将所述旧库中的数据全量同步至所述新库,实时检测是否产生新的数据,当有新的数据产生时,将产生的新数据写入所述旧库,当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库,减少了新库上线时迁移数据的总量,进而缩短了所述新库上线的等待时间,在所述新库上线后,获取实时数据,将所述实时数据分别写入所述旧库及所述新库,进而在新库没有完全稳定时,仍然结合使用所述旧库,以确保数据读写正常,进一步对所述新库中的数据进行校验,当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线,进而完成数据库的迁移,不仅提高了数据迁移的速度,同时保证了读写操作的正常执行,并通过校验,进一步保证了新库的稳定性。
如图2所示,是本发明数据库迁移装置的较佳实施例的功能模块图。所述数据库迁移装置11包括接收单元110、同步单元111、检测单元112、写入单元113、获取单元114、校验单元115、控制单元116、监测单元117、捕获单元118、跳过单元119、记录单元120、确定单元121、补录单元122、更新单元123、停止单元124、对比单元125以及监控单元126。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
接收单元110接收数据库迁移指令。
其中,所述数据库迁移指令用于触发从旧库迁移数据至新库。
在本发明的至少一个实施例中,所述数据库迁移指令可以由相关工作人员触发,例如:开发人员等。
在本发明的至少一个实施例中,所述旧库可以包括oracle数据库等,所述新库可以包括mysql数据库等,本发明不限制。
在本发明的至少一个实施例中,从所述数据库迁移指令中可以获取到所述新库及所述旧库。
例如:所述数据库迁移指令可以用于将数据从oracle数据库迁移至mysql数据库。
同步单元111将所述旧库中的数据全量同步至所述新库。
在本发明的至少一个实施例中,为了节约所述新库上线后进行数据同步所耗费的时间,所述同步单元111在所述新库上线前将所述旧库中的数据全量同步至所述新库。
具体地,所述同步单元111可以采用指定工具将所述旧库中的数据全量同步至所述新库,本发明不限制。
其中,所述指定工具可以包括,但不限于:kettle(水壶)、hkronlinesyncnavigator等。
检测单元112实时检测是否产生新的数据。
在本发明的至少一个实施例中,与所述旧库相连接的各个系统或终端由于一直处于运行状态,因此还会不断产生新的数据,而这部分新产生的数据也需要写入所述旧库及所述新库,以方便调用。
因此,为了避免新产生的数据被漏写,所述检测单元112实时检测是否产生新的数据。
当有新的数据产生时,写入单元113将产生的新数据写入所述旧库。
在本发明的至少一个实施例中,由于所述新库还没有正式上线使用,因此,所述写入单元113首先将产生的新数据写入所述旧库。
通过上述实施方式,在所述新库还没有正式上线前,仍然可以采用所述旧库进行数据的存储。
当确定全量同步完成时,所述同步单元111将所述新数据从所述旧库增量同步至所述新库。
在本发明的至少一个实施例中,在全量同步完后,再执行增量同步,从而避免有数据被重复同步至所述新库,造成所述新库中数据的冗余。
在现有技术方案中,通常采用一次全量同步的方式进行数据库迁移,这种迁移方式在所述新库正式上线前,不仅需要花费大量的时间进行数据写入,降低系统的可用性,还需要停止正在使用的应用程序进行数据初始化,影响应用程序的正常运行。
相比较而言,本方案在所述新库上线前还对数据进行增量同步,这样,在所述新库上线时,则无需再对所述新数据进行迁移,减少了迁移数据的总量,进而缩短了所述新库上线的等待时间,提升了系统的可用性,同时也无需停止与所述新数据对应的应用程序,提升用户体验。
优选地,所述同步单元111将所述新数据从所述旧库增量同步至所述新库包括:
所述同步单元111获取所述旧库的操作日志,并解析所述操作日志,得到变更的数据,所述同步单元111将所述变更的数据确定为所述新数据,并将所述新数据同步至所述新库。
具体地,所述同步单元111可以采用配置工具将所述新数据同步至所述新库,本发明不限制。
例如:所述配置工具可以包括,但不限于:oraclegoldengate等。
具体地,所述同步单元111采用所述oraclegoldengate搭建所述旧库到所述新库之间的同步链路(gg链路)。
进一步地,所述同步单元111解析所述操作日志,并从所述操作日志中确定变更的数据,所述同步单元111将所述变更的数据确定为所述新数据,然后,所述同步单元111开启所述oraclegoldengate,并基于所述gg链路进行所述新数据的增量同步。
通过上述实施方式,由于是基于所述操作日志进行的增量同步,因此不会有数据的遗漏,并且,由于所述oraclegoldengate是基于日志的结构化数据复制,并读取了所述旧库的操作日志作为同步依据,因此对系统的cpu(centralprocessingunit,中央处理器)消耗不大,对系统性能影响较小。
在本发明的至少一个实施例中,所述写入单元113可以分别对所述旧库及所述新库的写入操作添加事务。
其中,所述事务是数据库操作的最小工作单元,是作为单个逻辑工作单元执行的一系列操作,这些操作作为一个整体一起向系统提交,要么都执行、要么都不执行,即:所述事务是一组不可再分割的操作集合(工作逻辑单元),所述写入单元113对操作所述新库的支线代码以及操作所述旧库的支线代码分别单独添加事务,则所述新库及所述旧库就不会互相影响,这样,当所述新库的数据写入有异常时,也不会影响到所述旧库的数据写入,所述新库及所述旧库的操作相互独立。
在本发明的至少一个实施例中,在所述同步单元111将所述新数据从所述旧库增量同步至所述新库时,监测单元117基于异常处理机制进行实时监测,当监测到有数据异常时,捕获单元118捕获异常的数据,跳过单元119进一步跳过捕获的数据。
具体地,在进行增量同步时,可以采用try-catch语句执行所述异常处理机制。
进一步地,所述监测单元117采用try语句进行实时监测,所述捕获单元118采用catch语句捕获所述异常的数据。
在现有技术方案中,当监测到有数据异常时,将终止增量同步,进而对增量同步的效率产生影响,并进一步影响了数据库的迁移效率。
在本实施例中,所述跳过单元119跳过所述捕获的数据,并继续执行增量同步,以提高数据同步的效率。
但是,由于捕获到了异常,因此,还要对异常进行处理,进而不会对数据的质量产生影响。
具体地,记录单元120记录所述捕获的数据,作为异常数据,在将所述新数据从所述旧库增量同步至所述新库后,确定单元121确定所述异常数据的类型,具体地:
(1)当所述异常数据为写入失败时,补录单元122基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,补录调取的数据至所述新库。
(2)当所述异常数据为写入错误时,更新单元123基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,根据调取的数据更新所述异常数据。
其中,所述异常数据的类型包括,但不限于:写入失败、写入错误等。
进一步地,通过所述数据标识,能够唯一确定一条数据。
可以理解的是,如果所述异常数据为写入失败,则说明所述新库中可能没有写入相应数据,因此,所述补录单元122以所述数据标识为依据,从所述旧库中调取与所述异常数据对应的数据,并补录调取的数据至所述新库,进而避免了数据遗漏,以保证所述新库中数据的全面性。
如果所述异常数据为写入错误,则说明所述新库中可能出现错误数据,因此,所述更新单元123基于所述异常数据的数据标识,从所述旧库中调取与所述异常数据对应的数据,并根据调取的数据更新所述异常数据,进而避免了数据错误,以保证所述新库中数据的准确性。
当然,在其他实施例中,还可以获取增量同步的执行日志,并从所述执行日志中获取所述异常数据的写入时间等信息,并根据获取到的信息从所述旧库中调取与所述异常数据对应的数据,本发明不限制。
在所述新库上线后,获取单元114获取实时数据。
在本发明的至少一个实施例中,由于所述新库上线后,会有新的数据生成(如应用数据、操作数据等),为了保证数据的完整性,所述写入单元113需要将这些数据实时写入数据库。
因此,在所述新库上线后,所述获取单元114获取实时数据,以便对实时获取到的数据进行及时保存。
所述写入单元113将所述实时数据分别写入所述旧库及所述新库。
在本发明的至少一个实施例中,由于所述新库已经上线,因此,所述写入单元113无需采用其他工具将所述实时数据写入所述新库,而只需要采用所述新库的内置代码直接写入即可。
在本发明的至少一个实施例中,在将所述实时数据分别写入所述旧库及所述新库时,停止单元124停止从所述旧库增量同步数据至所述新库。
可以理解的是,在所述新库上线后,所述写入单元113会通过代码层对新旧两个数据库进行数据的同步写入,此时,如果不停止从所述旧库增量同步数据至所述新库,则又会从所述旧库同步重复的数据至所述新库,这样所述新库就会有冗余的数据。
进一步地,在本实施例中,所述停止单元124还可以停止相关应用程序,以避免由于程序的运行产生数据丢失。
通过上述实施方式,能够有效避免数据冗余,提升所述新库中数据的质量。
校验单元115对所述新库中的数据进行校验。
在本发明的至少一个实施例中,为了保证所述新库中数据的准确性及全面性,所述校验单元115对所述新库中的数据进行校验,具体校验方式将在后面阐述。
当通过校验时,控制单元116控制所述新库执行读写指令,及控制所述旧库下线。
在本发明的至少一个实施例中,当通过校验时,所述控制单元116还可以等待一段时间,再控制所述新库执行读写指令,及控制所述旧库下线,以进一步确保所述新库已经完全稳定。
在本发明的至少一个实施例中,在预设时间内的配置时间点前,对比单元125将所述新库中的数据与所述旧库中的数据进行全量对比,得到全量对比结果,进一步地,在所述预设时间内的所述配置时间点后,所述对比单元125将所述新库中的数据与所述旧库中的数据进行增量对比,得到增量对比结果,在预设时间内,监控单元126监控所述新库的日志,得到监控结果,并且当所述全量对比结果、所述增量对比结果及所述监控结果都没有异常时,所述确定单元121确定所述新库通过校验。
其中,所述预设时间及所述配置时间点可以根据历史数据进行大数据分析而确定,本发明不限制。
具体地,所述确定单元121从所述历史数据中获取所有校验时间段,并从所述所有校验时间段中确定最晚校验时间及最早校验时间,所述确定单元121以所述最早校验时间为起始时间,以所述最晚校验时间为终止时间,确定所述预设时间。
进一步地,所述确定单元121可以采用最小二乘法对所述预设时间内的数据进行处理,得到最优解,并将所述最优解确定为所述配置时间点。
通过上述实施方式,首先结合全量对比技术及增量对比技术,实现对所述新库中数据的检测,再结合日志监控技术,进一步完善数据的校验过程,以实现对所述新库中数据的准确校验。
在本发明的至少一个实施例中,所述控制单元116控制所述新库执行读写指令,及控制所述旧库下线包括:
所述控制单元116获取配置列表,所述配置列表中存储着读写指令类型与数据库间的对应关系,所述控制单元116根据所述配置列表,从所述新库及所述旧库中确定目标数据库,并在所述目标数据库中执行读写指令,配置时间后,当确定所述新库读写正常时,所述控制单元116控制所述新库执行读写指令,并清理所述旧库数据,及控制所述旧库下线。
例如:所述控制单元116修改配置文件的参数,使一部分类型的读写指令在所述新库中执行,另一部分类型的读写指令在所述旧库中执行,然后逐步扩大所述新库对于所述读写指令的执行范围,直到整个系统都从所述新库读写,读写功能都正常后,再修改配置参数,将数据只写入所述新库,不再写入所述旧库。
其中,所述配置列表可以根据历史数据进行大数据分析而配置,本发明不限制。
具体地,所述控制单元116获取历史配置数据,并根据所述历史配置数据,计算每种读写指令类型在某种数据库中操作的概率,所述控制单元116从计算的概率中确定每种读写指令类型操作的最大概率对应的数据库,并记录对应的数据库与每种读写指令类型的对应关系,所述控制单元116进一步根据所述对应关系配置所述配置列表。
例如:当任务a的读写操作在所述旧库中的概率最大时,则所述控制单元116记录所述任务a的读写操作在所述旧库中执行。
其中,所述配置时间可以进行自定义配置。
不同于现有技术中直接将数据迁移到所述新库中的方式,本方案能够逐步开放所述新库,避免直接开放所述新库后,有数据异常产生。
由以上技术方案可以看出,本发明能够当接收到数据库迁移指令时,获取旧库及新库,并将所述旧库中的数据全量同步至所述新库,实时检测是否产生新的数据,当有新的数据产生时,将产生的新数据写入所述旧库,当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库,减少了新库上线时迁移数据的总量,进而缩短了所述新库上线的等待时间,在所述新库上线后,获取实时数据,将所述实时数据分别写入所述旧库及所述新库,进而在新库没有完全稳定时,仍然结合使用所述旧库,以确保数据读写正常,进一步对所述新库中的数据进行校验,当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线,进而完成数据库的迁移,不仅提高了数据迁移的速度,同时保证了读写操作的正常执行,并通过校验,进一步保证了新库的稳定性。
如图3所示,是本发明实现数据库迁移方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如数据库迁移程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smartmediacard,smc)、安全数字(securedigital,sd)卡、闪存卡(flashcard)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如数据库迁移程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(controlunit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行数据库迁移程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个数据库迁移方法实施例中的步骤,例如图1所示的步骤s10、s11、s12、s13、s14、s15、s16、s17、s18。
或者,所述处理器13执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如:
接收数据库迁移指令,所述数据库迁移指令用于触发从旧库迁移数据至新库;
将所述旧库中的数据全量同步至所述新库;
实时检测是否产生新的数据;
当有新的数据产生时,将产生的新数据写入所述旧库;
当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库;
在所述新库上线后,获取实时数据;
将所述实时数据分别写入所述旧库及所述新库;
对所述新库中的数据进行校验;
当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成接收单元110、同步单元111、检测单元112、写入单元113、获取单元114、校验单元115、控制单元116、监测单元117、捕获单元118、跳过单元119、记录单元120、确定单元121、补录单元122、更新单元123、停止单元124、对比单元125以及监控单元126。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)。
总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种数据库迁移方法,所述处理器13可执行所述多个指令从而实现:
接收数据库迁移指令,所述数据库迁移指令用于触发从旧库迁移数据至新库;
将所述旧库中的数据全量同步至所述新库;
实时检测是否产生新的数据;
当有新的数据产生时,将产生的新数据写入所述旧库;
当确定全量同步完成时,将所述新数据从所述旧库增量同步至所述新库;
在所述新库上线后,获取实时数据;
将所述实时数据分别写入所述旧库及所述新库;
对所述新库中的数据进行校验;
当通过校验时,控制所述新库执行读写指令,及控制所述旧库下线。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。