本发明涉及电数字数据容灾处理,尤其涉及一种智能化数据保护方法及系统。
背景技术:
1、数据容灾是指通过在多个地理位置或设施中复制和存储数据,以防止因自然灾害、技术故障或人为错误导致的数据丢失或不可用。其核心目标是确保在灾难事件发生时,能够迅速恢复关键业务数据并维持业务的连续性。数据容灾通常涉及制定详细的容灾计划和策略,包括定期备份数据、建立备用数据中心或云服务以及实施灾难恢复测试。通过这些措施,组织能够降低数据丢失的风险,并提升系统的可靠性和稳定性,从而保护企业免受灾难对数据完整性和可用性的影响。
2、数据容灾中的数据恢复则是数据容灾技术中很关键的一环,其是指在灾难事件后或预定的计划性操作中,从备份或异地复制的数据源中恢复数据以恢复正常业务运作。这个过程涉及识别和评估数据损失的范围,然后按照预先制定的恢复策略操作,例如从远程备份设施获取数据或重新同步云端数据。数据恢复不仅仅是简单地复制数据文件,还包括验证数据的完整性、测试恢复的数据是否能满足业务需求以及最终将业务操作恢复到正常状态。通过有效的数据恢复措施,企业可以快速响应灾难事件,最大程度地减少数据丢失的影响,并保证业务的连续性和可靠性。
3、然而,现实中数据往往是海量的,这意味着在进行数据恢复时,需要处理大量的数据量和复杂的系统架构。数据的体积庞大可能导致恢复过程耗时长,并对网络带宽和存储资源提出了极高的要求,增加了恢复操作的复杂性和成本。在这种情况下,现有技术中数据恢复的速度难以达到预期效果。即使有备份和容灾计划,大规模数据的恢复仍可能耗费数小时甚至数天的时间,这对于需要快速恢复业务功能的企业来说是一个严峻挑战。因此,如何提高数据恢复的速度和效率使企业能够快速恢复业务功能,成为数据容灾领域亟需解决的问题之一。
技术实现思路
1、因此,本发明提供一种智能化数据保护方法及系统,用以解决现有技术中数据恢复速度较慢导致的业务功能无法快速恢复的问题。
2、本发明提供了一种智能化数据保护方法,包括:
3、获取主数据中心中多种目标数据的数据属性及访问频率记录;
4、基于数据属性和访问频率记录,得到每种目标数据的预测访问频率;
5、获取每种目标数据的预设优先级和数据量;
6、根据预测访问频率、预设优先级和数据量,得到每种目标数据的恢复优先级;
7、基于多种目标数据的恢复优先级更新缓存数据中心中的数据,其中,缓存数据中心用于备份主数据中心的数据,缓存数据中心的容量小于容灾备份数据中心,缓存数据中心的数据恢复速度高于容灾备份数据中心。
8、本发明还提供一优选的方案:基于数据属性和访问频率记录,得到每种目标数据的预测访问频率,包括:
9、基于数据属性和访问频率记录,建立输入向量序列,输入向量序列包括多个输入向量,输入向量的每个元素分别对应一段时间内目标数据的访问频率和目标数据的多种数据属性;
10、将输入向量序列输入至预设循环神经网络模型中,得到预设循环神经网络模型输出的输出结果;
11、根据输出结果,得到预测访问频率。
12、本发明还提供一优选的方案:预设循环神经网络模型包括依次相连的第一循环网络和第二循环网络,其中,第一循环网络包括依次相连的第一输入层、至少一个第一循环层和第一输出层,第一输入层中的节点分别对应输入向量中的每个元素,第一输入层的每个节点分别和相邻的第一循环层中的每个节点相连,第一输入层用于在每次循环分别输入一个输入向量,第一循环层的循环次数等于输入向量序列中输入向量的数量,第一输出层的每个节点分别和相邻的第一循环层中的每个节点相连,第一输出层用于在最后一次循环后输出上下文向量,第一输出层的输出节点的数量和上下文向量中的元素数量相同;第二循环网络包括依次相连的第二输入层、至少一个第二循环层和第二输出层,第二输入层中的节点分别对应上下文向量中的每个元素,第二输入层的每个节点分别和相邻的第二循环层中的每个节点相连,第二输入层用于仅在第一次循环时输入上下文向量,第二循环层用于在每次循环时均根据第二输入层的输入和前一次循环时第二循环层的状态进行输出,第二输出层的节点数量为一,第二输出层的节点和相邻的第二循环层中的每个节点相连,第二输出层用于在每一次循环时输出一个访问频率预测值,多个访问频率预测值构成预设循环神经网络模型输出的输出结果。
13、本发明还提供一优选的方案:输入向量中目标数据的访问频率对应的元素为第一个;第一循环网络中,第一输入层中的第一个节点用于输入输入向量中目标数据的访问频率对应的元素,与第一输入层相邻的第一循环层用于在每次循环时,根据本次循环时第一输入层的输入、前一次循环时第二循环层的状态以及前一次循环时第一输入层中第一个节点的输入进行输出。
14、本发明还提供一优选的方案:第一循环网络中,与第一输入层相邻的第一循环层对应的表达式为:
15、
16、其中,t表示循环次数,ht表示与第一输入层相邻的第一循环层在第t次循环时的输出,f()表示激活函数,xt表示第一输入层在第t次循环时的输入向量,w表示第一输入层与该第一循环层之间的权重矩阵,ht-1表示与第一输入层相邻的第一循环层在第t-1次循环时的输出,u表示与第一输入层相邻的第一循环层在相邻两次循环之间的权重矩阵,表示第t-1次循环时第一输入层中第一个节点的输入,v表示本次循环时第一循环层和前一次循环时第一输入层中第一个节点之间的权重向量,b为与第一输入层相邻的第一循环层的偏置向量。
17、本发明还提供一优选的方案:根据输出结果,得到预测访问频率,包括:
18、从多个访问频率预测值中选择最大值,作为预测访问频率。
19、本发明还提供一优选的方案:根据预测访问频率、预设优先级和数据量,得到每种目标数据的恢复优先级,包括:
20、通过下式计算目标数据的恢复优先级:
21、p=w1×pp+w2×fp-w3×ea×n;
22、其中,p表示目标数据的恢复优先级,pp表示目标数据的预设优先级,fp表示目标数据的预测访问频率,e为自然常数,n表示目标数据的数据量,a为预设单位调整系数,w1、w2和w3分别为不同的预设权重。
23、本发明还提供一优选的方案:缓存数据中心中包括多种备份数据,每种备份数据对应主数据中心的一种多种目标数据,每种备份数据还对应一个剩余保存时间值,剩余保存时间值用于表征其对应的备份数据在缓存数据中心中的剩余滞留时间,剩余保存时间值随时间推移逐渐减少,当剩余保存时间值为零时,缓存数据中心删除该剩余保存时间值对应的备份数据。
24、本发明还提供一优选的方案:基于多种目标数据的恢复优先级更新缓存数据中心中的数据,包括:
25、基于多种目标数据的恢复优先级,选择恢复优先级最高的目标数据作为目标待备份数据,并获取目标待备份数据对应的恢复优先级;
26、基于目标待备份数据对应的恢复优先级,得到目标待备份数据的初始剩余保存时间值,其中,初始剩余保存时间值与恢复优先级成正比;
27、遍历缓存数据中心中是否存在与目标待备份数据同种类的备份数据;
28、若缓存数据中心中存在与目标待备份数据同种类的备份数据,则基于目标待备份数据更新该同种类的备份数据,并基于初始剩余保存时间更新该同种类备份数据对应的剩余保存时间值;
29、若缓存数据中心中不存在与目标待备份数据同种类的备份数据,则检查缓存数据中心的剩余存储空间是否超过目标待备份数据的数据量;
30、若缓存数据中心的剩余存储空间超过目标待备份数据的数据量,则将目标待备份数据及对应的剩余保存时间值保存至缓存数据中心中;
31、若缓存数据中心的剩余存储空间不超过目标待备份数据的数据量,则删除缓存数据中心中剩余保存时间值最小备份数据,并重新执行检查缓存数据中心的剩余存储空间是否超过目标待备份数据的数据量的步骤。
32、本发明还提供一种智能化数据保护系统,包括主数据中心、容灾备份数据中心和缓存数据中心,还包括:
33、数据监测模块,用于获取主数据中心中多种目标数据的数据属性及访问频率记录;
34、频率预测模块,用于基于数据属性和访问频率记录,得到每种目标数据的预测访问频率;
35、数据准备模块,用于获取每种目标数据的预设优先级和数据量;
36、优先级计算模块,用于根据预测访问频率、预设优先级和数据量,得到每种目标数据的恢复优先级;
37、数据更新模块,用于基于多种目标数据的恢复优先级更新缓存数据中心中的数据,其中,缓存数据中心用于备份主数据中心的数据,缓存数据中心的容量小于容灾备份数据中心,缓存数据中心的数据恢复速度高于容灾备份数据中心。
38、采用上述实施例的有益效果是:
39、本发明提供一种智能化数据保护方法及系统,其通过在容灾备份数据中心和主数据中心之间设立缓存数据中心的方式以缓存一些重要的数据,具体地,其先通过数据属性和访问频率记录预测每种目标数据的预测访问频率,再进一步结合根据预测访问频率、预设优先级和数据量的综合考量,得到每种目标数据的恢复优先级,之后利用目标数据的恢复优先级更新缓存数据中心中的数据,使得缓存数据中心中会动态地缓存有最新、最重要的数据。这样利用缓存数据中心的数据恢复速度高于容灾备份数据中心的特性,便可以在灾难发生时,通过缓存数据中心快速地将重要数据优先进行恢复,从而使基本或者热门的业务功能能够快速地恢复,减少对企业造成的损失,完美地解决了现有技术中数据恢复速度较慢导致的业务功能无法快速恢复的问题。