一种对象存储数据迁移的方法、装置、设备及介质与流程

文档序号:29404817发布日期:2022-03-26 10:21阅读:178来源:国知局
一种对象存储数据迁移的方法、装置、设备及介质与流程

1.本发明涉及计算机领域,并且更具体地涉及一种对象存储数据迁移的方法、装置、设备及可读介质。


背景技术:

2.在大数据时代,对象存储服务(object storage service,oss)是一种新兴的海量、安全、低成本、高可靠的存储服务,适合存放任意类型的文件。初期,用户会选择将海量的文件存储在云存储服务器上,但随着数据量越来越大,存储成本越来越高,往往会有将云存储服务器上的数据迁移至机房的分布式存储服务器中,也就是常说的“数据下云”,或者用户需要将自己的数据从一套存储服务器迁移到另外一套存储服务器上,都会涉及到对象存储集群之间的数据迁移。常用的数据迁移策略和服务都会选择以存储桶为单位进行迁移,但是该迁移策略耗时非常大,当存储桶内对象非常多时,list桶内对象的耗时会非常大,且迁移为先读后写的顺序,不能并发执行读写,只能一个个的顺序进行,所以效率并不是很高。


技术实现要素:

3.有鉴于此,本发明实施例的目的在于提出一种对象存储数据迁移的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够显著提高数据迁移的性能和效率。
4.基于上述目的,本发明的实施例的一个方面提供了一种对象存储数据迁移的方法,包括以下步骤:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
5.根据本发明的一个实施例,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
6.根据本发明的一个实施例,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
7.根据本发明的一个实施例,还包括:
响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
8.本发明的实施例的另一个方面,还提供了一种对象存储数据迁移的装置,装置包括:同步模块,同步模块配置为响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;创建模块,创建模块配置为获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移模块,迁移模块配置为迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
9.根据本发明的一个实施例,迁移模块还配置为:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
10.根据本发明的一个实施例,还包括标记模块,标记模块配置为:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
11.根据本发明的一个实施例,标记模块还配置为:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
12.本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
13.本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
14.本发明具有以下有益技术效果:本发明实施例提供的对象存储数据迁移的方法,通过响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群的技术方案,能够显著提高数据迁移的性能和效率。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
16.图1为根据本发明一个实施例的对象存储数据迁移的方法的示意性流程图;图2为根据本发明一个实施例的对象存储数据迁移的装置的示意图;图3为根据本发明一个实施例的计算机设备的示意图;图4为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
17.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
18.基于上述目的,本发明的实施例的第一个方面,提出了一种对象存储数据迁移的方法的一个实施例。图1示出的是该方法的示意性流程图。
19.如图1中所示,该方法可以包括以下步骤:s1响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中。
20.s2获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程。
21.s3迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
22.在新存储集群上(即目的端)部署迁移工具,以迁移一个存储桶为例,先将存储桶及其索引分片信息从旧存储集群(即源端)同步至新存储集群(即目的端)上,然后在目的端,迁移工具会根据桶索引分片个数n,并发起n个线程,读取桶索引分片上的对象信息,迁移工具有了对象信息后,从源端读取对象,写入到目的端,该过程为n个线程并发处理,互不影响。避免了全量list存储桶内对象的过程,同时以桶索引分片为基本单位,并发进行迁移,提高了数据迁移的速度。
23.通过本发明的技术方案,能够显著提高数据迁移的性能和效率。
24.在本发明的一个优选实施例中,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
25.首先发送请求至源端存储集群,获取存储桶及其索引分片信息。存储桶(bucket)一般有以下信息:存储桶信息bucket_info(包含各种桶策略、桶规则设置)和存储桶索引分片信息。每个分片上分别记录桶内不同的对象信息,默认分片为128(默认分片为128,配置文件中可以进行修改,下述设计方法中以128为例进行描述),桶索引分片对象为:bucket_index.0, bucket_index.1
…ꢀ
bucket_index.127。根据存储桶索引分片个数128,数据迁移工具会启动128个数据迁移线程。因为存储桶索引分片信息上记录的对象信息不同,所以每个数据迁移线程都会并发处理,并不会造成覆盖等误删数据的操作。对于每个数据迁移线程,会读取桶索引分片信息,获取对象的名称信息和存储路径信息,基于存储桶的信息和对象的名称,发送请求至源端存储集群,读取该对象,然后将对象写入至目的端存储集群对应
的存储桶下。
26.在本发明的一个优选实施例中,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
27.在本发明的一个优选实施例中,还包括:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。当对象写入到目的端存储集群对应的存储桶下时,更新目的端存储桶的索引分片信息,标记为已同步,当全部迁移线程都完成时,也就是所有的索引分片信息都被标记为已同步时,该存储桶及其桶内对象迁移完成,可以开始下个桶的迁移工作。
28.通过本发明的技术方案,能够显著提高数据迁移的性能和效率。
29.需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(read-only memory,rom)或随机存取存储器(random access memory,ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
30.此外,根据本发明实施例公开的方法还可以被实现为由cpu 执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu 执行时,执行本发明实施例公开的方法中限定的上述功能。
31.基于上述目的,本发明的实施例的第二个方面,提出了一种对象存储数据迁移的装置,如图2所示,装置200包括:同步模块,同步模块配置为响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;创建模块,创建模块配置为获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移模块,迁移模块配置为迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
32.在本发明的一个优选实施例中,迁移模块还配置为:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
33.在本发明的一个优选实施例中,还包括标记模块,标记模块配置为:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
34.在本发明的一个优选实施例中,标记模块还配置为:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
35.基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以下方法:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
36.在本发明的一个优选实施例中,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
37.在本发明的一个优选实施例中,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
38.在本发明的一个优选实施例中,还包括:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
39.基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质31存储有被处理器执行时执行如下方法的计算机程序32:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
40.在本发明的一个优选实施例中,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
41.在本发明的一个优选实施例中,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移
完成。
42.在本发明的一个优选实施例中,还包括:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
43.此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
44.此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
45.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
46.在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
47.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
48.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
49.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
50.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介
质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
51.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1