磁盘管理方法及其系统、计算机设备与流程

文档序号:32988964发布日期:2023-01-17 23:10阅读:66来源:国知局
磁盘管理方法及其系统、计算机设备与流程

1.本技术涉及计算机技术领域,尤其涉及一种磁盘管理方法及其系统、计算机设备。


背景技术:

2.ceph作为分布式存储系统,为了提供海量存储容量,所使用的主机节点会使用大量磁盘,因此ceph系统的管理员经常会遇到磁盘故障问题。当出现常见磁盘故障时,传统ceph管理系统仅显示osd服务状态异常,管理员需要熟练掌握ceph管理命令、操作系统命令和磁盘管理命令才能获取到osd和磁盘的完整映射信息,分析导致osd异常的故障磁盘所对应的槽位。不同的主机环境下,获取osd和磁盘的映射信息的方式和难度不同,增加了磁盘管理难度;管理员还需要人工进行数据分析,确定故障磁盘槽位,费时费力,且容易出事故。而且,当主机上出现多个故障磁盘时,管理员确定故障磁盘槽位的工作复杂度将直线提升。


技术实现要素:

3.有鉴于此,实有必要提供一种磁盘管理方法及其系统、计算机设备,能够高效地对ceph系统的磁盘进行管理。
4.第一方面,本技术实施例提供一种磁盘管理方法,应用于ceph系统,所述ceph系统包括若干osd、若干盘符以及若干磁盘,所述磁盘管理方法包括:
5.采集所述若干osd的osd信息、所述若干盘符的盘符信息以及所述若干磁盘的磁盘信息;
6.分析所述osd信息、所述盘符信息以及所述磁盘信息得到所述osd与所述盘符之间的第一映射信息、所述盘符与所述磁盘之间的第二映射信息;
7.将所述osd信息、所述盘符信息、所述磁盘信息、所述第一映射信息以及所述第二映射信息整合为osd表、盘符表以及磁盘表,其中,所述osd表包括osd状态,所述磁盘表包括磁盘状态;
8.展示所述osd表、所述盘符表以及所述磁盘表;
9.判断所述osd或者所述磁盘是否出现故障;以及
10.当所述osd或者所述磁盘出现故障时,为所述osd状态或者所述磁盘状态添加故障标记,并于所述osd表或者所述磁盘表显示所述故障标记。
11.第二方面,本技术实施例提供一种计算机设备,所述计算机设备包括:
12.存储器,用于存储程序指令;以及
13.处理器,用于执行所述程序指令以实现如上所述的磁盘管理方法。
14.第三方面,本技术实施例提供一种磁盘管理系统,应用于ceph系统,所述ceph系统包括若干osd、若干盘符以及若干磁盘,所述磁盘管理系统包括:
15.采集模块,用于采集所述若干osd的osd信息、所述若干盘符的盘符信息以及所述若干磁盘的磁盘信息;
16.分析模块,用于分析所述osd信息、所述盘符信息以及所述磁盘信息得到所述osd
与所述盘符之间的第一映射信息、所述盘符与所述磁盘之间的第二映射信息;
17.整合模块,用于将所述osd信息、所述盘符信息、所述磁盘信息、所述第一映射信息以及所述第二映射信息整合为osd表、盘符表以及磁盘表,其中,所述osd表包括osd状态,所述磁盘表包括磁盘状态;
18.展示模块,用于展示所述osd表、所述盘符表以及所述磁盘表;
19.判断模块,用于判断所述osd或者所述磁盘是否出现故障;以及
20.添加模块,用于当所述osd或者所述磁盘出现故障时,为所述osd状态或者所述磁盘状态添加故障标记,并于所述osd表或者所述磁盘表显示所述故障标记。
21.上述磁盘管理方法及其系统、计算机设备,分析osd信息、盘符信息以及磁盘信息得到第一映射信息和第二映射信息,根据osd信息、盘符信息、磁盘信息、第一映射信息和第二映射信息构建osd表、盘符表以及磁盘表,通过可视化的形式直观呈现ceph系统中每一节点主机的osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息,能够帮助管理员快速定位故障磁盘,有效提升故障磁盘的处理效率,提升ceph存储服务的可靠性。
22.磁盘管理方法屏蔽了节点主机的磁盘环境的差异,通过简洁的表格界面完整显示ceph系统的osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息,直观展示管理员维护磁盘所需的osd信息、盘符信息和磁盘信息。无磁盘故障时,管理员能够通过表格全面掌握ceph系统的各项信息。有磁盘故障时,通过在表格中显示故障标记以告知管理员。相比于传统方法,磁盘管理方法大幅度降低了管理员分析osd与磁盘之间的映射关系和定位故障磁盘槽位所需的时间,从而能够高效地对磁盘进行管理,同时也避免了人工分析出错的风险。
附图说明
23.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
24.图1为本技术实施例提供的磁盘管理方法的流程图。
25.图2为本技术实施例提供的磁盘管理方法的第一子流程图。
26.图3为本技术实施例提供的磁盘管理方法的第二子流程图。
27.图4为本技术实施例提供的磁盘管理方法的第三子流程图。
28.图5为本技术实施例提供的磁盘管理方法的第四子流程图。
29.图6为本技术实施例提供的磁盘管理方法的第五子流程图。
30.图7为本技术实施例提供的磁盘管理方法的第六子流程图。
31.图8为本技术实施例提供的磁盘管理方法的第七子流程图。
32.图9为本技术实施例提供的磁盘管理方法的应用场景示意图。
33.图10为图1所示的osd表。
34.图11为图1所示的盘符表。
35.图12为图1所示的磁盘表。
36.图13为本技术实施例提供的计算机设备的内部结构示意图。
37.图14为本技术实施例提供的磁盘管理系统的内部结构示意图。
38.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
39.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
40.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的规划对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,换句话说,描述的实施例根据除了这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,还可以包含其他内容,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于只清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
41.需要说明的是,在本技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本技术要求的保护范围之内。
42.请结合参看图1和图9,图1为本技术实施例提供的磁盘管理方法的流程图,图9为本技术实施例提供的磁盘管理方法的应用场景示意图。磁盘管理方法应用于金融科技领域,用于对设置于银行系统中的ceph系统的磁盘进行管理。其中,ceph系统为分布式存储系统。以图9所示的应用场景为例,管理平台31与ceph系统32通讯连接。在本实施例中,管理平台31用于执行磁盘管理方法,ceph系统32包括若干节点主机320、若干osd(对象存储设备,object-based storage device)321、若干盘符322、若干磁盘323以及若干scsi硬盘324。其中,管理平台31的相关功能可以由一个设备实现,也可以由多个设备共同实现,还可以是由一个设备内的一个或多个功能模块实现,在此不作具体限定。可以理解的是,上述功能既可以是硬件设备中的网络元件,也可以是在专用硬件上运行的软件功能,或者是硬件与软件的结合,或者是平台(例如,云平台)上实例化的虚拟化功能。
43.磁盘管理方法具体包括如下步骤。
44.步骤s102,采集若干osd的osd信息、若干盘符的盘符信息以及若干磁盘的磁盘信息。
45.管理平台31采集osd321的osd信息、盘符322的盘符信息、磁盘323的磁盘信息。
46.osd信息包括但不限于osdid、osd状态、osd存储类型以及osd更新时间等。
47.盘符信息包括但不限于盘符名称、盘符大小、介质类型、盘符序列号、盘符状态以及分区信息等。分区信息包括但不限于分区名称、分区大小以及分区类型等。
48.磁盘信息包括但不限于controller、eid、slt、磁盘序列号、磁盘类型以及磁盘状
态等。
49.在本实施例中,管理平台31可以定时采集osd信息、盘符信息以及磁盘信息。由于osd321的osd状态与ceph系统32的健康度有关,因此,要求有较高的实时性。因此,管理平台31需要高频采集osd信息,可以低频采集盘符信息和磁盘信息。其中,高频、低频的具体频率可以根据实际情况进行设置,在此不做限定。
50.具体地,管理平台31可以通过ceph相关命令的方式采集节点主机320的osd信息。管理平台31可以通过lsblk等命令的方式采集节点主机320的盘符信息,也可以通过查看/sys/block目录内容的方式采集节点主机320的盘符信息。管理平台31可以通过storcli64命令的方式采集节点主机320的磁盘信息。
51.在一些可行的实施例中,当需要获取最新的信息时,管理平台31的管理员33还可以输入采集指令,以使管理平台31采集osd信息、盘符信息以及磁盘信息。
52.步骤s104,分析osd信息、盘符信息以及磁盘信息得到osd与盘符之间的第一映射信息、盘符与磁盘之间的第二映射信息。
53.管理平台31分析osd信息、盘符信息以及磁盘信息得到osd321与盘符322之间的第一映射信息、盘符322与磁盘323之间的第二映射信息。
54.在一些可行的实施例中,管理平台31还可以分析第一映射信息和第二映射信息得到osd321与磁盘323之间的第三映射信息。
55.管理平台31如何分析得到第一映射信息和第二映射信息的具体过程将在下文详细描述。
56.步骤s106,将osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息整合为osd表、盘符表以及磁盘表。
57.管理平台31分别将osd信息和第一映射信息整合为osd表,将盘符信息和第一映射信息整合为盘符表,将磁盘信息和第二映射信息整合为磁盘表。
58.以图10所示的osd表为例,osd表从左到右每一列的信息依次为osdid(osd_id)、第一映射信息(device和journal_device)、osd存储类型(storage_type)、osd更新时间(update_time)以及osd状态(state);osd表从上到下每一行分别为不同osd321的信息。osd表按osdid升序排列,完整呈现了osd321与盘符322之间的第一映射信息。
59.在本实施例中,osd存储类型包括filestore和bluestore。当osd存储类型为bluestore时,第一映射信息仅包括data盘,即,device;当osd存储类型为filestore时,第一映射信息包含journal盘和data盘,即device和journal_device。
60.以图11所示的盘符表为例,盘符表从左到右每一列的信息依次为盘符名称或者分区名称(name)、盘符大小或者分区大小(size)、分区类型(type)、第一映射关系(osd_id)、介质类型(device_type)、盘符序列号(sn)以及盘符状态(state);盘符表从上到下每一行分别为不同盘符322以及相应分区的信息。盘符表按照盘符名称的字母编号以及分区名称的编号排列,完整呈现了盘符322与osd321之间的第一映射信息。
61.在本实施例中,当osd存储类型为filestore时,部分盘符322会被划分为多个分区,每一分区单独被osd321作为journal盘或data盘使用。
62.以图12所示的磁盘表为例,磁盘表从左到右每一列的信息依次为controller、eid、slt、磁盘序列号(sn)、磁盘类型(type)、第二映射关系(device)以及磁盘状态
(state);磁盘表从上到下每一行分别为不同磁盘323的信息。其中,slt表示槽位信息。磁盘表按照controller、eid、slt多级升序排序。
63.在本实施例中,磁盘表包括与磁盘一一对应的槽位信息。可以理解的是,每一磁盘323安装于一个磁盘槽位,槽位信息表示每一磁盘槽位的编号,用于指明磁盘槽位的位置。
64.步骤s108,展示osd表、盘符表以及磁盘表。
65.管理平台31采用表格的形式展示osd表、盘符表以及磁盘表。在本实施例中,管理平台31采用树状表结构展示盘符表,采用列表结构展示osd表和磁盘表。在一些可行的实施例中,管理平台31还可以采用其它可视化形式展示osd表、盘符表以及磁盘表,在此不做限定。
66.步骤s110,判断osd或者磁盘是否出现故障。
67.管理平台31判断osd321或者磁盘323是否出现故障。
68.当osd321或者磁盘323出现故障时,执行步骤s112。
69.步骤s112,为osd状态或者磁盘状态添加故障标记,并于osd表或者磁盘表显示故障标记。
70.当osd321出现故障时,管理平台31为osd状态添加故障标记,并于osd表显示故障标记。当磁盘323出现故障时,管理平台31为磁盘状态添加故障标记,并于磁盘表显示故障标记。
71.在本实施例中,故障标记在osd表或者磁盘表中显示为格子底色带有颜色。即是说,当osd321出现故障时,在osd表中,与出现故障的osd对应的osd状态栏位的底色转为红色。当磁盘323出现故障时,在磁盘表中,与出现故障的磁盘对应的磁盘状态栏位的底色转为红色。在一些可行的实施例中,故障标记的颜色可以根据实际情况进行设置,在此不做限定。
72.管理员33可以通过osd表快速定位出现故障的osd321所对应的盘符322;可以通过磁盘表快速定位出现故障的磁盘323所对应的盘符322和槽位信息。
73.在一些可行的实施例中,当磁盘323严重损坏导致相应的槽位信息读取失败时,管理平台31可以根据历史采集的磁盘信息显示缺失的槽位信息,并标记磁盘状态为读取异常。
74.上述实施例中,分析osd信息、盘符信息以及磁盘信息得到第一映射信息和第二映射信息,根据osd信息、盘符信息、磁盘信息、第一映射信息和第二映射信息构建osd表、盘符表以及磁盘表,通过可视化的形式直观呈现ceph系统中每一节点主机的osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息,能够帮助管理员快速定位故障磁盘,有效提升故障磁盘的处理效率,提升ceph存储服务的可靠性。
75.磁盘管理方法屏蔽了节点主机的磁盘环境的差异,通过简洁的表格界面完整显示ceph系统的osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息,直观展示管理员维护磁盘所需的osd信息、盘符信息和磁盘信息。无磁盘故障时,管理员能够通过表格全面掌握ceph系统的各项信息。有磁盘故障时,通过在表格中显示故障标记以告知管理员。相比于传统方法,磁盘管理方法大幅度降低了管理员分析osd与磁盘之间的映射关系和定位故障磁盘槽位所需的时间,从而能够高效地对磁盘进行管理,同时也避免了人工分析出错的风险。
76.请结合参看图2,其为本技术实施例提供的磁盘管理方法的第一子流程图。步骤s104具体包括如下步骤。
77.步骤s202,获取ceph volume信息。
78.在本实施例中,管理平台31可以通过ceph-volume命令获取ceph volume信息。
79.步骤s204,根据osd信息、盘符信息以及ceph volume信息分析得到第一映射信息。
80.管理平台31根据osd信息、盘符信息以及ceph volume信息分析osd321与盘符322之间的映射关系,从而得到第一映射信息。
81.步骤s206,根据盘符信息中的盘符序列号和磁盘信息中的磁盘序列号分析得到第二映射信息。
82.当磁盘323使用jbod直连时,盘符序列号和磁盘序列号相同。因此,管理平台31可以根据盘符信息中的盘符序列号和磁盘信息中的磁盘序列号分析盘符322与磁盘323之间的映射关系,从而得到第二映射信息。
83.请结合参看图3,其为本技术实施例提供的磁盘管理方法的第二子流程图。步骤s104具体包括如下步骤。
84.步骤s302,获取ceph volume信息。
85.在本实施例中,管理平台31可以通过ceph-volume命令获取ceph volume信息。
86.步骤s304,根据osd信息、盘符信息以及ceph volume信息分析得到第一映射信息。
87.管理平台31根据osd信息、盘符信息以及ceph volume信息分析osd321与盘符322之间的映射关系,从而得到第一映射信息。
88.步骤s306,获取scsi硬盘的设备信息。
89.当磁盘323使用raido连接时,管理平台31可以通过获取scsi硬盘324的设备信息来分析第二映射信息。其中,设备信息包括scsi硬盘id。
90.在本实施例中,管理平台31可以通过lsscsi命令获取设备信息。
91.步骤s308,根据磁盘信息和设备信息分析得到第二映射信息。
92.管理平台31根据磁盘信息和设备信息分析磁盘323和盘符322之间的映射关系,从而得到第二映射信息。
93.在本实施例中,管理平台31根据scsi硬盘id和磁盘信息中的dg/vd信息,分析得到第二映射信息。
94.请结合参看图4,其为本技术实施例提供的磁盘管理方法的第三子流程图。执行步骤s112之后,磁盘管理方法还包括如下步骤。
95.步骤s402,接收点灯指令。
96.磁盘表中,槽位信息对应设有点灯按钮和灭灯按钮。管理员33可以通过点击点灯按钮生成点灯指令。其中,点灯指令包括目标槽位。
97.在本实施例中,目标槽位可以为故障磁盘对应的磁盘槽位,也可以为故障磁盘对应的磁盘槽位上下相邻的两个磁盘槽位。其中,故障磁盘为出现故障的磁盘323或者出现故障的osd321对应的磁盘。可以理解的是,管理员33可以点击故障磁盘对应的槽位信息的点灯按钮生成点灯指令。当磁盘323严重损坏导致相应的槽位信息读取失败时,管理员33可以点击与故障磁盘对应的槽位信息上下相邻的两个槽位信息的点灯按钮生成点灯指令。
98.步骤s404,根据目标槽位点亮相应的磁盘槽位的状态灯。
99.管理平台31根据目标槽位点亮相应的磁盘槽位的状态灯。可以理解的是,每一磁盘槽位均设置有一个状态灯。当管理员33定位故障磁盘的磁盘槽位后,可直接执行点灯操作。
100.当磁盘323损坏导致相应的磁盘槽位读取失败时,不能直接对故障磁盘的磁盘槽位点灯,可对故障磁盘的磁盘槽位的上下相邻槽位点灯。机房的设备维护人员可以根据状态灯找到故障磁盘的磁盘槽位。
101.请结合参看图5,其为本技术实施例提供的磁盘管理方法的第四子流程图。执行步骤s112之后,磁盘管理方法还包括如下步骤。
102.步骤s502,接收发送指令。
103.磁盘表中,槽位信息还对应设有通知按钮。管理员33可以通过点击通知按钮生成发送指令。其中,发送指令包括接收人信息或者目标地址。
104.步骤s504,发送故障通知信息。
105.管理平台31根据发送指令将故障通知信息发送至接收人。其中,故障通知信息包括故障磁盘的序列号、与故障磁盘相对应的槽位信息。在本实施例中,接收人为机房的设备维护人员。管理平台31发送故障通知信息给对应机房的设备维护人员,以通知设备维护人员找到故障磁盘的磁盘槽位,并对故障磁盘进行更换。
106.请结合参看图6,其为本技术实施例提供的磁盘管理方法的第五子流程图。执行步骤s112之后,磁盘管理方法还包括如下步骤。
107.步骤s602,接收停用指令。
108.osd表中,osd状态对应设有停用按钮。管理员33看到故障标记后,可以通过点击停用按钮生成停用指令。其中,停用指令包括目标osd,目标osd与故障磁盘相对应。
109.步骤s604,停止运行目标osd。
110.管理平台31接收停用指令,停止运行目标osd。
111.请结合参看图7,其为本技术实施例提供的磁盘管理方法的第六子流程图。执行步骤s504之后,磁盘管理方法还包括如下步骤。
112.步骤s702,判断故障磁盘是否更换为新磁盘。
113.管理平台31判断设备维护人员是否已经将故障磁盘更换为新磁盘。其中,新磁盘对应有新盘符。
114.当故障磁盘更换为新磁盘时,执行步骤s704。
115.步骤s704,更新osd表、盘符表以及磁盘表。
116.当故障磁盘更换为新磁盘之后,管理平台31更新osd表、盘符表以及磁盘表。更新后的osd表中,目标osd对应的第一映射信息为空白。更新后的盘符表中,会出现新盘符的信息和新盘符的分区信息,包括盘符名称或分区名称、盘符大小或分区大小、分区类型、介质类型、盘符序列号以及盘符状态;新盘符和新盘符的分区对应的第一映射关系为空白。更新后的磁盘表中,故障磁盘对应的第二映射关系为空白。
117.请结合参看图8,其为本技术实施例提供的磁盘管理方法的第七子流程图。执行步骤s704之后,磁盘管理方法还包括如下步骤。
118.步骤s802,接收恢复指令。
119.osd表中,osd状态还对应设有恢复按钮。管理员33通过更新后的盘符表快速得知
哪一个为新盘符后,可以通过点击恢复按钮生成恢复指令。其中,恢复指令包括目标osd。可以理解的是,管理员33可使用新盘符恢复目标osd的服务。
120.步骤s804,检查目标osd的osd状态和新盘符的盘符状态。
121.步骤s806,销毁目标osd。
122.步骤s808,zap新磁盘。
123.步骤s810,在新磁盘添加新osd。
124.接收到恢复指令之后,管理平台31会自动化依次执行检查目标osd的safe-to-destroy状态,即osd状态和新盘符的盘符状态状态,销毁目标osd,使用ceph-volumn命令zap新磁盘,在新磁盘添加新osd等操作。相关操作执行完后,目标osd的osd状态恢复正常,磁盘故障修复完成。
125.故障磁盘修复完成后,管理员33可以通过点击灭灯按钮生成灭灯指令。其中,灭灯指令包括目标槽位。
126.上述实施例中,发现故障磁盘并在相应表格中显示故障标记后,管理平台可以根据接收到的各种指令进行后续的磁盘槽位的状态灯的管理、故障通知和更换新磁盘后的osd启动恢复等工作。表格中均设置有相应的按钮,管理员只需要点击按钮就能够实现相应的操作,使得故障磁盘的修复更加便捷,很大程度简化了后续故障磁盘修复中的繁琐工作。
127.磁盘管理方法能够有效解决ceph系统中绝大部分故障磁盘的场景,并且能根据指令自动化执行osd服务恢复任务。
128.请结合参看图13,其为本技术实施例提供的计算机设备的内部结构示意图。计算机设备10包括存储器11和处理器12。存储器11用于存储程序指令,处理器12用于执行程序指令以实现上述磁盘管理方法。
129.其中,处理器12在一些实施例中可以是一中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器或其它数据处理芯片,用于运行存储器11中存储的程序指令。
130.存储器11至少包括一种类型的可读存储介质,该可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是计算机设备的内部存储单元,例如计算机设备的硬盘。存储器11在另一些实施例中也可以是计算机设备的外部存储设备,例如计算机设备上配备的插接式硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,存储器11还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于计算机设备的应用软件及各类数据,例如实现磁盘管理方法的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
131.请结合参看图14,其为本技术实施例提供的磁盘管理系统的内部结构示意图。磁盘管理系统20应用于ceph系统40,磁盘管理系统20和ceph系统40通讯连接。ceph系统40包括若干osd41、若干盘符42以及若干磁盘43。磁盘管理系统20包括采集模块21、分析模块22、整合模块23、展示模块24、判断模块25以及添加模块26。
132.采集模块21,用于采集若干osd的osd信息、若干盘符的盘符信息以及若干磁盘的磁盘信息。
133.采集模块21采集osd41的osd信息、盘符42的盘符信息、磁盘43的磁盘信息。
134.osd信息包括但不限于osdid、osd状态、osd存储类型以及osd更新时间等。
135.盘符信息包括但不限于盘符名称、盘符大小、介质类型、盘符序列号、盘符状态以及分区信息等。分区信息包括但不限于分区名称、分区大小以及分区类型等。
136.磁盘信息包括但不限于controller、eid、slt、磁盘序列号、磁盘类型以及磁盘状态等。
137.在本实施例中,采集模块21可以定时采集osd信息、盘符信息以及磁盘信息。由于osd41的osd状态与ceph系统40的健康度有关,因此,要求有较高的实时性。因此,采集模块21需要高频采集osd信息,可以低频采集盘符信息和磁盘信息。其中,高频、低频的具体频率可以根据实际情况进行设置,在此不做限定。
138.具体地,采集模块21可以通过ceph相关命令的方式采集节点主机中的osd信息。采集模块21可以通过lsblk等命令的方式采集节点主机中的盘符信息,也可以通过查看/sys/block目录内容的方式采集节点主机中的盘符信息。采集模块21可以通过storcli64命令的方式采集节点主机中的磁盘信息。
139.在一些可行的实施例中,当需要获取最新的信息时,管理平台20的管理员还可以输入采集指令,以使采集模块21采集osd信息、盘符信息以及磁盘信息。
140.分析模块22,用于分析osd信息、盘符信息以及磁盘信息得到osd与盘符之间的第一映射信息、盘符与磁盘之间的第二映射信息。
141.分析模块22分析osd信息、盘符信息以及磁盘信息得到osd41与盘符42之间的第一映射信息、盘符42与磁盘43之间的第二映射信息。
142.在一些可行的实施例中,分析模块22还可以分析第一映射信息和第二映射信息得到osd41与磁盘43之间的第三映射信息。
143.整合模块23,用于将osd信息、盘符信息、磁盘信息、第一映射信息以及第二映射信息整合为osd表、盘符表以及磁盘表。
144.整合模块23分别将osd信息和第一映射信息整合为osd表,将盘符信息和第一映射信息整合为盘符表,将磁盘信息和第二映射信息整合为磁盘表。
145.以图10所示的osd表为例,osd表从左到右每一列的信息依次为osdid(osd_id)、第一映射信息(device和journal_device)、osd存储类型(storage_type)、osd更新时间(update_time)以及osd状态(state);osd表从上到下每一行分别为不同osd41的信息。osd表按osdid升序排列,完整呈现了osd41与盘符42之间的第一映射信息。
146.在本实施例中,osd存储类型包括filestore和bluestore。当osd存储类型为bluestore时,第一映射信息仅包括data盘,即,device;当osd存储类型为filestore时,第一映射信息包含journal盘和data盘,即device和journal_device。
147.以图11所示的盘符表为例,盘符表从左到右每一列的信息依次为盘符名称或者分区名称(name)、盘符大小或者分区大小(size)、分区类型(type)、第一映射关系(osd_id)、介质类型(device_type)、盘符序列号(sn)以及盘符状态(state);盘符表从上到下每一行分别为不同盘符42以及相应分区的信息。盘符表按照盘符名称的字母编号以及分区名称的编号排列,完整呈现了盘符42与osd41之间的第一映射信息。
148.在本实施例中,当osd存储类型为filestore时,部分盘符42会被划分为多个分区,每一分区单独被osd41作为journal盘或data盘使用。
149.以图12所示的磁盘表为例,磁盘表从左到右每一列的信息依次为controller、eid、slt、磁盘序列号(sn)、磁盘类型(type)、第二映射关系(device)以及磁盘状态(state);磁盘表从上到下每一行分别为不同磁盘43的信息。其中,slt表示槽位信息。磁盘表按照controller、eid、slt多级升序排序。
150.在本实施例中,磁盘表包括与磁盘一一对应的槽位信息。可以理解的是,每一磁盘43安装于一个磁盘槽位,槽位信息为每一磁盘槽位的编号,用于表示磁盘槽位的位置。
151.展示模块24,用于展示osd表、盘符表以及磁盘表。
152.展示模块24采用表格的形式展示osd表、盘符表以及磁盘表。在本实施例中,展示模块24采用树状表结构展示盘符表,采用列表结构展示osd表和磁盘表。
153.判断模块25,用于判断osd或者磁盘是否出现故障。
154.判断模块25判断osd41或者磁盘43是否出现故障。
155.添加模块26,用于当osd或者磁盘出现故障时,为osd状态或者磁盘状态添加故障标记,并于osd表或者磁盘表显示故障标记。
156.当osd41出现故障时,添加模块26为osd状态添加故障标记,并于osd表显示故障标记。当磁盘43出现故障时,添加模块26为磁盘状态添加故障标记,并于磁盘表显示故障标记。
157.在本实施例中,故障标记在osd表或者磁盘表中显示为带颜色的底色。即是说,当osd41出现故障时,在osd表中,osd状态栏位的底色颜色转为红色。当磁盘43出现故障时,在磁盘表中,磁盘状态栏位的底色颜色转为红色。在一些可行的实施例中,故障标记的颜色可以根据实际情况进行设置,在此不做限定。
158.管理员可以通过osd表快速定位出现故障的osd41所对应的盘符42;可以通过磁盘表快速定位出现故障的磁盘43所对应的盘符42和槽位信息。
159.在一些可行的实施例中,磁盘43严重损坏导致相应的槽位信息读取失败时,添加模块26可以根据历史采集的磁盘信息显示缺失的槽位信息,并标记磁盘状态为读取异常。
160.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘且本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
161.以上所列举的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属于本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1