专利名称:阵列管理装置,阵列管理方法以及集成电路的制作方法
技术领域:
本发明涉及对将多个储存器冗余化而构成的阵列进行管理的阵列管理装置。
背景技术:
在储存器阵列系统中,以实现大容量化、高性能化、或者提高可靠性为目的,一般米用磁盘阵列(RAID, Redundant arrays of inexpensive Disks)技术。在RAID构成中,例如,在级别I到级别6的各形态中,能够通过冗余化结构来提高可靠性已被公知。还存在将级别I到级别6以外的特殊形态或者多个形态组合而使用的结构。例如,在称为RAID5的形态中,在阵列管理装置管理的储存器中,允许一台储存器故障。此时,储存器阵列系统暂时过渡到称为降级(degrade)的退化状态。在阵列陷入两台以上的储存器同时发生故障的状态时,阵列在逻辑上破损,变得不能取出存放的数据的一部分或者全部。能够允许的储存器破损台数因RAID的结构而不同。在降级状态中,将发生故障的储存器与正常的储存器交换后,自动地或者管理者对储存器阵列系统发送复原用命令,由此阵列从自身管理的其它的储存器将数据复原,并将复原数据复制到交换后的正常的储存器中,从而使储存器阵列系统能够从降级状态恢复到通常状态。另外,还存在通过使用备用储存器来进一步提高可靠性的储存器阵列系统。一般地,备用储存器在储存器阵列系统过渡到降级状态为止处于待机状态,在储存器阵列系统过渡到降级状态时,将 发生了故障的储存器和备用储存器在逻辑上进行交换。
另外,还存在如下储存器阵列系统:检测出储存器故障后,通过自动地变更所管理的其它的储存器的冗余化结构,不需要进行故障储存器的交换,而进行冗余性的恢复(参照专利文献I)。另外,储存器阵列系统例如按照NAS (Network Attached Storage)环境、SAN(Storage Area Network)环境、或者通过储存器接口直接安装到客户端或者主计算机的环境之类的各种储存器结构来实施。各储存器在储存器阵列系统中连接于用于进行数据转送或者管理的网络。这里所说的网络这个术语,当然包含IP (Internet Protocol)网络,但是并不限定于此。一般地,在由于连接线缆的断线、网络的切断等使得不能与储存器进行通信的情况下,与储存器破损同样地,储存器阵列系统过渡到降级状态(参照专利文献2)。现有技术文献专利文献专利文献1:特表2008-519359号公报专利文献2:特许第4520802号公报
发明概要
发明要解决的课题专利文献2公开的技术中的储存器阵列系统中,在发生网络的切断时,与储存器破损时同样地,为了返回到通常状态而进行处理。具体地,与备用储存器的交换、或利用储存器阵列系统所管理的其它的储存器的再冗余化之类的处理。但是,根据网络的类别(通信路径的构成类别),例如是有线还是无线、是否经由因特网、是否在局部区域内等,以不同的原因发生网络通信的切断。例如,在通过无线连接网络的情况下,在进行无线通信的装置和装置之间有障碍物时,变得不能通信,网络通信暂时性地(直到障碍物被排除)被切断。另外,在经由因特网连接的情况下,网络的吞吐量多的时候,数据的发送接收会发生迟延,有可能被判断为网络切断。此时,会存在并非是储存器自身破损,而且若经过时间则网络通信会自动地恢复的情况。因此,虽说有可能自动地恢复,但是在发生网络切断时,立即进行再冗余化并不是好的办法。原因在于进行再冗余化处理需要读写大量的数据,因此会缩短储存器装置的寿命O
发明内容
因此,鉴于上述问题,本发明的目的在于提供一种能够根据通信路径的构成类别而变更执行再冗余化的判断基准的阵列管理装置、阵列管理方法以及集成电路。解决问题的手段 为了实现上述目的,本发明是对多个储存器进行冗余化并控制对各储存器的访问的阵列管理装置,其特征在于,具有:判定部,反复确认对所述多个储存器各自的访问成功还是失败;存储部,存储向所述多个储存器各自的通信路径的构成类别;导出部,根据所述存储部存储的所述通信路径的构成类别,导出从对所述储存器的访问失败到执行冗余化为止的待机时间;以及冗余化处理部,在由所述判定部确认到对所述多个储存器中的某个储存器的访问失败的情况下,·在由所述导出部根据该储存器的所述通信路径的构成类别导出的所述待机时间经过为止的期间,通过所述判定部的再次的确认动作没有确认到对该储存器的访问成功时,使用除了该储存器之外的其余的储存器进行冗余化。发明效果根据如上所述的构成,阵列管理装置根据访问失败的储存器的通信路径的类别导出到冗余化为止的待机时间。因此,阵列管理装置能够根据通信路径的类别变更判断为进行再冗余化为止的待机时间,也就是说,判断为进行再冗余化的判断基准。由此,由于只要在待机时间内访问成功,则不需要进行再冗余化,因此与在故障发生后立即进行再冗余化的情况相比,储存器装置的寿命变长。
图1是表示实施方式中阵列管理系统I的结构的图。图2是表示阵列管理装置100的结构的框图。图3是表示网络状态管理表TlOO的数据结构的一例的图。图4是表示储存器状态管理表T200的数据结构的一例的图。图5是表示网络故障管理表T300的数据结构的一例的图。
图6是表示空白区域信息表T400的数据结构的一例的图。图7是表示数据暂时保存区域信息表T500的数据结构的一例的图。图8是表示储存器装置11的结构的框图。图9是表示网络状态监视处理的流程图。图10是表示储存器装置的生存确认处理的流程图。图11是表示储存器装置的复原确认处理的流程图。图12是表示无应答时的冗余化方针决定处理的流程图。图13是表示复原时的冗余化方针决定处理的流程图。图14是表示通常时的访问处理的流程图。图15是表示网络故障时的写入处理的流程图。图16是表示网 络故障时的读入处理的流程图。图17是表示从网络故障的复原处理的流程图。图18是表示无应答时的阵列管理装置100的动作的流程图。图19是表示由通常状态直到再冗余化的迁移图。图20的(a)是表示通常时的数据写入的具体例的图,(b)是表示在暂时保存状态时的数据写入的具体例的图。图21是表示再冗余化的具体例的图。图22是表示方针决定表T600的数据结构的一例的图。图23是表示由通过执行程序来实现动作的结构构成的阵列管理装置100A的一例的结构图。图24是表示由通过执行程序来实现动作的结构构成的阵列管理装置IlA的一例的结构图。图25是表示本发明的阵列管理装置3000的结构的图。图26是表示本发明的阵列管理装置3000A的结构的图。图27是表示本发明的阵列管理方法的图。
具体实施例方式
以下,参照附图对本发明的实施方式进行说明。1、实施方式此处,参照附图,对本发明的实施方式进行说明。1.1 概要图1是表示包含本发明的阵列管理装置的阵列管理系统I的结构的图。图1中,由包含下述的阵列管理装置100的数字记录机10、以及储存器装置11 15构成。此处,储存器装置12为预备(备用)的储存器装置。数字记录机10对由数码相机摄影的图像数据等数字数据进行管理保存,通过将阵列管理装置100组装到内部,能够使得数字数据在储存器装置11 15中冗余化保存。储存器装置11、12 通过 USB(Universal Serial Bus)或者 SCSI (Small ComputerSystem Interface)等与数字记录机10进行本地连接。此外,储存器装置13经由因特网2与数字记录机10连接,且储存器装置14通过局域网(LAN,Local Area Network)与数字记录机10连接。此外,储存器装置15通过无线局域网与数字记录装置10连接。此外,与各储存器装置的连接也可以将以太网(注册商标)、光纤信道、USB、IEEE1394 (Institute ofElectrical and Electronic Engineersl394)、IDE (Integrated Drive Electronics)、串行 ATA (Advanced Technology Attachment)、eSATA (external Serial ATA)> SCS1、SAS(Serial Attached SCSI)等作为网络以及其接口使用。阵列管理装置100与以往相同,监视是否发生关于各储存器装置的破损等的故障,在检测到故障时,进行冗余化的再构成。此处,进行冗余化的再构成称为再冗余化。此外,阵列管理装置100还监视与各储存器装置连接的网络是否发生故障。此处,本实施方式中的网络故障是指在发送生存确认(heartbeat check)之意的应答请求时,无应答的时间持续规定时间以上。阵列管理装置100检测到网络故障时,根据网络的连接方式在预定的时间中等待从网络故障的复原,在经过该时间还没有复原的情况下,进行冗余化的再构成。在等待从网络故障复原的期间中,在将数据写入储存器装置中时,不能将数据写入到发生了网络故障的储存器装置中。因此,对于其它的储存器装置,例如作为备用而准备的储存器装置(本实施方式中的储存器装置12)、或者空白容量多的储存器装置,将应该写入到发生网络故障的储存器装置中的数据写入。由此,能够防止暂时保存数据的高速缓冲存储器的溢出。此处,空白容量是指没有利用于阵列结构的区域之中还未进行数据写入的容量。1.2阵列管理装置100的结构阵列管理装置100是管理储存器装置11 15的装置,如图2所示,由网络状态监视部101、储存器状态监视部102、管理信息存储部103、阵列状态监视部104、冗余化方针决定部105、处理部106、请求受理部107以及通信部108构成。(I)网络状态监视部101网络状态监视部101对各储存器装置11 15,监视有没有网络故障的发生。具体地,网络状态监视部101若从阵列状态监视部104接收到表示对各储存器装置11 15发行应答请求的指示的请求指示,则对对象储存器装置发送应答请求,根据在规定时间TO (例如,I秒)内是否接收到对于应答请求的应答,确认储存器装置的在网络上的生存。网络状态监视部101在发送应答请求后,在规定时间TO内接收到来自发行对象的储存器装置的应答的情况下,将表示接收到应答之意的应答确认信息通知给阵列状态监视部 104。网络状态监视部101在发送应答请求后,在规定时间TO内没有接收到来自发行对象的储存器装置的应答的情况下,将表示没有接收到应答之意的无应答信息通知给阵列状态监视部104。(2)阵列状态监视部102
阵列状态监视部102与以往相同,对于各储存器装置11 15,监视有没有发生储
存器故障。阵列状态监视部102对于各阵列装置11 15,定期地检查储存器故障(例如储存器的破损状态)。
储存器状态监视部102在判断为发生了储存器故障的情况下,将表示发生了储存器故障之意的储存器故障信息通知给阵列状态监视部104。(3)管理信息存储部103管理信息存储部103是用于存储阵列管理装置100管理的多个表的存储区域。管理信息存储部103存储图3到图7所示的网络状态管理表T100、储存器状态管理表T200、网络故障管理表T300、空白区域信息表T400以及数据暂时保存区域信息表T500。另外,管理信息存储部103与以往相同,还存储表示阵列结构的信息,例如阵列结构信息表(未图示)。因为对于表示阵列结构的信息为已知,此处省略详细的说明。阵列结构信息表具有存储多个由阵列号、冗余化手法、储存器台数、储存器号、阵列容量构成的组的区域。阵列号是用于识别所构成的阵列的号,冗余化手法表示例如RAID1、RAID5之类的用于冗余化的手法。储存器台数是构成阵列的台数,储存器号是表示那些储存器装置的号。阵列容量表示所构成的阵列的总容量。另外,此处,还管理备用的储存器装置。(3-1)网络状态管理表TlOO网络状态管理表TlOO是管理网络状态(例如,对于应答请求的应答的有无)的表,如图3所示,有用于存储多个由储存器号、网络类别、网络信息、最终应答确认时间以及无应答标志构成的组的区域。储存器号用于唯一地识别与阵列管理装置100连接的储存器装置。网络类别表示与由储存器号识别的储存器装置的连接方式。例如,作为网络类别,预先由系统的运用者记述是有线连接还是无线连接的类别,或者是LAN (无线局域网)内的连接还是经由因特网连接的类别,或者是否是被分配了 IP地址的网络的内容。网络信息是发送应答请求时需要的信息,表示用于在网络上鉴别储存器的信息。该网络信息按每个网络类别而不同。例如,若网络 类别为IP网络,则IP地址或者MAC地址相当于网络信息,若为USB网络,则供应商ID (vendor ID)或者产品号(product ID)、序列号等相当于网络信息。最终应答确认时刻表示针对对应的储存器装置,阵列状态监视部104最后接收到应答确认信息的时刻,在阵列状态监视部104每次接收到应答确认信息时该时刻被更新。无应答标志表示阵列状态监视部104是否接收到无应答信息,值“O”表示没有接收到无应答信息,也就是说表示接收到应答确认信息,值“ I ”表示接收到无应答信息。(3-2 )储存器状态管理表T200储存器状态管理表T200是管理储存器装置的状态(有没有破损等)的表,如图4所示,有用于存储多个由储存器号、储存器类别、储存器信息以及破损标志构成的组的区域。对于储存器号,因为已经作了说明,这里省略说明。储存器类别是表示构成储存器的类别,例如表示是否是逻辑驱动、物理驱动以及在线储存器的信息。此处,在线储存器是高可靠储存器的一种。高可靠储存器指的是在线储存器、将冗余化阵列虚拟化为单个储存器的储存器等其自身被进行数据保护的储存器,是发生故障的概率非常低的储存器。例如,储存器类别为在线储存器时,为高可靠储存器。此外,图4中未示出,但将冗余化阵列虚拟化为单个储存器的情况下,该情况记载于储存器类别中。阵列管理装置100在储存器类别中记载有在线储存器或将冗余化阵列虚拟化为单个储存器之意的内容的情况下,能够判别为该储存器装置为高可靠储存器。
储存器信息包含表示例如对应的储存器装置的总容量、使用容量的信息。破损标志表示阵列状态监视部104是否接收到储存器故障信息,值“O”表示未接收到储存器故障信息,值“ I ”表示接收到储存器故障信息。(3-3)网络故障管理表T300网络故障管理表T300是对发生了网络故障的储存器装置,管理其故障的发生时刻以及复原时的时刻的表,如图5所示,有用于存储多个由储存器号、网络故障发生时刻、确认时间(Tb)、复原确认时刻、确认时间(Td)构成的组的区域。此外,将由储存器号、网络故障发生时刻、确认时间(Tb)、复原确认时刻、确认时间(Td)构成的组称为故障信息。因为对于储存器号已经作过说明,此处省略说明。网络故障发生时刻表示阵列状态监视部104判断为发生了网络故障的时刻。确认时间(Tb)表示从发生网络故障到再冗余化为止的等待时间(能够期待复原的时间)。复原确认时刻表示在确认时间(Tb)内对于网络状态监视部101的应答请求有应答的时刻。确认时间(Td)表示从复原确认时刻到推定为网络的通信状态稳定为止的时间。(3-4)空白区域信息表T400空白区域信息表T400是管理各储存器装置11 15的空白区域的表,如图6所示,有用于存储多个由储存器号、偏移、大小、暂时使用中构成的组的区域。如上所述,空白容量是在阵列构成中没有利用的区域之中还没有进行数据写入的容量。因为对于储存器号已作过说明,此处省略说明。偏移是表示空白区域的开始位置的值。大小是表示空白区域的容量的值。暂时使用中表示其它的储存器装置在网络故障中时是否将应该写入到该其它的储存器装置中的数据暂时保持。使用中的值为“O”时,表示没有被暂时使用,值为“I”时,表不暂时被使用。(3-5)数据暂时保存区域信息表T500数据暂时保存区域信息表T500是管理应该写入到发生了网络故障的储存器装置中的数据的暂时的保存目的地的表。数据暂时保存区域信息表T500如图7所示,有用于存储多个由无应答储存器号、写入偏移、写入大小、暂时保存储存器号以及暂时保存偏移构成的组的区域。另外,将由无应答储存器号、写入偏移、写入大小、暂时保存储存器号以及暂时保存偏移构成的组称为暂时保存区域信息。无应答储存器号是判断为网络故障的储存器装置的储存器号。写入偏移表示对于无应答储存器号表示的储存器装置本来写入数据的位置。写入大小表示无应答储存器号表示的储存器装置中写入的数据的大小。暂时保存储存器号表示将对应的写入偏移以及写入大小表示的数据暂时保存的储存器装置的储存器号。暂时保存偏移表示将对应的写入偏移以及写入大小表示的数据暂时保存的写入位置。(4)冗 余化方针决定部105
冗余化方针决定部105对无应答的储存器装置设定用于判断为网络故障的基准时间(Ta)。此外,该时间Ta也是用于防止高速缓冲存储器的溢出的暂时保存的开始为止的待机时间。此外,冗余化方针决定部105针对一个储存器装置,在发生了网络故障的情况下,对应于该一个储存器装置的网络连接方式(网络类别),导出判断为进行再冗余化为止的时间(Tb)。例如,通过无线通信进行网络连接的储存器装置15在进行无线通信的装置之间有障碍物时,无线信号被该障碍物切断,虽然储存器装置15正常,也容易发生网络故障。因此,能够通过消除障碍物来期待正常的无线通信重新开始,所以冗余化方针决定部105将比设定为初始值的时间Tb更长的时间作为新的Tb导出。此外,对于用USB等的专用电缆连接的储存器装置11,在没有返回应答请求的应答的情况下,比起由电缆导致的障碍,装置本身发生障碍的可能性高,所以冗余化方针决定部105将比设定为初始值的时间Tb更短的时间作为新的Tb导出。S卩,对于经过时间网络故障有望复原的储存器装置,冗余化方针决定部105将比初始值Tb更长的新的时间Tb设定为判断为进行再冗余化为止的时间。相反地,对于即使经过时间网络障碍也没有希望复原的储存器装置,冗余化方针决定部105将比初始值Tb更短的新的时间Tb设定为判断为进行再冗余化为止的时间。进而,冗余化方针决定部105若确认从网络故障复原,则对应于网络连接方式,导出从复原到网络状态稳定所需的时间(Td)。(5)阵列状态监视部104阵列状态监视部104针对阵列状态、即各储存器装置11 15的状态,根据网络状态监视部101以及储存器状·态监视部102的监视结果,监视网络故障状况或者阵列构成的故障状况。阵列状态监视部104对于监视网络状态的对象的各个储存器装置,将对该储存器装置发行应答请求时需要的信息(图3所示的网络信息)和请求指示通知给网络状态监视部101。之后,阵列状态监视部104将无应答信息根据来自网络状态监视部101的监视结果进行网络状态管理表TlOO的更新。阵列状态监视部104针对无应答的储存器装置,对从检测出无应答开始直到接收到关于对象装置的应答确认信息为止的时间进行计时。阵列状态监视部104若经过时间Ta也没有接收到关于对象装置的应答确认信息,则视为发生了网络故障,将表示发生了网络故障之意的网络故障发生信息通知给处理部106,并且对由判断时点开始接收到关于对象装置的应答确认信息为止的时间进行计时。此外,阵列状态监视部104对于发生了网络故障的储存器装置,进行网络故障管理表T300的更新。并且,阵列状态监视部104在时间Tb内没有接收到关于对象装置的应答确认信息的情况下,由处理部106进行再冗余化。阵列状态监视部104若在时间Tb内接收到关于对象装置的应答确认信息,则接着进行直到时间Td的计时。此外,阵列状态监视部104分别使用接收到应答确认信息的时刻以及时间Td,进行网络故障管理表T300的更新。阵列状态监视部104若在时间Td内接收到关于对象装置的无应答信息,则再次执行直到时间Td的时间计时。在时间Td内没有接收到关于对象装置的无应答信息的情况下,阵列状态监视部104将表示故障已复原之意的复原信息通知给处理部106,并且进行网络故障管理表T300以及网络状态管理表TlOO的更新。阵列状态监视部104将对监视储存器状态的对象的各个储存器装置进行访问时所需要的信息通知给储存器状态监视部102。进而,阵列状态监视部104在由处理部106进行的数据的读写失败的情况下,使储存器状态监视部102确认储存器的状态,在发生了储存器破损时,进行储存器状态管理表T200的破损标志的更新。此外,阵列状态监视部104在由处理部106进行的数据的读写成功的情况下,针对进行了读写的各储存器装置,进行网络状态管理表TlOO的最终应答确认时刻的更新。(6)处理部 106处理部106进行对各储存器装置的数据的读写、再冗余化的执行以及由网络故障复原的情况下的复原处理,如图2所示,包括冗余化执行部110、数据处理执行部111以及复原处理执行部112。 (6-1)冗余化执行部110冗余化执行部110若从阵列状态监视部104接收到再冗余化命令,则进行再冗余化。具体地,冗余化执行部110使用除了根据网络状态管理表TlOO以及储存器状态管理表T200确定的发生故障的储存器装置之外的其余的储存器装置以及备用的储存器装置(这里是储存器装置12)进行冗余化。冗余化如以下这样执行,即:使用存储在构成阵列的储存器装置中的除了判断为故障的储存器之外的其余的储存器装置中、且暂时被保存的数据之外的全部数据,复原应该存储到判断为故障的储存器中的数据,将复原的数据全部写入备用的储存器装置。此外,对于在发生故障后写入的数据,也可以使用数据暂时保存区域信息表T500,将作为应该写入到发生了故障的储存器装置中的数据而暂时保存在其它的储存器装置中的数据原样地写入备用储存器装置中。(6-2)数据处理执行部111数据处理执行部111进行对各储存器装置的数据的读写。数据处理执行部111在发生网络故障时和没有发生网络故障时的功能动作不同,因此,以下分情况来说明。此外,通过判断网络故障管理表T300中是否存在故障信息,能够确定有没有发生网络故障。(没有发生网络故障的情况)在此,首先,对没有发生网络故障的情况下的功能动作进行说明。数据处理执行部111根据从请求受理部107接收到的来自外部的指示对各储存器装置进行读写时,将读出命令或者写入命令发送给各储存器装置。之后,在规定时间TO内从对象储存器装置接收到应答的情况下,数据处理执行部111与网络状态监视部101同样地,将应答确认和对象储存器装置的储存器号通知给阵列状态监视部104,并且进行数据的读出或者数据的写入。在读出或者写入失败的情况下,将失败的储存器装置的储存器号和表示已失败之意的失败信息通知给阵列状态监视部104。进而,经由请求受理部107将失败信息还通知到外部。在读出或者写入成功的情况下,数据处理执行部111经由请求受理部107将该情况通知到外部。在规定时间TO内从对象储存器装置没有接收到应答的情况下,数据处理执行部111将无应答的储存器装置的储存器号和无应答信息通知给阵列状态监视部104。(发生了网络故障的情况)在此,对发生了网络故障的情况下的功能动作进行说明。首先,对数据的写入时的功能动作进行说明。数据处理执行部111将应该写入到发生了网络故障的储存器装置中的数据写入到除了该储存器装置之外的其余的储存器装置中的具有能够暂时保存的容量的储存器装置中。此时,数据处理执行部111针对暂时保存数据的储存器装置的空白容量,更新空白区域信息表T400以及数据暂时保存区域信息表T500。接着,对数据读入时的功能动作进行说明。数据处理执行部111在应该从发生了网络故障的储存器装置读入的数据暂时保存在其它的储存器装置中的情况下,将该数据从该其它的储存器装置读入。如果没有暂时保存、且能够使用冗余数据进行应读入的数据的复原,则使用冗余数据将应该从发生网络故障的储存器装置读入的数据复原。如果没有可能复原,则数据处理执行部111将读入错误通知给请求受理部 107。直至全部的读入完成为止,重复以上的动作功能。(6-3)复原处理执行部112复原处理执行部112若从阵列状态监视部104接收到复原信息,则将数据写回到从网络故障复原的储存器装置。具体地,复原处理执行部112使用与复原的储存器装置对应的暂时保存区域信息,将暂时写入的数据写回到本来应该写入的储存器装置(复原的储存器装置)。复原处理执行部112将与写回的数据有关的暂时保存区域信息从数据暂时保存区域表T500删除。 此外,复原处理执行部112在空白区域信息表T400中更新空白容量。具体地,更新作为暂时保存目的地的储存器装置的空白容量以及复原数据后的储存器装置的空白容量。直至与复原的储存器装置对应的暂时保存区域信息不存在为止重复以上的功能动作。(7)请求受理部107请求受理部107从外部受理数据的读写请求,将受理的请求输出到处理部106。此时,受理读入请求的情况下,请求受理部107进一步受理读入位置,将受理的读入位置也输出到处理部106。此外,在受理写入请求的情况下,请求受理部107进一步受理应该写入的数据,将受理的数据也输出到处理部106。此外,请求受理部107若从处理部106接收到出错通知,则将接收的出错通知输出到外部。(8)通信部 108通信部108进行与作为管理对象的各储存器装置11 15的数据的输入输出。
1.3储存器装置11 15储存器装置11 15为同样的构成要素,因此此处,参照图8对储存器装置11的构成要素进行说明。储存器装置11如图8所示,由存储部201、处理部202、储存器状态取得部203以及通信部204构成。(I)存储部 201存储部201是存储由阵列管理装置100写入的数据的大容量记录装置,例如硬盘驱动(HDD )或者固态硬盘驱动(SSD )等。(2)处理部 202处理部202根据阵列管理装置100的指示,将从阵列管理装置100接收的数据写入存储部201,或者从存储部201读出数据并经由通信部204发送给阵列管理装置100。此外,处理部202在经由通信部204从阵列管理装置100接收到应答请求时,将对于该命令的应答经由通信部204发送给阵列管理装置100。进而,处理部202在从储存器状态取得部203接收到表示存储部201破损的破损信息时,将该情况经由通信部204发送给阵列管理装置100。(3)储存器状态取得部203储存器状态取得部203检查存储部201有没有破损。并且,在破损时,储存器状态取得部203在由阵列管理装置100检查储存器状态时将破损信息通知给处理部202。(4)通信部 2041.4 动作此处,对阵列管理装置100的动作进行说明。( I)网络状态监视处理首先,使用图9所示的流程图对定期(例如,每隔2秒)进行各储存器装置11 15的生存确认的网络状态监视处理进行说明。阵列状态监视部104选择一个监视对象的储存器装置(步骤S5)。阵列状态监视部104使用网络状态管理表T100,根据对应的无应答标志的值是否为I来判断选择的储存器装置是否为无应答的状态(步骤S10)。当判断为1,即判断为无应答的状态时(步骤SlO为“是”),进行储存器装置的复原确认处理(步骤S30)。当判断为不是1,即判断为O (判断为不是无应答)时(步骤SlO为“否”),阵列状态监视部104使用网络状态管理表TlOO取得与选择的储存器装置对应的最终应答确认时刻(步骤S15 ),判断当前时点的时刻是否从取得的最终应答确认时刻经过了规定时间(TI,例如2秒)(步骤S20)。当判断为经过了规定时间的情况下(步骤S20为“是”),进行储存器装置的生存确认处理(步骤S25)。当判断为当前时点的时刻从取得的最终应答确认时刻开始还没有经过规定时间Tl的情况下(步骤S20为“否”),在执行 步骤S20以及步骤S30后,阵列状态监视部104判断是否对管理对象的所有储存器装置进行了处理,即判断是否存在没有选择的储存器装置(步骤S35)。
当判断为没有对所有储存器装置进行了处理的情况下(步骤S35为“否”),阵列状态监视部104选择下一个储存器装置(步骤S40),处理返回到步骤S10。当判断为对所有的储存器装置进行了处理的情况下(步骤S35为“是”),处理结束。(2)储存器装置的生存确认处理在此,使用图10所示的流程图对图9所示的步骤S25的处理进行说明。网络状态监视部101对作为生存确认对象的储存器装置发送应答请求(步骤S100)。网络状态监视部101判断在规定时间TO内是否从对象储存器装置接收到应答(步骤 S105)。在判断为接收到应答的情况下(步骤S105为“是”),网络状态监视部101将应答确认信息通知给阵列状态监视部104,阵列状态监视部104将网络状态管理表TlOO中的与对象储存器装置对应的最终应答确认时刻更新为当前的时刻(步骤S110 )。在判断为没有接收到应答的情况下(步骤S105为“否”),网络状态监视部101将无应答信息通知给阵列状态监视部104,阵列状态监视部104若从网络状态监视部101接收到无应答信息,则将网络状态管理表TlOO中的与对象储存器装置对应的无应答标志的值设定为I (步骤S115)。(3)储存器装置的复原确认处理此处,使用图 11所示的流程图对图9所示的步骤S30的处理进行说明。网络状态监视部101对作为确认对象的储存器装置发送应答请求(步骤S150)。网络状态监视部101判断在规定时间TO内是否从对象储存器装置接收到应答(步骤 S155)。在判断为接收到应答的情况下(步骤S155为“是”),网络状态监视部101将应答确认信息通知给阵列状态监视部104,阵列状态监视部104将网络状态管理表TlOO中的与对象储存器装置对应的最终应答确认时刻更新为当前的时刻(步骤S160)。阵列状态监视部104将网络状态管理表TlOO中的与对象储存器装置对应的无应答标志的值设定为O (步骤S165)。(4)无应答时的冗余化方针决定处理在此,使用图12所示的流程图对冗余化方针决定部105进行的无应答时的冗余化方针决定处理进行说明。冗余化方针决定部105使用网络状态管理表TlOO的网络类别判断无应答的储存器装置的网络类别是否为可能暂时切断的连接(步骤S200)。例如,可能暂时切断的连接指通过SCSI的连接或者通过USB的连接。在判断为可能暂时切断的连接的情况下(步骤S200为“是”),冗余化方针决定部105决定用于防止高速缓冲存储器的溢出的暂时保存开始为止的时间Ta (步骤S205)。时间Ta例如为5秒。冗余化方针决定部105决定直到判断为进行再冗余化为止的时间作(初始值)(步骤210)。时间Tb例如为10秒。使用网络状态管理表TlOO的网络类别判断对象储存器装置连接的网络是否为有线(步骤S215)。判断为不是有线的情况下,即判断为无线的情况下(步骤S215为“否”),冗余化方针决定部105将5XTb再设定为Tb (步骤S220)。执行步骤S220之后、以及在判断为对象储存器装置连接的网络为有线的情况下(步骤S215为“是”),冗余化方针决定部105使用对应的网络类别判断对象储存器装置连接的网络是否经由因特网(步骤S225)。当判断为经由因特网时(步骤S225为“是”),冗余化方针决定部105将2XTb再设定为Tb (步骤S230)。执行步骤S230后、以及在判断为对象储存器装置连接的网络经由因特网时(步骤S225为“是”),冗余化方针决定部105使用网络状态管理表TlOO的网络类别判断是否为高可靠储存器(步骤S225) 。当判断为高可靠储存器时(步骤S235为“是”),冗余化方针决定部105将IOXTb再设定为Tb (步骤S240)。当判断为无应答的储存器装置的网络类别不是可能暂时切断的连接时(步骤S200为“否”),立即将进行再冗余化之意的指示通知给阵列状态监视部104 (步骤S245)。(5)复原时的冗余化方针决定处理在此,使用图13所示的流程图对由冗余化方针决定部105进行的复原时的冗余化方针决定的处理进行说明。冗余化方针决定部105决定从复原到网络状态稳定所需的时间Td (初始值)(步骤 S300)。使用网络状态管理表TlOO的网络类别判断对象储存器装置连接的网络是否为有线(步骤S305)。判断为不是有线时,即判断为无线时(步骤S305为“否”),冗余化方针决定部105将2XTb再设定为Tb (步骤S310)。执行步骤S310后、以及在判断为对象储存器装置连接的网络为有线时(步骤S305为“是”),冗余化方针决定部105使用对应的网络类别,并使用网络状态管理表TlOO的网络类别判断对象储存器装置连接的网络是否经由因特网(步骤S315)。在判断为经由因特网时(步骤S315为“是”),冗余化方针决定部105将2XTd再设定为Td (步骤S320)。(6)通常时的访问处理在此,使用图14所示的流程图对通常时的访问(读写)处理进行说明。数据处理执行部111根据从请求受理部107接收到的来自外部的指示对各储存器装置进行读写时,将读出命令或者写入命令发送给各储存器装置(步骤S400 )。判断在规定时间TO内是否从对象储存器装置接收到应答(步骤S405)。判断为接收到时(步骤S405为“是”),阵列状态监视部104对网络状态管理表T100,将与对象储存器装置对应的最终应答确认时刻更新为当前的时刻(步骤S410 )。数据处理执行部111执行读出或者写入,判断是否成功(步骤S415)。若判断为成功(步骤S415为“是”),则数据处理执行部111将访问成功通知给外部(步骤S435)。若判断为失败(步骤S415为“否”),则储存器状态监视部102通过确认储存器状态监视部102进行监视的对象的储存器装置的储存器状态,判断该储存器装置是否破损(步骤S420)。若判断为破损(步骤S420为“是”),则阵列状态监视部104针对储存器状态表T200,将与作为对象的储存器装置对应的破损标志设定为I (步骤S425)。此外,在判断为在规定时间TO内没有从对象储存器装置接收到应答时(步骤S405为“否”),阵列状态监视部104针对网络状态管理表T100,将与对象储存器装置对应的无应答标志的值设定为I (步骤S430)。执行步骤S425、步骤S430后、以及关于对象储存器装置判断为储存器没有破损时(步骤S420为“否”),数据处理执行部111将访问失败通知给外部(步骤S440)。(7)网络故障时的写入处理在此,使用图15所示的流程图对网络故障时的数据写入处理进行说明。数据处理执行部111若从请求受理部107接收到数据写入请求和对象数据,则对各储存器装置决定写入的数据和写入位置(步骤S500)。例如,对各储存器装置的写入位置由与RAID方式对应的算法决定。数据处理执行部111对于没有发生网络故障的储存器装置,即对于有应答的储存器装置,将决定的数据写入决定的写入位置(步骤S505)。数据处理执行部111取得空白区域信息表T400中管理的各储存器装置中的没有发生网络故障的所有的储存器装置的空白容量(步骤S510)。数据处理执行部111判断是否存在将应该写入到发生网络故障的储存器装置的数据暂时保存的空白区域,即能够暂时保存的储存器装置(步骤S515)。在判断为存在的情况下(步骤S515为“是”),数据处理执行部111选择一个能够暂时保存的储存器装置,从选·择的储存器装置的空白容量决定暂时保存的区域(步骤S520),将应该写入发生了网络故障的储存器装置的数据写入决定的区域中(步骤S525)。数据处理执行部111针对暂时保存数据的储存器装置的空白容量,更新空白区域信息表T400 (步骤S530)。数据处理执行部111分别使用发生了网络故障的储存器装置的储存器号、接收数据时决定的数据的写入位置、写入的数据的大小、暂时保存目的地的储存器装置的储存器号、以及暂时保存目的地中的写入位置,对数据暂时保存区域信息表T500进行更新(步骤S535)。具体地,数据处理执行部111分别将发生了网络故障的储存器装置的储存器号、接收数据时决定的数据的写入位置、写入的数据的大小、暂时保存目的地的储存器装置的储存器号、以及暂时保存目的地中的写入位置写入数据暂时保存区域信息表T500的无应答储存器号、写入偏移、写入大小、暂时保存储存器号以及暂时保存偏移。(8)网络故障时的读入处理在此,使用图16所示的流程图对网络故障时的数据读入处理进行说明。数据处理执行部111若从请求受理部107接收到数据读入请求和进行对象数据的读入的位置,则对于各储存器装置决定读入位置(步骤S600)。例如,对各储存器装置的读入位置由与RAID方式对应的算法决定。数据处理执行部111使用网络故障管理表T300判断是否发生网络故障(步骤S605)。在判断为发生了网络故障的情况下(步骤S605为“是”),数据处理执行部111判断在数据暂时保存区域信息表T500中,是否存在与对发生网络故障的储存器装置的读入位置对应的暂时保存区域信息(步骤S610)。
在判断为不存在的情况下(步骤S610为“否”),数据处理执行部111判断能否使用冗余数据复原应该读入的数据(步骤S615)。例如,根据RAIDu方式对应的算法,具体地,通过判断是否存在数据复原所需要的正常的储存器装置的台数来决定。
在判断为不能复原的情况下(步骤S615为“否”),数据处理执行部111将读入错误通知给请求受理部107 (步骤S620)。
在判断为没有发生网络故障的情况下(步骤S605为“否”,数据处理执行部111关于各储存器装置,从决定的读入位置读入数据(步骤S625 )。
在判断为存在与对发生了网络故障的储存器装置的读入位置对应的暂时保存区域信息的情况下(步骤S610为“是”),数据处理执行部111从暂时保存区域信息所表示的暂时保存目的地读入应该从发生了网络故障的储存器装置读入的数据(步骤S630)。此外,关于没有发生网络故障的储存器装置,从决定的读入位置读入数据。
在判断为能够使用冗余数据复原应该读入的数据的情况下(步骤S615为"“是”),数据处理执行部111从其它的储存器装置取得冗余数据(步骤S635),使用取得的冗余数据,复原应该从发生了网络故障的储存器装置读入的数据(步骤S640 )。此外,关于没有发生网络故障的储存器装置,从决定的读入位置读入数据。
执行步骤S625、步骤S630、步骤S640后,数据处理执行部111判断是否完成了所有数据的读入(步骤S645)。例如,通过高速缓冲存储器中是否残留有数据来判断。
在判断为没有完成的情况下(步骤S645为“否”),处理返回步骤S605。
(9)从网络故障的复原处理
在此,使用图17所示的流程图,对从网络故障的复原处理进行说明。
复原处理执行部112若从阵列状态监视部104接收到复原信息,则判断在数据暂时保存区域信息表T500中是否存在暂时保存区域信息(步骤S700)。
在判断为存在的情况下(步骤S700为“是”),复原处理执行部112选择一个暂时保存区域信息(步骤S705)。复原处理执行部112使用选择的暂时保存区域信息,将暂时写入的数据写回到本来应该写入的储存器装置(步骤S710)。具体地,复原处理执行部112根据选择的暂时保存区域信息中包含的暂时保存储存器号、暂时保存偏移量和写入大小来确定暂时保存目的地的储存器装置、暂时保存目的地的开始位置和结束位置。复原处理执行部112对于选择的暂时保存区域信息中包含的无应答储存器号所表示的储存器装置,将之前确定的暂时保存目的地的储存器装置内的暂时保存目的地的开始位置到结束位置所表示的数据从写入偏移所表示的位置开始写入。
复原处理执行部112将选择的暂时保存区域信息从数据暂时保存区域信息表T500中删除(步骤S715)。此外,复原处理执行部112在空白区域信息表T400中将空白容量更新(步骤S720 ),处理返回到步骤S700。
( 10)无应答时的整体动作
在此,使用图18所示的流程图对储存器装置无应答时阵列管理装置100的整体动作的概要进行说明。
阵列状态监视部104将与网络状态管理表TlOO中为无应答的储存器装置对应的无应答标志的值设定为I (步骤S800)。冗余化方针决定部105按照图12所示的无应答时的冗余化方针决定处理,根据与无应答的储存器装置对应的网络类别决定时间Ta、Tb (步骤S805)。阵列状态监视部104根据无应答时的冗余化方针决定处理的结果判断是否应该立即进行再冗余化(步骤S810)。在判断为不应该进行再冗余化的情况下(步骤S810为“否”),阵列状态监视部104判断是否已经过由冗余化方针决定部105决定的时间Ta (步骤S815)。在判断为未经过的情况下(步骤S815为“否”),阵列状态监视部104判断无应答的储存器装置是否已复原,即是否从网络状态监视部101接收到对对象储存器装置的应答确认信息(步骤S820)。在判断为没有复原的情况下(步骤S820为“否”),处理返回到步骤S815,继续时间Ta的计时。在判断为经过了时间Ta的情况下(步骤S815为“是”),阵列状态监视部104针对数据的写入进行暂时的保存(步骤S825)。此外,阵列状态监视部104将判断为网络故障的储存器装置的储存器号、判断为网络故障的时刻、冗余化方针决定部105算出的时间Tb分别写入到网络故障管理表T300的储存器号、网络故障发生时刻以及确认时间(Tb)。进行暂时保存,并且阵列状态监视部104判断是否已经过冗余化方针决定部105决定的时间Tb (步骤S830)。在判断为没有经过的情况下(步骤S830为“否”),阵列状态监视部104判断是否接收到来自无应答的储存器装置的应答,即是否从网络状态监视部101接收到对对象储存器装置的应答确认信息(步骤S835)。
在判断为没有接收到的情况下(步骤S835为“否”),处理返回到步骤S830,继续时间Tb的计时。在判断为接收到的情况下(步骤S835为“是”),冗余化方针决定部105根据与复原的储存器装置对应的网络类别决定时间Td,阵列状态监视部104判断是否经过了冗余化方针决定部105决定的时间Td (步骤S840)。在判断为还没有经过的情况下(步骤S840为“否”,阵列状态监视部104判断是否再次成为无应答(步骤S845)。在判断为再次成为无应答的情况下(步骤S845为“是”),处理返回到步骤S830,阵列状态监视部104再次重新开始时间Td的计时,判断是否经过了时间Tb。在判断为没有成为无应答的情况下(步骤S845为“否”),处理返回到步骤S840,继续时间Td的计时。在判断为经过了时间Tb的情况下(步骤S830为“是”),阵列状态监视部104从暂时保存状态复原到通常的状态(步骤S850)。具体地,还有,阵列状态监视部104将表示故障已复原之意的复原信息通知给处理部106,并且在网络故障管理表T300中将对应的故障信息删除,然后更新网络状态管理表T100,即在网络状态管理表TlOO中将对应的无应答标志的值设定为O。此外,复原处理执行部112进行图17所示的复原处理,进行数据的写回,暂时保存区域数据的删除以及空白区域信息表T400的更新。此外,执行步骤S850后、以及判断为无应答的储存器装置已复原的情况下(步骤S820为“是”),阵列状态监视部104将对应的无应答标志的值设定为O (步骤S855)。判断为应该立即进行再冗余化的情况下(步骤S810为“是”)、以及判断为经过了时间Tb的情况下(步骤S830为“是”),冗余化执行部110执行再冗余化(步骤S860)。1.5状态的迁移在此,对冗余化状态的迁移进行说明。图19是表示直到执行冗余化为止的状态的迁移的图。在没有发生任何故障的情况下,阵列管理系统I在通常状态下动作(ST1)。在通常状态时,若阵列管理装置100检测到无应答的一个储存器装置(此处设为储存器装置11),则等待作为复原时间的时间Ta经过。若在时间Ta经过之前有来自储存器装置11的应答,则维持通常状态,若直到时间Ta经过为止没有来自储存器装置11的应答,即若过渡条件A成立,则认为储存器装置11发生了网络故障,为了防止高速缓冲存储器的溢出,进行到暂时保存状态的过渡处理(ST2)。此处,到暂时保存状态的过渡是指,算出时间Tb,将发生了网络故障的储存器装置的储存器号、网络故障发生时刻以及确认时间(Tb)写入到网络故障管理表T300中。 过渡处理完成后,进入暂时保存状态(ST3 )。在此状态中,若有数据的写入命令,则阵列管理装置100代替将对象数据写入到发生了网络故障的储存器装置11中而写入到具有写入该对象数据的空白区域的其它的储存器装置中。之后,确认储存器装置11的应答,从确认应答后经过时间Td为止不为无应答的情况下,即从应答确认后到时间Td为止的期间已确认生存这样的条件D成立的情况下,认为储存器装置11从网络故障复原,进行向正常状态的过渡处理(ST4)。在此,向正常状态的过渡处理是指将暂时 保存的数据写回到本来应该写入的储存器装置(发生了网络故障的储存器装置11)或对空白区域信息表T400以及数据暂时保存区域信息表T500的更新处理。若向通常状态的过渡处理完成,则返回到通常状态(ST1)。此外,在通常状态时,发生了储存器的破损、网络的物理破损等不能期待自动复原的故障时,即条件C成立时,立即执行再冗余化(ST5)。若再冗余化的执行完成,则返回再冗余化后的结构下的通常状态(STl)。此外,作为不能进行暂时保存和再冗余化、且冗余性降低的状态的降级状态或者作为阵列破损、且发生了数据损失的状态的数据损失状态也当然可以过渡,此时从STl的状态直接过渡到ST5的状态。1.6具体例(I)关于暂时保存图20(a)表示通常时的数据写入的概要图。在通常状态下,若阵列管理装置100受理写入请求,则根据RAID5的算法,对构成冗余化的各储存器装置(此处为储存器装置11、
14、15)决定进行写入的数据,并向各储存器分别写入数据。例如,有某个数据Xl的写入请求时,阵列管理装置100生成作为应该写入的数据的数据Al、B1、Cl。有某个数据X2的写入请求时,阵列管理装置100生成作为应该写入的数据的数据A2、B2、C2。在此,假设从数据Al和Cl能够复原数据BI,从数据BI和Cl能够复原数据Al。此外,对于由数据X2生成的数据A2、B2、C2也同样,假设从数据A2和C2能够复原数据B2,从数据B2和C2能够复原数据A2。
另一方面,图20(b)表示网络故障时,即暂时保存状态时的数据写入的概要图。在暂时保存状态时,阵列管理装置100与通常状态同样,对各储存器装置11、14、15决定写入的数据,但对于应该写入到无应答的储存器装置15中的数据(数据Al、A2),暂时保持在构成冗余化的另外的储存器装置(此处为储存器装置11)的空白区域或者备用储存器(此处为储存器装置12)的空白区域中。若储存器装置15从网络故障复原,则将暂时保存的数据反映到本来应该写入的储存器,并将暂时保存的数据删除。
读入时,能够从无应答的储存器装置15以外的储存器装置11、12、14读取数据,使其复原。
(2)关于再冗余化
图21是表示再冗余化的概要图。
假设在通常时,由储存器装置11、14、15进行冗余化,储存器装置15中发生了储存器破损。
此时,阵列管理装置100将储存器装置15从冗余化结构中分离出来,使用其它的储存器(此处为作为备用储存器装置的储存器装置12)进行冗余化的再构成。然后,通过储存器装置11、14复原保存在储存器装置15中的数据,并将复原的数据写入到储存器装置12,复原阵列结构。
1.7变形例
以上根据实施方式进行了说明,但是本发明并不限于上述的实施方式。例如,可以考虑以下的变形例。
(I)在上述实施方式中,将比初始值更长的时间设定为时间Tb、Td时使用的值是一例,将时间Td变长的倍数可以为比I大的值。
(2)上述实施方式中的无线通信是指在阵列管理装置和储存器装置之间的网络上的最短经路的一部分上存在无线区间,或者最短经路的全部为无线区间。此外,有线是指在最短经路上不存在无线区间。
(3)在上述实施方式中,冗余化方针的决定是储存器装置无应答的时候以及发生储存器破损等故障时进行的,但是并不限定于此。
阵列管理装置也可以预先存储对应于网络类别和储存器类别的冗余化方针。
此时,阵列管理装置例如将如图22所示的方针决定表T600预先存储在管理信息存储部。
方针决定表T600具有用于存储多个由触发器、网络类别、储存器类别、冗余化方针构成的组的区域。
触发器表示由网络状态监视部以及储存器状态监视部检测的状态。
网络类别表示与储存器装置的连接方式。
储存器类别是表示构成储存器的类别的信息。
冗余化方针表示用于决定冗余方针(此处,时间Ta、Tb、Td的决定或立即进行再冗余化的决定)的条件。
冗余化方针由触发器、网络类别以及储存器类别的组合决定。
例如,储存器装置为无应答时,由网络类别以及储存器类别决定从通常状态到暂时保存状态的过 渡条件A (例如,时间Ta)、从暂时保存状态到再冗余化状态的过渡条件B(例如,时间Tb)以及从通常状态到再冗余化状态的过渡条件C。具体地,考虑在某储存器装置使用局域IP网络连接时,无线连接或者有线连接的物理驱动在没有返回储存器破损的应答的状态下成为无应答状态的情况。作为陷入如此状态的主要原因,可以考虑网络故障或包含转输控制部的储存器整体的破损等,但是阵列管理装置没有确实地判别其主要原因的方法。因此,首先推定为发生了网络故障,执行暂时保存。即使从暂时保存状态经过一定时间,储存器装置也没有复原的情况下,判断为发生了储存器的破损,进行再冗余化。此处,有线和无线时网络的稳定性不同,一般地,无线网络较不稳定,并且复原需要花时间,因此,无线连接时设定的时间比有线连接时设定的时间更长。如此地,能够根据网络状态、储存器状态,预先制作并保持冗余化方针决定表。此夕卜,作为网络状态、储存器状态,例如可以将电源状态、用户操作履历信息等用于时间Ta、Tb以及Td的决定。在冗余化方针决定中,可以通过利用电源状态,来考虑由电池用尽引起的网络切断。此外,也可以通过使用用户操作履历信息,来考虑由用户的有意的电源断开操作引起的网络切断。 由此,具有能够更适当地决定直到再冗余化为止的待机时间,能够防止不需要的再冗余化的效果。此外,此种情况下的冗余化方针决定部根据网络状态管理表TlOO确定作为冗余化方针的决定对象的储存器装置的网络类别,或者根据储存器状态管理表T200确定储存器类别。并且,根据检测到的状态、确定的网络类别以及储存器类别和方针决定表T600决定几余化方针。(4)上述实施方式中,作为对储存器的应答请求的发送以及接收手法,例如使用IP网络的情况下,可以使用Ping等。此外,储存器装置也可以与有没有接收应答请求无关地定期地发送应答。此外,储存器装置也可以在自动地检测到网络的再连接等时发送应答。(5)在上述实施方式中,储存器状态取得部203取得有没有储存器的破损,但是并不限定于此。储存器信息表示各储存器装置的能够从储存器状态取得部取得的信息,该信息也可以按照每个储存器装置而不同。例如,在内置有电池的储存器装置中,可以保存当前的电源状态或电池的余量作为储存器信息,若为受理用户操作的储存器装置,则也可以保存用户操作信息或用户操作时刻作为储存器信息。此外,也可以保存储存器装置是否为移动设备的信息。此外,储存器装置也可以不具有储存器信息。( 6 )上述实施方式中,储存器装置通过由储存器状态监视部定期地检查,通知储存器故障的有无,但是并不限定于此。储存器装置也可以在储存器的故障发生等储存器信息变化时,发送故障发生之
O(7)上述实施方式中,也可以将储存器装置11 15的一部分或者全部保存到数字记录机10的壳体内部。(8)也可以将记载上述实施方式中说明的方法的步骤的程序存储到存储器中,体由CPU等通过从存储器读出程序,执行读出的程序来实现上述方法。此外,也可以将记载上述方法的步骤的程序保存在记录介质中并公布。此处,列举通过执行程序实现上述方法的构成的一例。
图23是表示由通过执行程序来实现上述方法的结构构成的阵列管理装置100A的一例的结构图。阵列管理装置100A具有记录各种处理程序的R0M1000、进行整体的处理的CPU1010、暂时记录数据的RAM1020、控制与储存器的数据转送以及管理的下位侧转送控制部1030、控制与数码相机等其它的装置的数据转送以及管理的上位侧传送控制部1040、和作为记录装置的管理信息存储部103。关于上述实施方式所示的网络状态监视部101、储存器状态监视部102、阵列状态监视部104、冗余化方针决定部105、冗余化执行部110、数据处理执行部111以及复原处理执行部112,例如,在R0M1000内保存程序作为如网络状态监视部101A、储存器状态监视部102A、阵列状态监视部104A、冗余化方针决定部105A、冗余化执行部110A、数据处理执行部IllA以及复原处理执行部112A,通过CPU1010执行各个程序,进行各构成要素的处理。此外,下位侧转送控制部1030以及上位侧转送控制部1040相当于上述实施方式的通信部108。此外,R0M1000也可以是硬盘驱动(HDD)等其它的记录装置。此外,下位侧转送控制部1030和上位侧转送控制部1040也可以共用相同的接口。图24表示由通过执行程序实现上述方法的结构构成的储存器装置IlA的一例的结构图。储存器装置IlA具有R0M2000、CPU2010、RAM2020以及控制与阵列管理部的数据转送以及管理的转送控制部2030和一台以上的大容量记录装置2040 2050。大容量记录装置2040 2050例如也可以是硬盘驱动或固态硬盘驱动。此外,上述实施方式所示的储存器状态取得部203例如在R0M2000内保存程序作为例如储存器状态取得部203A,通过CPU2010执行程序,进行该构成要素的处理。此外,转送控制部2030相当于上述实施方式的通信部204,大容量记录装置2040 2050相当于上述实施方式的存储部201。
·
此外,R0M2000也可以是硬盘驱动等其它的记录装置。此外,储存器装置也可以为其它的系统构成。具体地,储存器装置也可以是大容量记录装置,通过SCSI等储存器接口与阵列管理部直接连接,并且由阵列管理装置的CPU控制。(9)上述实施方式所示的阵列管理装置典型地以作为半导体集成电路的LSI实现。可以将其单个地作为一个芯片,也可以以包含一部分或者全部的方式以一个芯片实现。此处,LSI根据集成度的不同,也称为1C、系统LS1、超级LS1、特级LSI。 此外,将电路集成化的方法不限于LSI,也可以以专用电路或者通用处理器实现。在制造LSI之后,也可以利用可编程的FPGA (Field Programmable Gate Array)或能够重构LSI内部的电路单元的连接和设定的重构处理器(reconfigular processor)。此外,若由于半导体技术的进步或者衍生的其它技术,出现了替代LSI的电路集成化技术,则也可以使用其技术进行功能模块的集成化。生物技术的适用等也是有可能的。进而,将上述实施方式所示的阵列管理装置集成化而得到的半导体芯片和用于描绘图像的显示器组合,能够构成与各种各样的用途相应的描绘设备。在便携电话、电视机、数字视频记录机、数字视频照相机、汽车导航仪等中,可以利用本发明。作为显示器,除了布劳恩管(CRT,阴极射线显像管)之外,与将液晶或TOP (等离子显示面板)、有机EL等的平面显示器、摄影机等作为代表的投射型显示器等组合也是可以的。
(10)本发明中,将多个储存器3100、3101...、3102冗余化、且控制向各储存器3100、3101…、3102的访问的阵列管理装置3000如图25所示,也可以包括:存储向所述多个储存器各自的通信路径的构成类别的存储部3001 ;确认对所述多个储存器各自的访问是成功还是失败的判定部3002 ;根据所述存储部3001中存储的所述通信路径的构成类别,导出从对所述储存器的访问失败开始到执行冗余化为止的待机时间的导出部3003 ;以及冗余化处理部3004,在由所述判定部3002确认向所述多个储存器中的某个储存器的访问失败的情况下,在由所述导出部3003对应于该储存器的所述通信路径的构成类别而导出的所述时间经过为止的期间,所述判定部3002没有确认对该储存器的访问成功时,将除了该储存器之外的所述多个储存器冗余化。
此时,存储部3001可以由上述实施方式所示的管理信息存储部103实现,判定部3002可以由上述实施方式所示的网络状态监视部101以及储存器状态监视部102的组合实现,导出部3003可以由上述实施方式所示的冗余化方针决定部105实现,冗余化处理部3004可以由上述实施方式所示的阵列状态监视部104以及冗余化执行部110的组合来实现。
此外,储存器3100、3101...、3102相当于上述实施方式所示的储存器装置11 15的某个。
或者,本发明的将多个储存器3100、3101、…、3102冗余化、且控制对各个储存器3100,3101, ->3102的访问的阵列管理装置3000Α如图26所示,也可以包括存储部3001、判定部3002、导出部3003、冗余化处理部3004、受理来自外部的访问请求的请求受理部3005、以及暂时写入部306,该暂时写入部306对于访问失败的储存器之外的储存器,进行应该写入到访问失败的储存器的数据的写入。
此时,请求受理部3005可以由所述实施方式所示的请求受理部107实现,暂时写入部3006可以由上述实施方式所示的数据处理执行部111、特别是通过网络故障时的功能动作实现。此外,存储部3001、判定部3002、导出部3003以及冗余化处理部3004在上述已经说明,所以省略此处的说明。
或者,具有存储向所述多个储存器各自的通信路径的构成类别的存储部、将多个储存器冗余化、且控制向各储存器的访问的管理装置中的管理集成电路也可以由如图25所示的虚线所围的各构成要素(判定部3002、导出部3003、冗余化处理部3004)构成。
(11)本发明的阵列管理方法,其是具有存储向多个储存器各自的通信路径的构成类别的存储部、判定部、导出部和冗余化处理部、将所述多个储存器冗余化且控制对所述各储存器的访问的阵列管理装置中的阵列管理方法,其如图27所示,也可以包括:第I确认步骤,所述判定部反复确认向所述多个储存器各自的访问是成功还是失败(步骤S1000);第I判断步骤,所述判定部判断所述第I确认步骤是否确认到对所述多个储存器中的某个储存器的访问失败(步骤S1005);导出步骤,在所述第I判断步骤判断为确认到对所述多个储存器中的某个储存器的访问失败的情况下,所述导出部根据由所述存储部存储的与该储存器对应的所述通信路径的构成类别,导出从对该储存器的访问失败开始到执行冗余化为止的待机时间(步骤S1010);第2判断步骤,在通 过所述第I判断步骤判断为确认到对所述多个储存器中的某个储存器的访问失败的情况下,所述冗余化处理部根据该储存器的所述通信路径的构成类别判断是否经过了由所述导出步骤导出的所述待机时间(步骤S1015);以及冗余化执行步骤,所述判定部确认在所述待机时间内对由所述确认步骤确认访问失败的储存器的访问是成功还是失败(步骤S1020),并且判断在所述第I判断步骤中是否确认到对由所述确认步骤确认访问失败的储存器的访问成功(步骤S1025),在没有确认到对确认到访问失败的储存器的的访问为成功时,所述冗余化处理部使用除了该储存器之外的其余的储存器进行冗余化(步骤S1030)。此时,确认步骤以及第I判断步骤能够以上述实施方式中的图9、101以及图18的步骤S835所示的处理动作实现,导出步骤能够以上述实施方式中的图12所示的处理动作实现,第2判断步骤能够以图18所示的S830实现,冗余化执行步骤能够以图18所示的步骤S860实现。(12)也可以将上述实施方式以及其变形例组合。
1.8 补充(I)本发明的一个实施方式的将多个储存器冗余化、且控制对各储存器的访问的阵列管理装置,其特征在于,具有:判定部,反复确认对所述多个储存器各自的访问成功还是失败;存储部,存储向所述多个储存器各自的通信路径的构成类别;导出部,根据所述存储部存储的所述通信路径的构成类别,导出从对所述储存器的访问失败开始到执行冗余化为止的待机时间;以及冗余化处理部,由判定部确认到对所述多个储存器中的某个储存器的访问失败的情况下,在经过由所述导出部根据该储存器的所述通信路径的构成类别导出的所述待机时间为止的期间,通过所述判定部的再次的确认动作没有确认到对该储存器的访问的成功时,使用除了该储存器之外的其余的储存器进行冗余化。通过此构成,阵列管理装置根据访问失败的储存器的通信路径的类别导出直到冗余化为止的待机时间。因此,阵列管理装置能够根据通信路径的类别来变更直到判断为进行再冗余化的待机时间,即判断为进行再冗余化的判断基准。因此,若在待机时间内访问成功,则变得不需进行再冗余化,所以与在发生故障后立即进行再冗余化的情况相比,储存器装置的寿命变长。(2)此处,也可以是,所述导出部以所述通信路径的构成类别表示无线时的所述待机时间比所述通信路径的构成类别表示有线时的所述待机时间长的方式进行所述导出。根据此构成,阵列管理装置在与访问失败的储存器进行无线通信的情况下,相比较于进行有线通信的情况,待机时间为更长的时间。通常,无线通信的情况下,相比较于有线通信,通信的确立不稳定。因此,访问失败为暂时的故障(例如,由于障碍物导致通信中断,不能建立通信的情况)的可能性很高,所以通过使待机时间比有线的情况的待机时间更长,能够期望从暂时的故障自动地复原,因此不必立即进行再冗余化。(3)此处,也可以是,所述导出部以所述通信路径的构成类别表示因特网时的所述待机时间比所述通信路径的构成类别表示LAN (局域网,Local Area Network)时的所述待机时间长的方式进行所述导出。根据此构成,阵列管理装置在与访问失败的储存器经由因特网进行通信的情况下,相比较于以LAN进行通信的情况,待机时间为更长的时间。通常,在经由因特网通信的情况下,数据的吞吐量比经由LAN通信的情况要多,因此访问花费时间。因此,认为是访问的失败为暂时的故障(例如,由于吞吐量多所以访问花费时间),所以通过使待机时间比LAN的情况的待机时间长,能够期望从暂时的故障自动地复原。
(4)此处,也可以是,所述冗余化处理部还在所述判定部确认到访问失败的储存器的所述通信路径的构成类别表示不可能暂时切断的连接方式的情况下,立即使用除了该储存器之外的其余的储存器进行冗余化。
通过此构成,阵列管理装置在与访问失败的储存器为不可能暂时切断的连接方式时,直接进行再冗余化。在不可能暂时切断的连接方式中访问失败时,相比较于暂时的故障,发生了物理故障、例如储存器破损的可能性更高,因此,通过立即进行再冗余化,能够取得迅速的对应。
(5)此处,也可以是,所述存储部还存储有关所述多个储存器各自是否受到数据保护的信息,所述导出部还对于确认访问失败的储存器,在所述存储部存储的与该储存器对应的信息表示没有受到数据保护的情况下,以比表示受到数据保护时的所述待机时间短的方式进行所述导出,并且在与该储存器对应的信息表示受到数据保护的情况下,以比表示没有受到数据保护时的所述待机时间长的方式进行所述导出。
根据此构成,阵列管理装置在访问失败的储存器受到数据保护的情况下,使其待机时间与没有受到数据保护的情况相比为更长的时间。通常,受到数据保护的储存器与没有受到数据保护的储存器相比破损的可能性要低。因此,访问失败是暂时的故障的可能性高,因此,通过使待机时间比LAN的情况下的待机时间长,能够期待从该暂时的故障的自动恢复。
(6)此处,也可以是,所述阵列管理装置还具有:请求受理部,受理来自外部的访问请求;以及暂时写入部,对于除了访问失败的储存器之外的其余的储存器,进行应该写入到访问失败的储存器的数据的写入,所述请求受理部受理来自外部的数据的写入请求,从所述多个储存器中选择进行写入的几个储存器,所述冗余化处理部还在所述判定部确认到对所述几个储存器中的某个储存器的访问失败的情况下,在经过由所述导出部导出的所述待机时间的期间,由所述暂时写入部进行数据的写入,在经过所述待机时间后,使用除了访问失败的储存器之外的其余的储存器进行冗余化。
通过此构成,阵列管理装置在经过待机时间为止的期间,将应该写入到访问失败的储存器中的数据写入到除了访问失败的储存器之外的其它的储存器,因此,不会使没有处理的数据量增加。例如,将写入对象的数据保存在缓冲器中时,能够防止缓冲器的溢出。
(7)此处,也可以是,所述判定部由监视所述通信路径上有没有发生故障的通信路径状态监视部和关于所 述多个储存器分别监视该储存器有没有发生故障的储存器状态监视部构成,所述通信路径状态监视部对所述多个储存器分别发送应答请求,在没有接收到对发送的所述应答要请求的应答的情况下,判断为访问失败,所述储存器状态监视部对所述多个储存器各自判断为发生了储存器破损的情况下,判断为访问失败。
通过此构成,阵列管理装置能够通过通信路径状态监视部和储存器状态监视部,分别监视有没有发生通信路径上的故障以及储存器故障。
(8)此处,也可以是,所述存储部将表示是否接收到来自对应的储存器的所述应答的无应答标志与对所述多个储存器各自的所述构成类别建立对应而存储,此外,所述存储部对于所述多个储存器分别存储表示有没有发生储存器故障的破损标志,所述通信路径状态监视部在没有接收到应答的情况下,对对应的储存器的无应答标志设定表示没有接收到该应答的值,所述储存器状态监视部在发生了储存器破损的情况下,对对应的储存器的破损标志设定表示发生了破损的值,所述冗余化处理部由监视由所述多个储存器构成的阵列结构的状态的阵列状态监视部和执行冗余化的冗余化执行部构成,所述阵列状态监视部在无应答标志的值表示没有接收到应答的情况下,在经过由所述导出部针对对应的储存器导出的所述待机时间为止的期间中没有从该储存器接收到应答时,判断为进行冗余化,在破损标志的值表示发生了破损的情况下,判断为立即进行冗余化。根据此构成,阵列管理装置通过使用无应答标志以及破损标志,能够容易地判断有没有发生故障。(9)此处,也可以是,所述阵列管理装置还具有在访问失败的储存器已复原的情况下,进行将由所述暂时写入部对其它的储存器写入的数据写入到已复原的所述储存器的复原处理的复原处理执行部,所述阵列状态监视部在无应答标志的值表示没有接收到应答的情况下,在经过由所述导出部针对对应的储存器导出的所述待机时间为止的期间中从该储存器接收到应答时,控制成所述复原处理执行部进行所述复原处理。
通过此构成,阵列管理装置在由复原处理执行部进行故障复原后,能够向本来应该写入的储存器写入,不需要进行再冗余化就能够容易地管理数据。工业实用性本发明的阵列管理装置能够应用于对大容量数据进行管理的装置。例如,作为便携电话、便携音乐播放器、数码相机、数码摄像机等电池驱动的便携式显示终端、或电视机、数字视频记录机、汽车导航仪等高分辨率的信息显示设备中的菜单显示、网络浏览器、编辑器、EPG、地图显示等进行显示的装置具有很高的利用价值。符号说明I 阵列管理系统2 因特网10 数字记录机11 15、11A 储存器装置100、100A 阵列管理装置101、IOlA 网络状态监视部102U02A 储存器状态监视部103 管理信息存储部104U04A 阵列状态监视部105U05A 冗余化仿真决定部106 处理部107 请求受理部108 通信部110、IlOA 冗余化执行部111、IllA 数据处理执行部112U12A 复原处理执行部201 存储部202 处理部
203、203A 储存器状态取得部204 通信部1000、2000 ROM1010,2010 CPU1020,2020 RAM1030 下位侧转送控制部1040 上位侧转送控制部2030 转送控制部2040、2050 大容量存储装置3000.3000A 阵列管理装置3001 存储部3002 判定部3003 导出部3004 冗余化处理部3005 请求受理部3006 暂时写入部3100,3101 ,3102 储存器装置
权利要求
1.一种阵列管理装置,将多个储存器冗余化,并控制对各储存器的访问,其特征在于,具有: 判定部,反复确认对所述多个储存器各自的访问成功还是失败; 存储部,存储向所述多个储存器各自的通信路径的构成类别; 导出部,基于所述存储部存储的所述通信路径的构成类别,导出从对所述储存器的访问失败起至执行冗余化为止的待机时间;以及 冗余化处理部,在由所述判定部确认到对所述多个储存器中的某个储存器的访问失败的情况下,在经过由所述导出部根据该储存器的所述通信路径的构成类别导出的所述待机时间为止的期间,通过所述判定部的再次的确认动作没有确认到对该储存器的访问成功时,使用除了该储存器之外的其余的储存器进行冗余化。
2.如权利要求1所述的阵列管理装置,其特征在于, 所述导出部以所述通信路径的构成类别表示无线时的所述待机时间比所述通信路径的构成类别表示有线时的所述待机时间长的方式进行所述导出。
3.如权利要求1所述的阵列管理装置,其特征在于, 所述导出部以所述通信路径的构成类别表示因特网时的所述待机时间比所述通信路径的构成类别表示局域网时的所述待机时间长的方式进行所述导出。
4.如权利要求1所述的阵列管理装置,其特征在于, 所述冗余化处理部还在由所述判定部确认到访问失败的储存器的所述通信路径的构成类别表示不可能暂时切断的连接 方式的情况下,立即使用除了该储存器之外的其余的储存器进行冗余化。
5.如权利要求1所述的阵列管理装置,其特征在于, 所述存储部还存储有关所述多个储存器各自是否受到数据保护的信息; 所述导出部还针对确认到访问失败的储存器,在所述存储部中存储的与该储存器对应的信息表示没有受到数据保护时,以所述待机时间比表示受到数据保护时短的方式进行所述导出,并且在与该储存器对应的信息表示受到数据保护时,以所述待机时间比表示没有受到数据保护时长的方式进行所述导出。
6.如权利要求2至5的任一项所述的阵列管理装置,其特征在于, 所述阵列管理装置还具有: 请求受理部,受理来自外部的访问请求;以及 暂时写入部,对除了访问失败的储存器之外的其它储存器,进行应该写入到访问失败的储存器中的数据的写入; 所述请求受理部受理来自外部的数据写入请求,从所述多个储存器中选择几个进行写入的储存器; 所述冗余化处理部还在由所述判定部确认到对所述几个储存器中的某个储存器的访问失败的情况下,在经过由所述导出部导出的所述待机时间为止的期间,由所述暂时写入部进行数据的写入,在经过所述待机时间后,使用除了访问失败的储存器之外的其余的储存器进行冗余化。
7.如权利要求6所述的阵列管理装置,其特征在于, 所述判定部包括:通信路径状态监视部,监视通信路径上有没有发生故障;以及 储存器状态监视部,对所述多个储存器分别监视该储存器有没有发生故障; 所述通信路径状态监视部对所述多个储存器分别发送应答请求,在没有接收到对应于所发送的所述应答请求的应答的情况下,判断为访问失败; 所述储存器状态监视部在对所述多个储存器分别判断为发生了储存器的破损的情况下,判断为访问失败。
8.如权利要求7所述的阵列管理装置,其特征在于, 所述存储部将无应答标志与针对所述多个储存器各自的所述构成类别建立对应而存储,所述无应答标志表示是否接收到来自对应的储存器的所述应答; 所述存储部还针对所述多个储存器分别存储表示有没有发生储存器故障的破损标志; 所述通信路径状态监视部在没有接收到应答的情况下,对对应的储存器的无应答标志设定表示没有接收到该应答的值; 所述储存器状态监视部在发生了储存器破损的情况下,对对应的储存器的破损标志设定表示发生了破损的值; 所述冗余化处理部包括: 阵列状态监视部,监视由所述多个储存器构成的阵列结构的状态;以及 冗余化执行部,执行冗余化; 所述阵列状态监视部在无应答标志的值表示没有接收到应答的情况下,在经过由所述导出部针对对应的储存器导出的所述待机时间为止的期间没有从该储存器接收到应答时,判断为进行冗余化,并且在破损标志的值表示发生了破损的情况下,判断为立即进行冗余化。
9.如权利要求8所述的阵列管理装置,其特征在于, 所述阵列管理装置还具有复原处理执行部,该复原处理执行部在访问失败的储存器已复原的情况下,进行将由所述暂时写入部写入到其它储存器中的数据写入到复原后的所述储存器的复原处理; 所述阵列状态监视部在无应答标志的值表示没有接收到应答的情况下,在经过由所述导出部针对对应的储存器导出的所述待机时间为止的期间从该储存器接收到应答时,控制成所述复原处理执行部进行所述复原处理。
10.一种阵列管理方法,其是阵列管理装置的阵列管理方法,该阵列管理装置具有存储向多个储存器各自的通信路径的构成类别的存储部、判定部、导出部以及冗余化处理部,将所述多个储存器冗余化,并且控制对各储存器的访问,所述阵列管理方法的特征在于,包括: 确认步骤,所述判定部反复确认对所述多个储存器各自的访问成功还是失败; 第I判断步骤,所述判定部判断通过所述确认步骤是否确认到对所述多个储存器中的某个储存器的访问失败; 导出步骤,在通过所述第I判断步骤判断为确认到对所述多个储存器中的某个储存器的访问失败的情况下,所述导出部基于所述存储部中存储的与该储存器对应的所述通信路径的构成类别,导出从对该储存器的访问失败起至执行冗余化为止的待机时间;第2判断步骤,在通过所述第I判断步骤判断为确认到对所述多个储存器中的某个储存器的访问失败的情况下,所述冗余化处理部判断是否经过了由所述导出步骤根据该储存器的所述通信路径的构成类别导出的所述待机时间;以及 冗余化执行步骤,所述判定部确认在所述待机时间内对由所述确认步骤确认到访问失败的储存器的访问成功还是失败,并且判断通过所述第I判断步骤是否确认到对由所述确认步骤确认到访问失败的储存器的访问成功,在没有确认到对确认到访问失败的储存器的访问成功的情况下,所述冗余化处理部使用除了该储存器之外的其余的储存器进行冗余化。
11.一种集成电路,其是阵列管理装置的集成电路,该阵列管理装置具有存储向多个储存器各自的通信路径的构成类别的存储部,将所述多个储存器冗余化,并且控制对各储存器的访问,所述集成电路的特征在于,具有: 判定部,反复确认对多个储存器各自的访问成功还是失败; 导出部,基于所述存储部中存储的所述通信路径的构成类别,导出从对所述储存器的访问失败起至执行冗余化为止的待机时间;以及 冗余化处理部,在通过所述判定步骤确认到对所述多个储存器中的某个储存器的访问失败的情况下,在经过由所述导出步骤根据该储存器的所述通信路径的构成类别导出的所述待机时间为止的期间,通过所述判定步骤 的再次的确认动作没有确认到对该储存器的访问成功时,使用除了该储存器之外的其余的储存器进行冗余化。
全文摘要
本发明目的在于提供一种能够根据通信路径的构成类别变更执行再冗余化的判断基准的阵列管理装置。将多个储存器冗余化、并且控制对各储存器的访问的阵列管理装置存储向所述多个储存器各自的通信路径的构成类别,反复确认对所述多个储存器各自的访问成功还是失败,在通过该确认而确认到对一个储存器的访问失败的情况下,根据该一个储存器的通信路径的构成类别导出从对该一个储存器的访问失败开始到执行冗余化为止的待机时间,在经过导出的所述待机时间为止的时期间,如果通过再次的确认动作没有确认到对该一个储存器的访问成功,则使用除了该一个储存器之外的其它的储存器进行冗余化。
文档编号G06F3/06GK103250127SQ201180054920
公开日2013年8月14日 申请日期2011年10月18日 优先权日2010年12月15日
发明者寺田吉希, 大坪绍二, 广濑胜彦 申请人:松下电器产业株式会社