本发明涉及电子档案存储领域,具体地说是一种基于电子档案属性的存储备份策略评价方法。
背景技术:
近年来,随着电子政务和企业信息化的大力推进,越来越多形态各异,种类繁多的电子文件随之产生,其中有保存价值的部分需要归档形成电子档案。电子档案已经成为各类档案机构的收集保管对象,对电子档案进行存储和备份也逐步成为档案机构的重要工作内容之一。
电子档案存储和备份的介质有磁盘、磁带、光盘等多种,不同的介质在存储容量、价格、访问速度、保存时间和管理复杂度上有很大不同。一般来讲,磁盘的容量较大、访问速度快,但价格高,保存时间短;磁带的容量大,价格低、保存时间较长,但是对保存环境要求高,访问速度慢,查询利用不便;光盘容量较小,保存时间长,访问速度较慢,管理复杂度高。此外,某些档案机构还采用缩微胶片作为电子档案的异质备份手段。
不同存储介质的特性适合不同的应用场景。考虑到电子档案存储和备份的复杂性,以及长时间保存过程中可能面临的技术风险,有必要考虑综合采用多种存储介质对电子档案进行存储备份,同时设置合适的备份策略,包括备份套数、备份周期和备份方式等。实践工作中,根据不同电子档案类型的属性,如保管期限、数据类别、数据量、访问频率、价值等因素,所采用的电子档案存储备份介质和备份策略也会体现出较大的差异。如频繁访问的电子档案,宜采用可快速访问的存储介质;保存时间长、数据量大的电子档案,需要充分考虑长期保存过程中介质的经济性;价值较高的电子档案,需要备份多套,并使用不同的介质降低技术风险等。
对于电子档案的存储备份策略,国内已有一定的研究,并发表了一些论文成果,如赵云澜、赵伟东、吴永涛的《档案馆海量数据存储备份策略》;杜琳琳的《海量数据离线存储系统研究》(《中国档案》,2016(2):62-63)等,同时经过专利检索,也有一些相关的专利,如《银行业务档案光盘脱机安全存储系统及存储方法》(申请号:CN201510479174.5,实质性审查阶段)。但这些论文和专利成果或者只研究具备某一类特性(如海量的、永久保存)的电子档案,或者只考虑某一种存储介质,没有综合考虑电子档案的多种属性,没有综合采用多种存储备份介质,缺少全面的策略设置指导。
技术实现要素:
本发明为解决现有的问题,旨在提供一种基于电子档案属性的存储备份策略评价方法。
本发明采用的技术方案包括:
步骤一,对电子档案的属性和备份策略进行赋值评分;
步骤二,利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;
步骤三,计算灰色关联度,对各备选方案进行排序。
其中,所述电子档案的属性包括密级属性和/或保管期限和/或文件大小和/或数据类别和/或访问频率和/或应急程度和/或价值。
其中,所述电子档案的备份策略包括介质选择和/或周期选择和/或方式选择和/或数据备份套数。
其中,所述步骤一进一步地包括:赋值评分完成后,对电子档案属性对应选择的备份策略建立评价打分表。
其中,利用灰色关联分析法(GRA)进一步地包括:首先对目标备份方案建立一个可比性序列,并确定最优的理想目标序列;然后计算各方案与理想最优目标序列的灰色关联系数;最后计算灰色关联度,对各备选方案进行排序。
本发明和现有技术相比具有如下优势:
(1)综合性:本发明综合考虑了电子档案存储备份策略的各项因素,充分发挥了磁盘、磁带、光盘和缩微等不同存储介质在电子档案存储备份中的优势,可根据电子档案的特性,对多种存储备份策略进行评估,从而对档案机构如何根据自身的电子档案特性选择合适的存储介质和存储备份策略提供了有意义的指导和参考。
(2)适应性:本发明可适应各种类型的电子档案存储备份策略的评估和选择。对于各类电子档案,本发明均可依据其特性,对其可能采用的各类存储备份策略进行评估,从而指导设计适合该类型电子档案的存储备份策略。
(3)客观性:对于电子档案存储备份策略,通过多种计算方法,消除主观评价时可能产生的偏差,从而达到客观评估的效果。
(4)指导性:本发明不仅可以用于对档案机构当前的电子档案存储备份策略进行评估,还可以通过评估过程指标的取值情况,说明当前策略在哪些方面存在需要改进的地方,从而指导档案机构对电子档案存储备份策略进行改进。
附图说明
图1为本发明一个实施例的流程图。
具体实施方式
现结合附图对本发明作进一步地说明。
参见图1,图1展示的是本发明的一个实施例,本实施例根据对电子档案的属性与其选择的存储备份策略之间适合程度的评分,利用灰色关联分析法对采集的评分数据进行分析,得出基于档案属性的多介质备份对策与措施,技术方案主要包括:
步骤一,对电子档案的属性和备份策略进行赋值评分;
步骤二,利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;
步骤三,计算灰色关联度,对各备选方案进行排序。
其中,其中进行分析的电子档案的属性包括:
密级属性:该属性表示档案的秘密程度,包括公开、限制、秘密、机密、绝密等;
保管期限:该属性表示档案的保管时间长度,包括永久、长期、短期,30年、10年等;
文件大小:该属性表示档案电子原文的容量大小;
数据类别:该属性表示档案电子原文的类别,有版式、文本、图像、图形、音频、视频、程序、超媒体、信息包等类别;
访问频率:该属性表示档案访问频率的高低,如高、中、低等;
应急程度:该属性表示档案需要访问时的紧急程度,如某些重要工程档案,可用于救灾、抢险,应急程度就比较高;
价值:该属性是对档案价值的评估,有一级、二级、三级等。
在备份策略上主要包括如下几个方面的策略:
介质选择:可选择磁盘、磁带、光盘和缩微等介质中的一种或多种组合;
周期选择:每周备份,或者按月、按季度、按年来备份;
方式选择:可选择全备份,全备份+增量备份,全备份+差分备份等备份方式。数据备份套数:可将电子档案数据备份一套、二套、三套或更多套。
为了得到最优的档案备份策略,前期可通过对电子档案属性对于相应存储备份策略的选择来进行打分。评分标准参考相对应的选择合适程度等级表:等级1表示该档案属性不适合采用这种备份策略;等级3表示该档案属性比较不适合采用这种备份策略;等级5表示该档案属性相对适合采用这种备份策略;等级7表示该档案属性比较适合采用这种备份策略;等级9表示该档案属性适合采用这种备份策略;2、4、6、8表示上述适合程度的中间值。
灰色关联分析法(GRA)通常被用来分析各个因素对于选择结果的影响程度,其基本思想是通过确定比较数据序列和最优理想参考数据序列之间的相似关联程度是否接近。
本实施例关于灰色关联分析法的分析步骤是:先通过赋值方式,对电子档案属性对应选择的备份策略建立评价打分表;然后利用灰色关联分析法(GRA)对基于电子档案属性下的备份策略进行数学建模分析:首先对目标备份方案建立一个可比性序列,并确定最优的理想目标序列;然后计算各方案与理想最优目标序列的灰色关联系数;最后计算灰色关联度,对各备选方案进行排序,为选出最佳的档案备份策略提供参考。
采用灰色关联度(GRA)分析的具体步骤如下:
(1)根据档案属性以及档案备份策略方案,确定原始评价矩阵及参考数列。档案备份策略由备份介质、备份周期、备份方式、备份套数等因素构成,各因素之间相对独立。这里我们以备份介质的选择为例,假设档案属性为n个,备份介质的选择方案为m种(其中包含多种介质的组合方案),我们用xij表示对第i个档案属性对应选择第j种策略的备份介质进行打分的评价值,该矩阵表示为然后我们对该矩阵进行标准化,构建标准化的决策矩阵,记标准化后的矩阵为其中
(2)生成参考向量X0′。
X0′=(x0′(1),x0′(2),...,x0′(n)),其中x0′(j)为第j个指标的最大值,表示为针对该档案某一属性选择的最优的理想介质组合方案的值。
(3)我们将第i个档案属性对应选择第j种备份介质组合方案进行打分的理想最优值与标准化的评估值进行相减,从而计算标准化后的序列与参考序列的差异度Δ0i(j):Δ0i(j)=|x0′(j)-x′ij|,并构建差异度矩阵:
(4)计算灰色关联系数r0i(j)
我们计算第i个比较序列Xi与第j个属性的关联度,用r0i(j)表示,显然r0i(j)的值越大,表示该属性对应选择这种介质组合方案的关联程度越高。灰色关联系数的计算公式为:(其中表示第i个比较序列Xi与第j个属性的关联度的最小值;表示第i个比较序列Xi与第j个属性的关联度的最大值;δ表示分辨系数,δ的取值越小,关联系数间的差异性越大,分辨能力越强,δ的取值为[0,1],本专利中我们取δ=0.5)。
(5)计算关联度
我们知道档案的不同属性对档案的介质组合方案选择影响情况不同,因此首先对档案各属性指标赋予权重W,W=(ω1,ω2,...,ωn),且满足为得到关联度,对各个介质组合方案分别计算其档案属性评价指标与参考序列对应元素的关联系数的均值,记为P,P=(p01,p02,...,p0m)T,其中p0i的值越大,表示档案的属性与选择这种介质组合方案的关联性越好,则越倾向于选择这种介质组合方案。
(6)选择最优备份策略
与备份介质组合方案的选择类似,采用灰色关联分析法可对备份周期、备份方式、备份套数等其他因素的选择进行建模分析。
我们用Pi表示不同备份策略下的关联度,用ψi表示评价该备份策略的权重,且满足针对某一特定档案的属性,灰色关联度的值越大则此选择越好,因此对每个因素的各个选择值进行评分和排序,最终灰色关联度的评估值为我们从各个因素中选择最优的组合备份策略,形成基于档案属性的最优备份策略推荐。
本实施例创新性地发明了一种新的综合评估方法,基于电子档案属性中与存储备份相关的多个属性,利用赋值评价法和灰色关联分析法,对采用多种存储介质的不同存储备份策略的进行了分析和评估,可适用于具有不同类型和特性的电子档案的存储备份策略的量化评估,突破了以往凭主观经验感性评估方法的局限性,从而对档案机构如何根据自身的电子档案特性选择合适的存储备份策略提供了有意义的指导和参考。
上面结合附图及实施例描述了本发明的实施方式,实施例给出的并不构成对本发明的限制,本领域内熟练的技术人员可依据需要做出调整,在所附权利要求的范围内做出各种变化或改动均在保护范围内。