专利名称:用于实现公共描述符格式的系统和方法
技术领域:
本发明通常涉及计算机系统和信息处理系统,尤其涉及不考虑存储介质的用于实现用于存储数据格式的公共描述符格式(commondescriptor format)的系统和方法。
背景技术:
由于信息的价值和使用持续增长,个人和企业都在寻找对信息进行处理和存储的其他方式。一种对于用户有用的可选项是信息处理系统。信息处理系统通常对信息或数据进行处理、编辑、存储和/或传递,用于企业、个人或其他目的,从而使用户对信息的价值加以利用。由于技术和信息处理对于不同的用户或应用有不同的需要和要求,所以信息处理系统还可以对以下情况进行不同的对待,即,被处理的信息是什么,信息是怎样被处理的,有多少信息被处理、存储或传递,以及信息可以被处理、存储或传递得多么快速和有效。信息处理系统的变化使得信息处理系统可以是通用的,或被配置用于特殊用户或例如财政事物处理、航班预约、企业数据存储或全球通讯的特殊使用。此外,信息处理系统可以包括多个硬件和软件组件,其可以被配置成对信息进行处理、存储和传递,还可以包括一个或多个计算机系统、数据存储系统和网络系统。
信息处理系统可以包括存储器系统或用于管理活动(active)数据的存储网络。信息处理系统的用户可能想为建档或者备份目的、或者为更多的活动数据在存储系统上腾出空间而创建该活动数据的备份。某些工业中新的规章制度要求用户保存他们的数据档案10年、20年甚至50年。而且,许多组织对于保存长期档案文件有非常规的原因。例如,医院可能需要保存医疗文件,例如为他们的病人终生保存计算机化X射线轴向分层造影扫描(CAT扫描);石油公司可能要在他们不同的储备上保持地球物理学数据,希望将来的技术能够导致新的发现;政府可能需要保持个人记录,例如对于他们工作对象终生保持的出生证明。然而,如摩尔定律中所提出的,计算机工业对信息处理系统的持续发展导致了包括存储系统在内的许多技术从技术水平(state-of-the-art)到设备更新的迅速变化。一次公共(once common)介质格式随着软件更新、硬件替代、卖方支持期满和个人的改变而变得难以企及。通常,虽然数据存储在其上的介质可能有延长的保存期限,然而数据本身可能变得不可读。
使用数据的专有存储格式的存储器卖方实践只会恶化这个问题。当一些用户为了使他们的数据在当前系统上可读而变换原始存储器格式时,他们会将他们的备份数据移植到新的存储器系统。然而,即使是相同的卖主应用程序和相同的硬件,数据格式也会随着时间发生变化,迫使用户将他们的数据移植成新的数据格式。而且,为了与存储格式或者设备更新无关的问题,用户可能希望从一种卖方解决方案改变到另一种卖方解决方案,再次迫使用户承受最大限度数据移植的花费。这样移植的花费将仅随存储器系统的寿命而增加。用户可以被锁进单一的卖方存储程序,仅仅因为他们不想因为移植而投资金钱。假使他们选择的卖方停止商业或者不维持它的数据文件格式,当用户的硬件失败而他们旧的软件将不配合新的硬件工作时,他们会迷失方向而没有合理的解决方案。一些用户已采取保藏整个信息处理系统,包括硬件和软件组件,而其数据的拷贝确保至少一个这样的系统将能够在将来读取数据。这些行为是浪费金钱和时间,但是不这样,数据的复制拷贝可能由于当前的系统不能读取数据而被丢失。
发明内容
根据本发明,公开了一种不必考虑存储介质而实现用于存储数据格式的公共描述符格式的系统和方法。使用公共描述符格式的实例存储介质可以包括存储在存储介质上的数据、和与存储数据相关并存储在存储介质上的公共描述符。该公共描述符可以包括以标准格式存储的格式化信息。格式化信息可以充分描述数据是怎样被格式化的。用于在使用了公共描述符格式的存储介质上写数据的示例性方法可以包括在存储介质上写公共描述符的步骤以及以公共描述符格式描述的格式写数据的步骤。在使用公共描述符格式的存储介质上读取数据的方法的一个实施例包括在存储介质上读取公共描述符的步骤和使用数据怎样被格式化成公共描述符、以读取数据的描述步骤。
这里描述的系统和方法技术上讲是有益的,因为它提供了一种系统和方法,通过这种系统和方法可以使用公共描述符中的格式化信息读取数据,而不考虑数据格式,芯片组,操作系统,存储介质或者卖方。因为这个技术优势,以过时的或者不合需要的格式存储的数据可以通过由卖方制造的当前程序访问,并在合适的位置读取,而不需要昂贵的移植。因此,虽然来自第一卖方的第一程序可以生成用于存储数据的数据格式,但是来自第二卖方的第二程序可以使用公共描述符中的公共描述符格式化信息来确定怎样读取存储的数据。结果,用户可以持续访问其存储介质中的存储数据,即使他们后来对他们的系统做了重要改变,例如安装了新的硬件或者新的操作系统软件,也能够访问他们的存储数据。同样,用户可以不将他们的数据移植到新的文件格式而从一个存储器卖方解决方案转换到另一个存储器卖方解决方案。因此,用户不但可以在他们存储系统的有形资产中保存他们的投资,还可以避免与大规模数据迁移有关所导致的花费。
通过结合附图参考下面的描述,可以获得对本发明及其优点的更加完整的理解,其中,同样的附图标记表示同样的特征,其中图1是示例性存储系统的框图;图2是示例性描述符文件和示例性数据文件的框图;图3是示例性描述符文件的框图;图4示出了用于生成描述符文件和相关的数据文件的示例性方法的流程图;图5示出了用于读取描述符文件和相关数据文件的示例性方法的流程图。
具体实施例方式
作为本次公开的目的,信息处理系统可以包括可操作地进行计算、分类、处理、传输、接收、恢复、产生、转换、存储、显示、表明、检测、纪录、复制、处理的任何手段(instrumentalities)或手段的集合体,或可以利用任何形式的信息、智力或用于企业、科学、控制或其他目的的数据。例如,信息处理系统可以是个人计算机、网络存储装置或任何其他合适的装置,并可以在容量、形状、性能、功能性和价格上不同。信息处理系统可以包括随机存取存储器(RAM),一个或多个例如中央处理单元(CPU)或硬件或软件控制逻辑的处理资源,只读存储器(ROM)和/或其他类型的非易失性存储器。信息处理系统的其他组件可以包括一个或多个盘驱动器,用于与外设进行通讯的一个或多个网络端口,以及例如键盘、鼠标和视频显示器的多个输入和输出(I/O)装置。信息处理系统还可以包括在多个硬件组件之间可操作地传输通讯(transmit communications)的一条或多条总线。
公共描述符格式,或者“CDF”可以用于通知存储系统的用户怎样读取存储的数据,该存储系统可以是信息处理系统的组件。在一些情况下,公共描述符可以被嵌入数据文件或者数据流。因此,如图1所示,具有驱动器12的存储系统10可以存储具有嵌入式公共描述符的数据14。例如,嵌入的公共描述符可以是数据开始的报头(header)。在其它情况下,特殊的数据文件可能与公共描述符文件相关,以便用户可以确定存储在单一存储介质中的多种格式的多种文件的格式。公共描述符因此可以驻留在包含相关数据的存储介质上。所以,图1中所示的示例性存储系统10具有存储了三个公共描述符文件40、50和60的两个驱动器20和30;每个公共描述符文件具有相关的数据文件,分别标记为45、55和65。出于该实例的目的,存储系统10只包括三个驱动器,其可以是硬盘驱动器、可移动介质驱动器或者任意其它存储硬件,但是由本发明受益的本领域技术人员将意识到,存储系统10可以包括任意数量的硬件组件。同样,存储系统10可以包括具有存储服务器或者其它基于网络的硬件组件的存储网络。存储系统10包括任意数量的具有嵌入式公共描述符或者数据的数据文件以及公共描述符文件对,也是受益于本发明的本领域技术人员将知道的。
公共描述符的格式,例如,描述符文件40将优选在整个计算工业中被标准化,以允许终端用户使用不同于初始存储数据的程序的软件程序访问数据。然而,公共描述符格式对于与任何公共描述符相关的数据不实行标准格式。而是,为了描述数据格式的协议子集(profile)存在,标准格式可以允许公共方法。优选地,示例性描述符文件40是可扩展标记语言(“XML”),以便特殊的应用程序接口(“API”)不必读取描述符文件40。
公共描述符格式基本允许存储文件格式和存储卖方之间的互操作性(interoperability)的基本水平。公共描述符格式将不排除数据分配的所有权(proprietary)方法,但是使任意兼容软件或者控制器卖方能够访问描述了相关数据的结构的公共描述符。该结构可能是卖方插件,假如卖方将其数据结构视为所有权或者竞争优势的话。
图2示出了实例公共描述符文件40的内容,其与数据文件45相关。然而,公共描述符仍旧可以嵌入存储数据,如图1示出的驱动器12。公共描述符文件40和数据文件45可以将文件格式作为名字,例如“Arc.fil.sddf”作为公共描述符文件40和“Arc.fil”作为数据文件45。存储系统产业优选同意将公共描述符文件放置在每个介质中相同的位置,例如在第一字节处。公共描述符文件40可以包括一组公共描述符元件46和一组卖方指定(vendor-specific)格式化元件47。公共描述符元件46的组可以包括需要去读取公共描述符文件的标准化信息和描述数据文件45的核心元件。核心元件可能需要去描述任意和所有的数据格式,如在本发明后面所讨论的那样。卖方指定格式化元件47的组将优选包括描述被讨论的特殊数据文件45的格式化的元件的集合。这些元件对每个卖方而言可能是唯一的,并且这些元件可以定义需要去读取由卖方使用的指定数据格式的结构。也就是说,卖方可以普遍使用公认的(accepted)动词和名词来描述数据格式,但是卖方可能将这些动词和名词组织起来以形成卖方指定的格式化信息,其描述对于卖方是唯一的数据格式。
图3示出了公共描述符文件40,具有公共描述符基于标准的元件46的组和卖方指定格式化元件47的组分成更多细节。公共描述符基于标准的元件46的子集可以包括列出了公共描述符长度的数据快50和包括其它公共描述符指定格式结构的数据快52,如果需要。公共描述符基于标准的元件46的子集也可以包括需要去描述数据文件45的核心元件,如上所述。因此,如图3中所示,公共描述符基于标准的元件46的子集也可以包括列出数据文件45长度的数据块53和说明日期数据文件45被产生的数据块54。公共描述符基于标准的元件46的子集也可以包括列出了与用于创建数据文件45的程序相关的卖方名的数据块55,列出程序名的数据块56,以及列出程序版本的数据块57。公共描述符基于标准的元件46的子集可以包括更多或更少的数据块,如受益于本发明的本领域技术人员将理解的那样。元件和这些子集的格式,其形成了公共描述符基于标准的元件46的组,将在计算产业中优选被标准化。该标准化将允许公共描述符文件的数据在卖方和程序中成为普遍可读的。
图3也示出了形成卖方指定格式化元件47的组的元件的细目分类(breakdown)。如在本发明前面所讨论的那样,卖方指定格式化的元件47的组的内容将随卖方不同而不同,虽然优选地,用于描述不同格式化元件的项将对所有卖方都是公共的。卖方指定格式化的元件47的组可以包括列出了用于写数据文件45的语言的数据块58、列出了用于数据文件45编码格式的数据块59、列出了用于数据文件45的加密格式的数据块60。图3中示出的元件不是可包括在卖方指定格式化的元件45的组中的可能元件的整个范围。而是,随着描述卖方指定数据格式的需要,卖方指定格式化的元件45的组可以包括更多或更少的元件。例如,一些卖方可能不加密他们的数据,因此在他们的卖方指定格式化的元件45的组中可能不需要数据块60。同样,一些卖方可以想包括图3中未示出的另外的数据块,其列出了与数据文件45相关的任意编辑信息。如受益于本发明的本领域技术人员将意识到的那样,全部公共描述符文件40可能包括更多或更少的信息,只要足够的信息保存在公共描述符文件,以决定怎样读取与公共描述符文件相关的数据文件,并且只要公共描述符文件40符合被计算产业所采取的任何标准化要求。此外,公共描述符也可以嵌入存储的数据,而不是作为与数据文件相关的分离文件被存储。
公共描述符格式可以在两个阶段中实现。第一个阶段将包括卖方识别和基本公共描述符格式的创建。在第二个阶段中,卖方将把将生成公共描述符的插件并入他们的存储系统,允许卖方互操作性。一旦两个阶段完成,终端用户可以使用类似于图4中示出的流程图所描述的方法创建具有公共描述符的数据。写过程开始于流程图的块70。可以是任何写存储(storage-writing)应用程序的用于写数据的卖方应用程序将首次写入用于公共描述符的基于标准的元件的子集的内容,如块71所示。卖方应用程序将接着写入公共描述符的卖方指定格式化的元件组的内容,如块73中所示。如块74中所示,卖方应用程序将接着以在新的写公共描述符中描述的格式写入数据。在这点上,卖方应用程序将完成写公共描述符和数据,如终止块75中所示。
图5示出了用于读取存储数据的方法的流程图。可以与用于写数据的程序相同或不同的卖方应用程序将在图5中示出的块80处开始读取过程。卖方应用程序将首次读取基于标准的元件的子集,如块81所示。这些元件可以告诉卖方应用程序描述符文件的位置。此外,基于标准的元件的子集优选与所有数据位于相同的位置。在块83中,卖方应用程序将读取卖方指定格式化的元件的组,其将接着详细描述数据的格式,如本发明前面所述的那样。使用由读取这些元件所知的信息,卖方应用程序将问其本身是否可以读取以公共描述符描述的格式写入的数据,如块84中所示。假如答案是“是”,则卖方应用程序将使用来自公共描述符的格式信息,以引导其读取数据,如图5的流程图的块87所示。在这点上,卖方应用程序将到达终止块88并终止读取数据。假如卖方应用程序不能读取数据,则卖方应用程序将通知用户需要新的应用程序,如块85中所示。此时,用户必需转换到新的卖方应用程序来读取数据,如块86中所示。这个新的应用程序将在块81开始再次读取过程,如图5中所示。
这里已经参考公共描述符文件对和数据文件对实现公共描述符格式的示例性系统和方法进行了描述,其中公共描述符被嵌入数据,但是应当认识到,单一的公共描述符文件能够用于每个单独的存储磁盘或者单个存储介质,无论磁盘或者介质上的数据文件的数量。例如,该公共描述符文件可以为卖方描述对于每个数据文件具有标准化的长度、语言和位置的普通的文件格式。然后,在特殊磁盘或者介质上的每个数据文件符合包括在磁盘、全息介质、存储器或者其它存储介质上的公共描述符格式。在用于实现公共描述符格式的本系统和方法的实例中,每个磁盘都需要特殊的公共描述符文件。虽然已经对本发明进行了详细描述,应当理解,在不偏离本发明所附的权利要求的精神和范围的情况下可以对发明进行多种改变、替换和变更。
权利要求
1.一种使用公共描述符格式的存储介质,包括存储在该存储介质上的数据,和与所存储数据相关并存储在该存储介质上的公共描述符,其中,该公共描述符包括以标准化格式存储的格式化信息,而其中,该格式化信息充分描述了所存储的数据怎样被格式化。
2.根据权利要求1所述的使用公共描述符格式的存储介质,其中数据作为数据文件存储在该存储介质上,和与所存储数据相关的该公共描述符作为与数据文件相关的单独公共描述符文件被存储。
3.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符被嵌入在数据中。
4.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符用可扩展标记语言写入。
5.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述公共描述符怎样被格式化的一组标准化元件。
6.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述用于数据的卖方指定格式化特征的一组卖方指定的元件。
7.根据权利要求6所述的使用公共描述符格式的存储介质,其中,该组卖方指定元件使用标准化项描述用于数据的卖方指定格式化的特征。
8.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述公共描述符是多长的数据块。
9.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述数据是多长的数据块。
10.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述数据何时被创建的数据块。
11.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述哪个软件卖方与数据相关的数据块。
12.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述哪个软件程序与数据相关的数据块。
13.根据权利要求12所述的使用公共描述符格式的存储介质,其中,该公共描述符包括描述哪个软件程序的版本与数据相关的数据块。
14.根据权利要求1所述的使用公共描述符格式的存储介质,其中,该公共描述符包括识别数据是否被加密的数据块。
15.用于在使用公共描述符格式的存储介质上写入数据的方法,包括以下步骤在存储介质上写入公共描述符,其中,该公共描述符包括足以描述数据怎样被格式化的标准化格式的格式化信息,和以在公共描述符中描述的格式写入数据。
16.根据权利要求15所述的在使用公共描述符格式的存储介质上写入数据的方法,其中,在存储介质上写入公共描述符的步骤包括为公共描述符写入一组基于标准的元件的步骤,其中,用于公共描述符的基于标准的元件包括描述公共描述符怎样被格式化的数据。
17.根据权利要求15所述的在使用公共描述符格式的存储介质上写入数据的方法,其中,在存储介质上写入公共描述符的步骤包括写入用于公共描述符的一组卖方指定格式化的元件的步骤,其中,卖方指定格式化的元件使用标准化项描述用于数据的卖方指定格式化的特征。
18.在使用公共描述符格式的存储介质上读取数据的方法,包括以下步骤在存储介质上读取公共描述符,其中,该公共描述符包括足以描述数据怎样被格式化的标准化格式的格式化信息,和使用数据怎样以公共描述符被格式化的描述来读取数据。
19.根据权利要求18所述的在使用公共描述符格式的存储介质上读取数据的方法,其中,在存储介质上读取公共描述符的步骤包括以下步骤读取基于标准的元件的子集,其中,基于标准的元件的子集描述了公共描述符怎样被格式化,和读取一组卖方指定格式化发元件,其中,该卖方指定格式化的元件使用标准化项描述用于数据的卖方指定格式化的特征。
20.根据权利要求18所述的在使用公共描述符格式的存储介质上读取数据的方法,进一步包括确定以在公共描述符中描述的格式写入的数据是否能够被读取的步骤。
全文摘要
公开了一种用于实现用于存储数据格式而不必考虑存储介质的公共描述符格式的系统和方法。使用公共描述符格式的示例性存储介质包括存储在存储介质上的数据和与所存储数据相关、并存储在存储介质上的公共描述符。公共描述符可以包括以标准化格式存储的格式化信息。格式化信息足以描述数据怎样被格式化。
文档编号G06F17/30GK1881217SQ20061009223
公开日2006年12月20日 申请日期2006年6月15日 优先权日2005年6月17日
发明者M·P·布里斯, W·邦珀斯 申请人:戴尔产品有限公司