一种利用xbrl进行的企业数据存储的方法

文档序号:6567223阅读:253来源:国知局
专利名称:一种利用xbrl进行的企业数据存储的方法
技术领域
本发明涉及企业数据如会计报表等的处理方法,特别涉及一种利用 XBRL(extensible Business Reporting Language,可扩展商业报告语言)进行企业数据存储的方法。
背景技术
XBRL (eXtensilie Business Reporting Language,可扩展商业 艮告语言)技术的推广离不开存储技术的支持,如果XBRL数据存储安全性低下、存取效率不高,也会影响 XBRL技术的推广和发展。目前对XBRL的应用采用的存储方式大致可以分为三种,分别是1)存储于文件系统中;2) BLOB (Binary Large Ob ject,二进制大对象)方式存储于关系型数据库中;3)存储于原生XML(extensible Markup Language,可扩展标记语言)数据库中。一、存储于文件系统中XBRL文档以最简单的方式一文件的形式直接存储在计算机的文件系统中。XBRL 实例文档同XML文档一样,也是自描述文档,也可以当成数据存储方式来存储数据。在这个过程中,可以把XBRL分类模式看成是数据库的模式设计,XQuery (XML Query Language,XML 查询语言)可以看成数据库中的查询语言,DOM(Document Object Model,文档对象模型) 或者SAX (Simple API for XML,用于可扩展标记语言的简易访问接口 )可以看成是数据库的数据处理工具,但是它还缺少一些数据库所必需的功能,如有效的存储组织、索引、安全性管理、事务管理、数据完整性管理、触发器和多用户处理机制等。如果数据量不很大,用户数较少、性能要求不高的情况下,完全可以把XBRL文档当成数据库,直接存储于文件系统中;一旦所需要的性能比较高时,这种方式就不能胜任了。这种存储方式特点的好处是数据没有经过处理,不会产生数据失真,内部的网状关联关系和多维描述得到了完全的保留,结构信息不会丢失。但是它的缺点也很明显,在面对大量的XBRL文档时,文档系统无法对文档提供足够的安全性和完整性保护;使用文件系统存储,虽然在查询一个XBRL实例文档内的数据时,可以很容易对该文件解析来查找数据,但是在横向查找若干实例文档中的同一数据时,会需要把所有的实例文档都读入内存, 然后查找对象数据,这大大影响了数据查询的速度,很大程度上无法满足业务的需要。二、存储于关系型数据库中关系型数据库作为现今发展最成熟的数据库,在市场上占有着压倒性的份额。用关系型数据库来存储XBRL文档,可以很方便地把XBRL数据存储于公司现有数据库中,并且还可以重用关系数据库相关应用程序,降低企业应用XBRL时的成本,企业也比较容易接受。如果用关系型数据库存储XBRL文档,把XBRL文档整体看成BLOB字段,存储到关系型数据库中。这种存储方式比较适合于目前我国的XBRL发展阶段,目前XBRL在国内的应用领域主要是上市公司和基金的信息披露,而对于其它的需求考虑较少,采用BLOB方式存储入关系型数据库是一种比较理想的方式主要原因有以下三点1)由于报告的数据量不大,使用BLOB形式的关系型数据库的方式可以很容易取出XBRL实例文档进行解析,查询方便,容易保证数据的完整一致性。2)这类公司使用XBRL数据的主要目的是生成财务报告和披露报告,而不是经常查询该报告中的某一项数据,在生成报告时,可以直接把XBRL数据读入内存,通过 XSLT(Extensibl θ Stylesheet Language Transformations,^^^5^ ^ ! s )或者自定义的XBRL展示工具生成财务报告或信息披露报告。3)现今企业大多数的数据存储方式为关系型数据库,采用或BLOB形式关系型数据库的方式存储XBRL数据对企业的成本较小;而采用原生XML数据库需要重新构建原生 XML数据库,需要花费较大的成本。把XBRL实例文档以BLOB的方式存储于关系型数据库的方法有些类似于以直接存储于文件系统中,区别是保证了 XBRL数据的安全性和一致性。它的缺点也是十分明显,此种方式没有对文档内部标识及元素值进行区分,所以难于直接在数据库中对文档内部元素值进行查询、分析等工作。使用该XBRL文档时,需要首先把XBRL文档抽取出来进行解析, 方可进行下一步的分析查询工作,在大数据量时无法满足性能要求。三、存储于原生XML数据库中原生XML数据库是专门为了存储XML文档而设计,随着上世纪末的XML技术的兴起,XML文档大量出现,以数据库方式实现XML数据的有效管理和快速精确的查询已经成为重要的存储需求。在传统数据库厂商纷纷支持XML的同时,原生XML数据库出现了,并且成为一种重要的数据库类型。原生XML数据库定义如下1)为XML文档定义了一个逻辑模型,并且根据模型对XML文档进行存储和检索;2)把XML文档作为其基本的存储单元,就像关系数据库在一个表中把行作为其基本存储单元(在逻辑概念上);3)不需要由任何特殊的底层物理存储模型。它可以建立在关系、层次、或者面向对象的数据库之上。上述定义表明了原生XML数据库是为了存储和检索XML文档的所有组成部分(包括元素、属性、模式、实体、URI (Universal Resource Identifier,通用资源标志符)等)而设计的,适合XML数据的层次结构,它直接对XML文档进行导入和取出,没有分拆过程,完全记录元素属性、嵌套以及顺序,同时可以通过模式文件对XML文档进行验证。在原生XML数据库中,存入取出过程是直接对整个XML文档进行操作,相比采用拆分方式存储XML文件而言,原生XML数据库没有XML模式映像成表的过程,也没有数据组织为XML文档的过程,存储速度快,而且不会造成数据的失真。它不同于关系型数据库存储时的平面结构,它可以存储XML中的层级信息,可以存储多级嵌套和多值元素;对于XBRL实例文档来说,原生XML数据库没有破坏文档内部的关联关系,对文档内的多维关系也完全存入数据库。原生XML数据库也有一些比较明显的缺点。它缺少关系型数据库那样完善的关系理论作为理论基础,原生XML数据库还不是十分成熟,功能性没有关系型数据库那么完备, 也没有像关系型数据库那么多的相关软件来支持。把XBRL实例文档存储在原生XML数据库当中,当需要横向在一组XBRL实例文档中查询同一项数据时,需要把这些XBRL实例文档都进行操作,进而导致查询大量的XML树,耗用大量I/O anput/Output,输入输出),查询速度比较慢。四、三种存储方案对比分析对该3种存储方式从若干角度作性能的对比分析。如下表1所示,文件系统的方式无法保证文档的安全性和一致性,但是对XBRL实例文档内部所含的数据信息和层级信息保存完好,虽然没有造成数据失真,但是不利于数据的进一步分析挖掘,难于直接导入数据挖掘工具中生成有用信息;采用BLOB方式的关系型数据库的方式存储,基本上和采用文件系统方式进行存储相类似,但这种方式保证了文档的安全性和一致性,损失了文档及文档间的查询性能,是一种“受了保护”的文件系统存储;采用原生XML数据库存储完好保护了 XBRL文档内的数据含义,并且对XBRL文档的存取速度快,但在文档间的横向查询速度较慢,不适合于频繁的数据对比分析的场合适用;表1. XBRL数据存储方式的对比
权利要求
1.一种利用XBRL进行的企业数据存储的方法,其特征在于包括以下步骤 步骤A 将企业数据分别填入如下表格中基础分类标准表{DBID,名称,原始内容,生效时间,备注}; 基础模式文件表{DBID,分类标准DBID,名称空间,文件名称,是否入口文件}; 基础标签信息表{DBID,元素DBID,元素标签值,标签语言,标签类型); 基础展示信息表(DBID,元素DBID,父元素DBID,序号,优先标签,角色}; 基础计算信息表{DBID,元素DBID,父元素DBID,序号,权重,角色}; 基础参考信息表{DBID,元素DBID,发行人、名称、编号、发行日期、卷、文章、节、子节、 段、分段、条款、子条款,附录、样例、页、展示、注脚、句子、通用资源识别符、通用资源识别符数};基础定义信息表{DBID,元素DBID,父元素DBID,序号,弧角色,角色}; 扩展模式文件表{DBID,实例文档DBID,分类标准DBID,名称空间,文件名称,是否入口文件};扩展标签信息表{DBID,实例文档DBID,元素DBID,扩展元素DBID,元素标签值,标签语言,标签类型};扩展展示信息表{DBID,实例文档DBID,元素DBID,扩展元素DBID,父元素DBID,扩展父元素DBID,顺序,优先标签,角色};扩展计算信息表{DBID,实例文档DBID,元素DBID,扩展元素DBID,父元素DBID,扩展父元素DBID,order,权重,角色};扩展参考信息表{DBID,实例文档DBID,扩展元素DBID,发行人、名称、编号、发行日期、 卷、文章、节、子节、段、分段、条款、子条款,附录、样例、页、展示、注脚、句子、通用资源识别符、通用资源识别符数};扩展定义信息表{DBID,实例文档DBID,元素DBID,扩展元素DBID,父元素DBID,扩展父元素DBID,序号,弧角色,角色};实例文档表{DBID,分类标准DBID,文档名称,报告主体,报告年度,报告原始内容};上下文表{DBID,实例文档DBID,上下文ID,开始时间,结束时间);Segment表(DBID,上下文DBID,段名,段值};Scenario ^ {DBID,上下文DBID,场景名,场景值};单位表{DBID,实例文档DBID,单位ID,单位值};数据项表{DBID,元素名称,元素名称空间,上下文DBID,单位DBID,数据值,小数位,精度,脚注};步骤B 按照以下顺序存储以上表格;存储基础分类标准表;存储基础模式文件表;存储基础链接库表;存储实例文档表;存储报告中的扩展分类标准文件;存储实例文档。
2.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于在所述的基础模式文件表中还包括基础元素表{DBID,模式文件DBID,元素名称,名称空间,元素id,替代组,借贷标识,数据类型,是否为空,是否抽象,时间类型,父元组DBID,在父元组内的序号};基础元素元组关系表{元组DBID,元素DBID,元组内序号,元素最大出现次数,元素最小出现次数};基础链接库表{DBID,模式文件DBID,链接库文件名,链接库类型}。
3.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于在所述的扩展模式文件表中还包括扩展元素表{DBID,扩展模式文件DBID,元素名称,名称空间,元素id,替代组,借贷标识,数据类型,是否为空,是否抽象,时间类型,扩展父元组DBID,在扩展父元组内的序号}; 扩展元素元组关系表{扩展元组DBID,扩展元素DBID,扩展元组内序号,元素最大出现次数,元素最小出现次数};扩展链接库表{DBID,扩展模式文件DBID,链接库文件名,链接库类型}。
4.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于保存分类标准表的步骤中存储基础分类标准时,在基础分类标准表中记录指定分类标准的名称,生效时间和备注,同时把基础分类标准包存入到原始内容字段中。
5.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于存储基础模式文件表步骤中存储基础模式文件与对应的链接库关系信息; 存储基础元素和元组,并存储元组和元素之间的关系。
6.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于存储基础链接库表步骤中,包括存储标签库文件并把相应的信息存放到基础标签信息表中; 存储展示库文件并把相应的信息存放到基础展示信息表中; 存储计算库文件并把相应的信息存放到基础计算信息表中; 存储参考库文件并把相应的记录信息存放到基础参考信息表中; 存储定义库文件并把相应的记录信息存放到基础定义信息表中。
7.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于存储实例文档表时,把指定相应的分类标准DBID、实例文档名称、报告主体、报告年度存放到相应的字段中,其中分类标准DBID根据分类标准名称在基础分类标准表查找得到,同时把存储实例文档存到报告原始内容字段中。
8.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于存储报告中的扩展分类标准文件步骤中存储扩展模式文件并把相应信息存入扩展模式文件表中;存储扩展模式文件中的元素和元组时,把元素和元组都存入到扩展元素表中;扩展元组和扩展元素之间的多对多关联关系通过扩展元素元组关系表来记录;扩展模式文件中的链接库信息存入扩展链接库表中;存储扩展标签库文件并把相应的记录信息存放到扩展标签信息表中;存储扩展展示库文件并把相应的记录信息存放到扩展展示信息表中; 存储扩展计算库文件并把相应的记录信息存放到扩展计算信息表中; 存储扩展参考库文件并把相应的记录信息存放到扩展参考信息表中; 存储扩展定义库文件并把相应的记录信息存放到扩展定义信息表中。
9.根据权利要求1所述的一种利用XBRL进行的企业数据存储的方法,其特征在于存储实例文档步骤中存储实例文档上下文信息到上下文表中; 存储上下文中的kgment信息到kgment表中; 存储上下文中的kenario信息到kenario表中; 存储实例文档单位信息到单位表中; 存储数据项信息到数据项表中。
全文摘要
本发明公开了一种对企业XBRL数据进行存储处理的方法。本方法结合XBRL技术体系,对XBRL分类标准和实例文档进行必要的分解,将XBRL数据之间的层次关系、弧关系、引用关系和链接关系等转化成适于SQL查询的关系,充分利用关系型数据库的优点;高效的数据查询能力,适合海量的数据查询,支持单个数据项的查询和整张表数据的查询;从XBRL的模式文件和链接库文件出发,可以真实还原模式文件和链接库文件关系的数据存储模型;吸取原生XML存储的优点存储XBRL文件,保证了XBRL文档的原貌,提高了生成和备份本地文件的效率,便于分类标准的备份和版本控制。
文档编号G06Q10/00GK102314647SQ201110301700
公开日2012年1月11日 申请日期2011年9月29日 优先权日2011年9月29日
发明者唐会天, 曾煜, 王琳, 芮庆忠, 董凤江, 陈宇 申请人:广州中浩控制技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1