一种中国历史典籍信息的空间集成方法
【技术领域】
[0001] 本发明属于计算机信息处理技术领域,特别涉及一种中国历史典籍信息的空间集 成方法。
【背景技术】
[0002] 随着计算机技术的发展,众多研宄机构、图书馆和信息技术公司纷纷对卷帙浩瀚、 包罗万象的中国历史典籍进行开发利用,建立了大量的历史典籍数据库和信息系统。例如: 台湾中研院的汉籍文献电子数据库、国家图书馆古籍资源库、北京大学等高校的中国基本 古籍库、二十五史研习系统、全唐诗、全宋诗等信息系统,迪志文、书同文等公司的《四库全 书》、《四部丛刊》等电子版典籍。然而,现有的历史典籍数据库和信息系统侧重书目和全文 检索,且各自独立开发,造成日益突出的"历史典籍信息孤岛"问题,无法进行历史典籍信息 的广泛共享与集成。
[0003] 在历史地理领域,复旦大学、台湾中研院和中国社科院构建的中国历史地理信息 系统、中华文明之时空架构和中国社会科学综合地理信息服务平台,以数字化的《中国历史 地图集》集成了部分历史典籍信息,但应用范围仅局限于平台内部,平台间尚未实现信息共 享,更无法进行历史典籍信息的广泛共享与集成。其主要问题在于这三套平台均专注于历 史地图、历史地名的搜集和数字化,而没有从历史典籍信息综合分析的角度去考虑构建一 个体系完整而又结构有限的历史典籍信息集成框架,进而在此框架下进行历史典籍信息的 空间集成和综合分析。
【发明内容】
[0004] 为了解决历史典籍信息难以进行广泛共享与集成的问题,克服现有历史典籍数据 库、信息系统和历史地理信息系统独立封闭,历史典籍信息仅能在平台内部进行有限集成 等缺陷,本发明的目的是提供一种中国历史典籍信息的空间集成方法,通过空间框架实现 平台独立的历史典籍信息的共享与集成。
[0005] 本发明解决其技术问题所采用的技术方案是:
[0006] -种中国历史典籍信息的空间集成方法,包括以下步骤:
[0007] (1)选择中国历史典籍信息集成框架的时间单元和空间单元,确定中国历史典籍 信息集成框架的时间结构和空间结构,按照时间结构分别构建各个历史时期的空间框架。
[0008] 所述中国历史典籍信息集成框架以空间框架为主,在空间框架中体现时间要素。 由时间单元和空间单元共同构成中国历史典籍信息集成框架的基本单元,这些单元可分 害J,并具有一定的层次等级结构,上级基本单元由若干个下级基本单元组成,只有最低层级 的基本单元不可分割。
[0009] 所述时间单元和空间单元的选择,主要依据中国历史典籍信息中时间信息和空间 信息的特征,以及中国行政区划体系的演变过程,选择基本的、稳定的时间单元和空间单 J1_1〇
[0010] 所述中国历史典籍信息集成框架的时间结构,主要依据中国行政区划体系演变过 程的阶段划分。以朝代划分为不同的历史时期但不限于朝代划分法,构成中国历史典籍信 息集成框架的时间结构。
[0011] 所述中国历史典籍信息集成框架的空间结构,主要指由空间单元构成的层次等级 结构,即中国历史典籍信息集成的空间框架。该空间结构应该是体系完整而又结构有限的。 依据中国行政区划体系的演变过程,提炼确定一个稳定的、通用的行政区划体系作为中国 历史典籍信息集成框架的空间结构。
[0012] 根据上述选择的时间单元和空间单元,以及确定的时间结构和空间结构,分别构 建中国各个历史时期的空间框架。空间框架构建的主要内容是采集每个空间单元的基本信 息并按照空间结构建立各空间单元间的层级关联。空间单元的基本信息包括但不限于唯一 编码、名称、级别、历史时期、开始时间、结束时间、空间位置和范围信息。
[0013] 所述空间单元的唯一编码,代表空间单元在空间框架中的位置标记。通过该编码 可以定位空间单元在整个空间框架中的位置,可以向上和向下追溯与其具有层级关联的空 间单元,还可以间接地获取其同一层级的其它空间单元。
[0014] (2)对某条具体的历史典籍信息,提取该条历史典籍信息中的空间信息并将其与 对应历史时期的空间框架进行逐级匹配,将位置标记添加到该条历史典籍信息中;重复上 述步骤,建立具有位置标记的历史典籍数据集。
[0015] 所述对某条具体的历史典籍信息,提取该条历史典籍信息中的空间信息并将其与 对应历史时期的空间框架进行逐级匹配,在匹配前,还包括判断该条历史典籍信息所描述 的历史时期,并获取对应历史时期的空间框架;在匹配时,按照从上至下的顺序依次进行, 即从空间框架的最高层级开始,如果成功匹配某一层级的空间单元,则进入该空间单元的 下一层级继续匹配,直到匹配到空间框架的最低层级,如果无法成功匹配某一层级的空间 单元,则停止匹配,最后获取匹配成功的最低层级的空间单元的位置标记;在匹配完成后, 保留其余更为详细的空间信息,以便需要更为精确的空间位置信息时,能够进行进一步的 空间定位。对于无法和任一层级匹配的空间信息,则作为对应历史时期的全国性综合信息。
[0016] 所述将位置标记添加到该条历史典籍信息中,添加位置标记的方式有两种:一是 将位置标记添加到整条历史典籍信息中,二是将该条历史典籍信息拆分成多条信息,然后 将位置标记分别添加到拆分后的多条历史典籍信息中。
[0017] 对大量具体的历史典籍信息重复上述步骤,建立具有位置标记的历史典籍数据 集。
[0018] (3)设定历史典籍信息综合分析的时间范围和空间范围,获取设定空间范围涉及 的空间单元的位置标记集合;从已标记的历史典籍数据集中抽取符合位置标记条件的历史 典籍信息,建立空间集成的多要素历史典籍数据集。
[0019] 所述设定历史典籍信息综合分析的时间范围和空间范围,获取设定空间范围涉及 的空间单元的位置标记集合,包括根据设定的时间范围获取对应历史时期的空间框架,根 据设定的空间范围从空间框架中获取涉及的空间单元,然后获取其位置标记集合。
[0020] 所述空间集成的多要素历史典籍数据集,空间集成是指该历史典籍数据集具有统 一的空间基础,可以根据位置标记将历史典籍数据在更高层级上进行合并,即能够在空间 框架的不同层级(空间尺度)上进行历史典籍数据的集成;多要素是指历史典籍数据集可 以包括气温、降水、人口和经济等多方面的历史自然和人文要素。
[0021] 本发明提出以中国历史行政区划体系为基础,分别构建各个历史时期的空间框 架;提取历史典籍信息中的空间信息并将其与空间框架进行逐级匹配,建立具有位置标记 的历史典籍数据集;抽取符合设定时间范围和空间范围的历史典籍信息,建立空间集成的 多要素历史典籍数据集。本发明的方法可为中国历史典籍信息的多要素综合分析提供统一 的空间基础,实现了平台独立的历史典籍信息的广泛共享与集成。本发明操作简单、易于实 施,广泛适用于各种历史典籍,有效地克服了现有历史典籍数据库、信息系统和历史地理信 息系统独立封闭,历史典籍信息难以共享和集成等缺陷,具有良好的应用前景和较大的市 场潜力。
【附图说明】
[0022] 图1为本发明一种中国历史典籍信息的空间集成方法的核心步骤流程图;
[0023] 图2为本发明中国历史典籍信息集成框架的结构图;
[0024] 图3为本发明实施例的清代行政区划体系图。
【具体实施方式】
[0025] 下面对本发明实例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅 仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人 员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026] 本发明提供一种中国历史典籍信息的空间集成方法,其核心步骤流程如图1所 示。具体实施时,包括以下步骤:
[0027] 1、选择中国历史典籍信息集成框架的时间单元和空间单元,确定中国历史典籍信 息集成框架的时间结构和空间结构,按照时间结构分别构建各个历史时期的空间框架。
[0028] (1)依据中国历史典籍信息