挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及图像处理领域,特别涉及一种挖掘石窟壁画群中石窟壁画时空关联关 系的方法和装置。
【背景技术】
[0002] 所谓石窟壁画为绘制在石洞墙壁上的画作,而同一石窟内的多幅石窟壁画构成石 窟壁画群,其中,国内已经发现的石窟壁画群包括:新疆石窟壁画群、敦煌莫高窟壁画群等 等。由于石窟壁画群作为重要的文化遗产,国内外学者发表了大量关于石窟壁画群的专著 文献,以从历史渊源、宗教背景、壁画内容、艺术风格、建筑风格、壁画原材料等诸多方面对 壁画群中单幅壁画进行了大量深入细致的研究工作。
[0003] 尽管关于壁画群中单幅壁画的研究能够为石窟壁画领域的提供大量的参考数据, 但是,所提供的参考数据比较单一和分散,因此,为了提供研究石窟壁画的关于整体关系的 参考数据,存在对石窟壁画群中各个石窟壁画间的关联关系的确定的需求。
【发明内容】
[0004] 本发明实施例公开了一种挖掘石窟壁画群中石窟壁画时空关联关系的方法和装 置,以挖掘确定出石窟壁画群中石窟壁画的时空关联关系,为研究石窟壁画的整体的关联 关系提供参考数据。具体方案如下:
[0005] -方面,本发明实施例提供了一种挖掘石窟壁画群中石窟壁画时空关联关系的方 法,所述方法包括:
[0006] 确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁画确定为一个元 组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画中的描述信息以及预 先获得的关于该石窟壁画的介绍信息中提取得到;
[0007] 基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,进而,获得各 石窟壁画所对应的描述词和所述描述词所对应的词频;
[0008] 将各石窟壁画中词频超过第一预设阈值的多个描述词确定为相应元组的预定类 别属性,其中,所述预定类别属性包括:时间类属性、空间类属性和描述类属性;
[0009] 从各石窟壁画的第一描述数据中,确定所对应元组的属于预定类别属性的各个描 述词所对应的多个描述子数据,并将所述多个描述子数据中出现次数超过预设数量阈值的 目标描述子数据确定为相应描述词所对应的元组的属性值;
[0010]根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组关联成 复杂网络,其中,复杂网络中的节点为所述元组;
[0011]利用复杂网络分析算法,将所述复杂网络中的所有元组以模块化参数最大化的标 准分割为多个网络模块,每个网络模块中包括至少一个元组;
[0012]将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石窟壁 画确定为存在时空关联关系,其中,所述预定条件包括:所包括元组的属于时间类属性的描 述词的属性值不同和/或空间类属性的描述词的属性值不同。
[0013] 较佳的,所述基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计, 包括:
[0014] 基于Apriori算法对各石窟壁画的第一描述数据进行除语气助词、数字、语气词、 标点符号以及结构助词之外的第一词频统计。
[0015] 较佳的,关于该石窟壁画中的描述信息的获得方式,包括:
[0016] 对纸质形式的石窟壁画中的描述信息依次进行扫描和光学字符识别,从而获得该 石窟壁画中的描述信息;
[0017] 关于该石窟壁画的介绍信息的获得方式,包括:
[0018] 对纸质形式的该石窟壁画的介绍信息依次进行扫描和光学字符识别,从而获得该 石窟壁画的介绍信息。
[0019] 较佳的,所述获得各壁画所对应的描述词和所述描述词所对应的词频包括:
[0020] 利用基于无监督学习的自组织映射算法对所述各壁画所对应的描述词进行量化 分析,以滤除属于噪声的描述词;
[0021] 获得滤除噪声的描述词的各石窟壁画所对应的描述词和所述描述词所对应的词 频,所述属于噪声的描述词为对所述纸质形式的石窟壁画中的描述信息和/或所述纸质形 式的该石窟壁画的介绍信息依次进行进行扫描和光学字符识别时,出现的错误识别的描述 词;其中,所述自组织映射算法中参数选择六边形映射格点,初始化码书选择随机码书,训 练过程选择批处理batch训练算法,映射函数选择高斯邻域函数
高斯邻域函数中σ为邻域半径,r。为单元c的位置,c代表batch训练过程中,对应的各石窟壁 画所对应的描述词训练输出结果索引,η。表示滤除噪声的描述词的各石窟壁画所对应的描 述词与未滤除噪声的描述词间的高斯距离,r。是batch训练过程输出的滤除噪声的描述词 的各石窟壁画所对应的描述词,^是训练输入的各石窟壁画所对应的描述词,| |η-Γι| |表 示训练时产生的噪声的一阶原点矩。
[0022] 较佳的,所述根据各个元组的属于描述类属性的各个描述词的属性值,将所述各 个元组关联成复杂网络,包括:
[0023] 针对每两个元组,当所述两个元组的属于描述类属性的各个描述词的属性值相同 的数量超过第三预设阈值时,确定所述两个元组相互关联;
[0024] 依次确定每两个元组间的关联关系,将所述各元组关联成复杂网络。
[0025] 较佳的,在所述将所述多个网络模块中符合预定条件的目标网络模块所包括元组 对应的石窟壁画确定为存在时空关联关系之后,还包括:
[0026] 计算所述目标网络模块占所有网络模块的百分比,以定量确定所述石窟壁画群中 各石窟壁画的时空关联关系。
[0027] 另一方面,本发明实施例还提供了一种挖掘石窟壁画群中石窟壁画时空关联关系 的装置,所述装置包括:
[0028] 确定单元:用于确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁 画确定为一个元组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画中的 描述信息以及预先获得的关于该石窟壁画的介绍信息中提取得到;
[0029] 词频统计单元:用于基于Apriori算法对各石窟壁画的第一描述数据进行第一词 频统计,进而,获得各石窟壁画所对应的描述词和所述描述词所对应的词频;
[0030] 预定类别属性确定单元:用于将各石窟壁画中词频超过第一预设阈值的多个描述 词确定为相应元组的预定类别属性,其中,所述预定类别属性包括:时间类属性、空间类属 性和描述类属性;
[0031] 属性值确定单元:用于从各石窟壁画的第一描述数据中,确定所对应元组的属于 预定类别属性的各个描述词所对应的多个描述子数据,并将所述多个描述子数据中出现次 数超过预设数量阈值的目标描述子数据确定为相应描述词所对应的元组的属性值;
[0032] 复杂网络关联单元:用于根据各个元组的属于描述类属性的各个描述词的属性 值,将所述各个元组关联成复杂网络,其中,复杂网络中的节点为所述元组;
[0033] 网络模块分割单元:用于利用复杂网络分析算法,将所述复杂网络中的所有元组 以模块化参数最大化的标准分割为多个网络模块,每个网络模块中包括至少一个元组;
[0034] 时空关联关系确定单元:用于将所述多个网络模块中符合预定条件的目标网络模 块所包括元组对应的石窟壁画确定为存在时空关联关系,其中,所述预定条件包括:所包括 元组的属于时间类属性的描述词的属性值不同和/或空间类属性的描述词的属性值不同。
[0035] 较佳的,关于该石窟壁画中的描述信息的获得方式,包括:
[0036] 对纸质形式的石窟壁画中的描述信息依次进行扫描和光学字符识别,从而获得该 石窟壁画中的描述信息;
[0037] 关于该石窟壁画的介绍信息的获得方式,包括:
[0038] 对纸质形式的该石窟壁画的介绍信息依次进行扫描和光学字符识别,从而获得该 石窟壁画的介绍信息。
[0039] 较佳的,所述词频统计单元具体用于:
[0040] 利用基于无监督学习的自组织映射算法对所述各壁画所对应的描述词进行量化 分析,以滤除属于噪声的描述词;
[0041] 获得滤除噪声的描述词的各石窟壁画所对应的描述词和所述描述词所对应的词 频,所述属于噪声的描述词为对所述纸质形式的石窟壁画中的描述信息和/或所述纸质形 式的该石窟壁画的介绍信息依次进行进行扫描和光学字符识别时,出现的错误识别的描述 词;其中,所述自组织映射算法中参数选择六边形映射格点,初始化码书选择随机码书,训 练过程选择批处理batch训练算法,映射函数选择高斯邻域函数
高斯邻域函数中σ为邻域半径,r。为单元c的位置,c代