专利名称:计算机辅助甲骨拓片分期断代方法
技术领域:
本发明领域涉及甲骨拓片分期断代研究,具体涉及基于计算机图像处理和识别技术的计算机辅助甲骨拓片断代方法。
背景技术:
自甲骨文发现之日起,学者们就开始对其所属时代进行研究。甲骨拓片的分期断代研究,可将甲骨文所记载的内容变成重要的科学研究材料,现已成为甲骨学者必须掌握和研究的重要课题。在甲骨文分期断代的研究中,罗振玉、王国维等学者最早提出“称谓”这一标准可以确定具体甲骨所属的确切王世,首先确定了殷墟并范围了甲骨文为商代晚期之物,为甲骨文本身时代的细化分奠定了基础。加拿大学者明义士结合西方考古学方法(字体的观察) 和中国传统金石学方法(称谓的考订)判断甲骨时代,使孤立甲骨断代研究深入到对成批甲骨的断代整理。董作宾在《甲骨文断代研究例》中,提出“五期”分法和甲骨断代的“十项标准”,现已成为国内外甲骨学届研究中普遍使用和承认的基本方法。胡厚宣、陈梦家等学者在此基础上对甲骨分期提出的四期分法和九期分法,促使甲骨学分期断代研究逐步走向深入。上述分期断代方法中的“十项标准”包括世系、称谓、贞人、坑位、方国、人物、事类、文法、字形和书体。其中世系、称谓和贞人三位一体作为甲骨文字内容,是其分期断代的第一标准。然而,对于许多既无称谓也无贞人的甲骨拓片而言,则需要利用富有时代特征的字形、书体和钻凿等形态研究辅助甲骨分期断代。目前,对甲骨字形演变、书体作风和钻凿形态的时代特点的实践经验总结尚停留在人工方法的文字整理阶段,仅为部分经验丰富的甲骨学者所掌握,难以为计算机所识别而进行分期断代,缺乏规律性和系统性的计算机辅助方法供更多甲骨研究者在断代实践中综合利用。
发明内容
技术问题本发明的目是克服已有技术中的不足之处提供一种计算机辅助甲骨拓片分期断代方法,通过现有的数学形态学图像处理,达到对甲骨文字形演变、书体作风以及钻凿形态的时代特征的计算机辅助定量化分析和分类,从而使分期断代更加直接客观、直接、智能和自动化。技术方案计算机辅助甲骨拓片分期断代方法,包括下列步骤
a、甲骨拓片的预处理
(1)利用数字扫描仪将甲骨拓片扫描成点阵位(2)通过计算机对图像进行二值化处理;
(3)去掉面积较小的连通域,得到去噪点后的甲骨拓片二值黑白图象;
b、提取甲骨拓片图像的特征向量
(I)获取去噪点后的甲骨拓片二值黑白图象的外接矩形,得到去外框图;(2)对去外框图进行数学形态学图像处理,分别获取凸包图、特殊四边形图、骨架图、连通图和笔宽权值(3)对获取的图像提取12种甲骨拓片特征向量;
C、训练甲骨拓片分期断代分类器
(1)利用已人工断代的甲骨拓片样本集合12种甲骨拓片特征向量进行分期断代的条件概率估计;
(2)根据12种甲骨拓片特征向量的条件概率估计训练朴素贝叶斯分类器,直至符合人工断代结果;
d、基于贝叶斯分类的分期断代
(O使用训练过后的朴素贝叶斯分类器,对待分期断代的甲骨拓片进行分类;
(2)建立待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。有益效果由于采用了以上技术方案,本发明与现有技术相比,具有以下优势
1、能够兼顾字形演变、书体作风和钻凿形态,可实现对既无称谓也无贞人的甲骨拓片, 进行计算机辅助的定量化、自动化和系统化分期断代,大大降低了原本繁琐且难以掌握的人工分期断代方法的难度;
2、利用数学形态学方法,提取外接矩形图、凸包图、特殊四边形、骨架图、连通图,在此基础上分别提取12种甲骨拓片特征向量,更加本质的抓住了甲骨拓片字体的形态特征。3、本发明基于贝叶斯分类的甲骨拓片分期断代方法,并基于大量已人工断代的甲骨拓片的样本集合,分别计算各特征因素对分期断代的条件概率(先验概率)估计,训练甲骨拓片的朴素贝叶斯分类器,获取待分期断代甲骨拓片与“五期”分法的映射关系,能得出比较符合人工分期断代的有效分类结果。
图1是本发明计算机辅助甲骨拓片分期断代方法的实施例流程图。图2是《甲骨文合集》(中华书局,1979-1983年)559 (正面)视图。图3 (a)是甲骨拓片扫描后得到的点阵位图。图3(b)是甲骨文字的ニ值黑白图像。图3 (c)是去除噪点后的甲骨文字ニ值图像。图4是甲骨拓片特征向量的图像处理提取过程框图。图5 (a)是甲骨拓片字体的外接矩形图。图5 (b)是甲骨拓片字体的凸包图。图5 (c)是甲骨拓片字体的特殊四边形图。图5 (d)是甲骨拓片字体的骨架图。图5(6)是甲骨拓片字体的连通图。图5 (f)是甲骨拓片字体的笔宽权值图。图6是训练甲骨拓片分类器的流程图。图7是基于贝叶斯分类的甲骨拓片分期断代系统的界面图。
具体实施例方式下面结合附图对本发明的一个实施例作进一步的描述如图I所示,本发明的计算机辅助甲骨拓片分期断代方法主要由甲骨拓片的预处理、提取甲骨拓片特征向量、训练甲骨拓片分期断代分类器和基于贝叶斯分类的甲骨拓片分期断代四个部分组成。甲骨拓片的预处理包括利用数字扫描仪将甲骨拓片扫描成点阵位图;通过计算机对图像进行二值化处理;去掉面积较小的连通域,得到去噪点后的甲骨拓片二值黑白图象;如图2所示的甲骨拓片上多个甲骨文字,利用扫描仪以固定分辨率扫描成灰度图像,如图3 (a)所示;通过字符切割得到单个的甲骨字体图像,利用迭代法将甲骨拓片图像二值化 (以O表示黑像素即背景像素,I表示白像素即前景甲骨笔画像素)处理,如图3 (b)所示; 然后通过去掉面积较小的连通域的方法,对二值图像进行噪声消除,如图3 (c)所示。提取甲骨拓片图像的特征向量获取去噪点后的甲骨拓片二值黑白图象的外接矩形,得到去外框图;对去外框图进行数学形态学图像处理,分别获取凸包图、特殊四边形图、 骨架图、连通图和笔宽权值图;对获取的图像提取12种甲骨拓片特征向量;如图4所示,利用数学形态学图像处理方法分别提取甲骨拓片的视觉特征,依据甲骨拓片的字形演变、书体作风和钻凿形态等,将人工鉴定所用到的视觉特征转化为利用计算机语言去描述并抽取这些特征量。甲骨拓片特征向量的图像处理提取过程即为对单个甲骨拓片字体去噪声点后二值黑白图像进行图像处理,获取外接矩形并得到去外框图,依次进行凸包图、特殊四边形图、骨架图、连通图和笔宽权值图等图像处理过程。训练甲骨拓片分期断代分类器利用已人工断代的甲骨拓片样本集合12种甲骨拓片特征向量进行分期断代的条件概率估计;根据12种甲骨拓片特征向量的条件概率估计训练朴素贝叶斯分类器,直至符合人工断代结果;经过去外框图处理得到的单个甲骨字体的二值图像,如图5 Ca)所示,设以
表示单个甲骨字体的外接矩形,因是二值图像,故其取值非I即0,其中O是黑色表示非字体背景像素,而I是白色表示字体笔画前景像素。设该外接矩形图像的大小为 Afx/i,其中Jf力图像的水平像素数况为垂直像素数。则可分别抽取如下特征值
I、外接矩形的宽高比例特征是甲骨字体的偏平程度特征,定义为《I
权利要求
1.计算机辅助甲骨拓片分期断代方法,其特征在于,包括下列步骤a、甲骨拓片的预处理(1)利用数字扫描仪将甲骨拓片扫描成点阵位图;(2)通过计算机对图像进行二值化处理;(3)去掉面积较小的连通域,得到去噪点后的甲骨拓片二值黑白图象;b、提取甲骨拓片图像的特征向量(1)获取去噪点后的甲骨拓片二值黑白图象的外接矩形,得到去外框图;(2)对去外框图进行数学形态学图像处理,分别获取凸包图、特殊四边形图、骨架图、连通图和笔宽权值图;(3)对获取的图像提取12种甲骨拓片特征向量;C、训练甲骨拓片分期断代分类器(1)利用已人工断代的甲骨拓片样本集合12种甲骨拓片特征向量进行分期断代的条件概率估计;(2)根据12种甲骨拓片特征向量的条件概率估计训练朴素贝叶斯分类器,直至符合人工断代结果;d、基于贝叶斯分类的分期断代(O使用训练过后的朴素贝叶斯分类器,对待分期断代的甲骨拓片进行分类;(2)建立待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。
全文摘要
一种计算机辅助甲骨拓片分期断代方法,主要由甲骨拓片的预处理、提取甲骨拓片特征向量、训练甲骨拓片分期断代分类器和基于贝叶斯分类的甲骨拓片分期断代四个部分组成。利用数字扫描仪甲骨拓片扫描成点阵位图,对图像进行二值化并去除噪点;通过数学形态学图像处理,获取甲骨拓片的外接矩形图、凸包图、特殊四边形图、骨架图、连通图和笔宽权值图,提取12种甲骨拓片特征向量;基于大量已人工断代的甲骨拓片的样本集合,训练甲骨拓片的朴素贝叶斯分类器;获取待分期断代甲骨拓片与“五期”分法的映射关系,实现对甲骨拓片图像的有效分类。本发明利用计算机辅助实现甲骨拓片的分期断代,具备定量化、自动化、系统化等特点。
文档编号G06K9/54GK102592149SQ201210000130
公开日2012年7月18日 申请日期2012年1月4日 优先权日2012年1月4日
发明者杨亦鸣, 酆格斐, 顾绍通 申请人:徐州师范大学