一种多语种倾斜文档图像的自动语言判别方法与流程

文档序号：14722443发布日期：2018-06-17 21:24阅读：来源：国知局

技术特征：

1.一种多语种倾斜文档图像的自动语言判别方法，其特征在于包括以下步骤：

步骤1、对于采集的文档图像，利用Gabor滤波方法进行文档图像语种的自动判别，将文档图像分为亚洲语种文档图像和拉丁语种文档图像；

步骤2、针对不同语种的文档图像使用相应的倾斜校正算法，得到校正后的文档图像，然后在校正后的文档图像上应用关键词匹配方法进行文档图像语言的自动判别，从而实现文档图像的语言自动判别功能。

2.根据权利要求1所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤1的具体实现方法包括以下步骤：

(1)对采集的文档图像使用数学形态学的方法进行滤噪处理；

(2)对于存在倾斜的文档图像，从中选取适合于做自动语言判别的一定数量的文字区域；

(3)对选出的每个文字区域分别做Gabor滤波，并根据提取到的Gabor特征、应用分类器对每个文字区域的语种进行自动判别；

(4)对每个文字区域的自动语种判别结果进行投票，取投票数最多的语种作为整个文档图像的语种判别结果，从而将输入的文档图像分为亚洲语种文档图像和拉丁语种文档图像两大类。

3.根据权利要求2所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤(1)对采集的文档图像使用数学形态学的方法进行滤噪处理是采用腐蚀及膨胀算法实现的。

4.根据权利要求2所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤(3)的具体方法为：首先对于选出的文字区域图像生成不同尺度、多个方向的Gabor图像；然后生成得到Gabor幅值图像并对Gabor幅值图像进行向下采样；最后，根据提取到的Gabor特征利用文字区域训练样本进行分类器学习，对待作语种判别的文字区域图像进行分类，将每一文字区域分为亚洲语种或拉丁语种。

5.根据权利要求1所述的一种多语种倾斜文档图像的自动语言判别方\t法，其特征在于：所述步骤2的具体实现方法包括以下步骤：

(1)根据自动判别得到的语种对文档图像进行倾斜校正及文字切分处理；

(2)从文字切分结果中取出最符合文字特点的若干块文字图像；

(3)根据自动判别得到的语种对每一块切分出来的文字图像或单词图像利用分类器进行识别，根据识别结果对每一块文字图像或单词图像的语言进行自动判别；

(4)对文字图像或单词图像的自动语言判别结果进行投票，取投票数最多的语言作为整幅文档图像的语言判别结果。

6.根据权利要求5所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤(1)的文字切分处理方法为：在校正的文档图像上使用适用于不同语种的文字切分方法，得到文字切分结果：对于亚洲语种文档图像，通过文字切分得到多个候选字符；对于拉丁语种文档图像，通过文字切分得到多个候选单词。

7.根据权利要求5所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤(2)的具体方法为：对于亚洲语种文档图像，首先将候选字符按高度计算直方图，选取高度在直方图峰值附近的字符，以滤除噪音、减少其对判别结果的影响；然后，对选取的字符按宽高比减一的绝对值进行升序排序，保留前面字符进行后继分析；对于拉丁语种文档图像，按照候选单词的长度降序排列，保留前面一定数量的单词进行后继分析。

8.根据权利要求5所述的一种多语种倾斜文档图像的自动语言判别方法，其特征在于：所述步骤(3)的具体方法为：对于亚洲语种文档图像，将第(2)步保留下来的一定数量的字符图像送入亚洲文字图像分类器进行字符识别，每个字符的识别结果包括中文、日文或韩文，保留识别可信度最高的前面一定数量的字符进行语言判别投票；对于拉丁语种文档图像，将第(2)步保留下来的一定数量的单词进行字符切分和识别，保留通过语言词库匹配且可信度最高的前面一定数量的单词进行语言判别投票。

完整全部详细技术资料下载

当前第2页1 2 3