一种文字数字化处理方法、装置及设备与流程

文档序号:30086010发布日期:2022-05-18 05:42阅读:173来源:国知局
一种文字数字化处理方法、装置及设备与流程

1.本技术涉及信息处理技术领域,尤其涉及一种文字数字化处理方法、装置及设备。


背景技术:

2.在指导学生进行书法学习时,往往需要对学生所书写的文字进行评价,一般是将所书写的文字与该文字对应的标准字体进行比较以得出一些指导建议。标准字体的产生,可以从书法老师的手写手稿中提取得到。
3.然而,通过设备采集到文字的标准点集,在还原显示时会存在着抖动和弯曲等情况,使得最终还原得到的文字的美观度和效果不尽如人意。而且由于个人对不同老师的字体存在不同的喜恶程度,单一的标准字体无法满足人们对书法学习的个性化需求。


技术实现要素:

4.本技术实施例提供了一种文字数字化处理方法、装置及设备,能够降低数字化的标准点集在文字还原中出现的失真率,提高文字的还原度和美观效果。
5.第一方面,本技术提供一种文字数字化处理方法,包括:获取目标文字的第一骨架信息,上述第一骨架信息为从目标图像中提取到的多个像素点,上述目标图像为上述目标文字对应的图像;修正上述第一骨架信息中存在错误的像素点,得到第二骨架信息;对上述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息;根据线宽信息,对上述第一笔顺信息中的像素点进行加宽处理,得到上述目标文字的标准点集。
6.本技术实施例通过修正目标文字的骨架信息中存在错误的像素点,再对修正后的骨架信息进行笔画划分和笔顺还原得到的笔顺信息进行加宽处理,减少了文字还原过程中出现的抖动和弯曲现象,从而有效的降低数字化后得到的标准点集在文字还原中出现的失真率,提高文字的还原度和美观效果。
7.在第一方面的一些实施例中,上述修正上述第一骨架信息中存在错误的像素点,得到第二骨架信息,包括:
8.获取满足预设条件的若干个像素点,上述预设条件为具有多个连通方向的任一像素点;
9.确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离;
10.当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,将相邻的两个像素点合并修正为一个像素点。
11.在本技术实施例中,通过修正错误的像素点,可以减少笔画划分的错误率,从而减少文字还原中出现的抖动或弯曲的概率。
12.在第一方面的另一些实施例中,上述对上述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息,包括:
13.根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息;
14.将上述第一笔画信息和标准笔画信息进行比较;
15.根据比较结果还原上述目标文字的笔顺,得到上述第一笔顺信息。
16.在第一方面的另一些实施例中,上述根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息中,包括:
17.根据第一方向优先级,遍历上述第二骨架信息中的所有像素点;
18.根据遍历结果,完成对上述第二骨架信息的笔画划分,得到上述第一笔画信息。
19.在第一方面的另一些实施例中,上述根据第一方向优先级,遍历上述第二骨架信息中的所有像素点中,包括:
20.当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向;
21.如果当前像素点的连通方向中存在与前一个像素点相同的连通方向,则按照与前一个像素点相同的连通方向继续进行连通性遍历。
22.在第一方面的另一些实施例中,在上述当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向之后,还包括:
23.如果当前像素点的连通方向中不存在与前一个像素点相同的连通方向,则按照第二方向优先级继续进行连通性遍历。
24.在第一方面的另一些实施例中,上述根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息中,包括:
25.统计上述第一笔画信息中的笔画数量;
26.确定统计得到的上述笔画数量与上述目标文字的实际笔画数量是否一致;
27.当统计得到的上述笔画数量与上述目标文字的实际笔画数量不一致时,按照第三方向优先级,对上述第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至统计得到的上述笔画数量与上述目标文字的实际笔画数量相一致。
28.在第一方面的另一些实施例中,上述根据线宽信息,对上述第一笔顺信息中的像素点进行加宽处理,得到上述目标文字的标准点集中,包括:
29.获取上述目标文字的轮廓信息,上述轮廓信息由多个轮廓点构成;
30.计算并获取上述第一笔顺信息中每个像素点到上述轮廓点的距离信息;
31.将上述距离信息中最小的距离值作为当前计算的像素点的线宽信息。
32.第二方面,本技术提供一种文字数字化处理装置,包括:
33.骨架信息获取单元,用于获取目标文字的第一骨架信息,上述第一骨架信息为从目标图像中提取到的多个像素点,上述目标图像为上述目标文字对应的图像;
34.像素点修正单元,用于修正上述第一骨架信息中存在错误的像素点,得到第二骨架信息;
35.笔顺还原单元,用于对上述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息;
36.像素加宽单元,用于根据线宽信息,对上述第一笔顺信息中的像素点进行加宽处理,得到上述目标文字的标准点集。
37.在第二方面的一些实施例中,上述像素点修正单元,包括:
38.像素点获取子单元,用于获取满足预设条件的若干个像素点,上述预设条件为具有多个连通方向的任一像素点;
39.距离确定子单元,用于确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离;
40.像素点修正子单元,用于当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,将相邻的两个像素点合并修正为一个像素点。
41.在第二方面的另一些实施例中,上述笔顺还原单元,包括:
42.笔画划分子单元,用于根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息;
43.笔画信息比较子单元,用于将上述第一笔画信息和标准笔画信息进行比较;
44.笔顺还原子单元,用于根据比较结果还原上述目标文字的笔顺,得到上述第一笔顺信息。
45.在第二方面的另一些实施例中,上述笔画划分子单元具体用于:
46.根据第一方向优先级,遍历上述第二骨架信息中的所有像素点;
47.根据遍历结果,完成对上述第二骨架信息的笔画划分,得到上述第一笔画信息。
48.在第二方面的另一些实施例中,上述笔画划分子单元具体还用于:
49.当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向;
50.如果当前像素点的连通方向中存在与前一个像素点相同的连通方向,则按照与前一个像素点相同的连通方向继续进行连通性遍历。
51.在第二方面的另一些实施例中,上述笔画划分子单元具体还用于:
52.如果当前像素点的连通方向中不存在与前一个像素点相同的连通方向,则按照第二方向优先级继续进行连通性遍历。
53.在第二方面的另一些实施例中,上述笔画划分子单元具体还用于:
54.统计上述第一笔画信息中的笔画数量;
55.确定统计得到的上述笔画数量与上述目标文字的实际笔画数量是否一致;
56.当统计得到的上述笔画数量与上述目标文字的实际笔画数量不一致时,按照第三方向优先级,对上述第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至统计得到的上述笔画数量与上述目标文字的实际笔画数量相一致。
57.在第二方面的另一些实施例中,上述像素加宽单元,包括:
58.轮廓信息获取子单元,用于获取上述目标文字的轮廓信息,上述轮廓信息由多个轮廓点构成;
59.距离获取子单元,用于计算并获取上述第一笔顺信息中每个像素点到上述轮廓点的距离信息;
60.线宽确定子单元,用于将上述距离信息中最小的距离值作为当前计算的像素点的线宽信息。
61.第三方面,本技术提供一种文字数字化处理设备,包括处理器、存储器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如第一方面或第一方面的任意可选方式上述的方法。
62.第四方面,本技术提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面或第一方面的任意可选方
式上述的方法。
63.第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在文字数字化处理设备上运行时,使得文字数字化处理设备执行上述第一方面上述的文字数字化处理方法的步骤。
64.可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
65.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
66.图1是本技术实施例提供的一种文字数字化处理方法的流程示意图;
67.图2是本技术实施例提供的一种目标文字的骨架信息的图像示意图;
68.图3是本技术实施例提供的一种修正错误像素点的方法的流程示意图;
69.图4是本技术实施例提供的一种目标文字的部分骨架信息的图像示意图;
70.图5是本技术实施例提供的一种笔画划分方法的流程示意图;
71.图6是本技术实施例提供的另一种笔画划分方法的流程示意图;
72.图7是本技术实施例提供的一种对像素点进行加宽处理的方法的流程示意图;
73.图8是本技术实施提供的一种对像素点进行加宽处理后得到的标准点集的效果示意图;
74.图9是本技术实施例提供的一种文字数字化处理装置的结构示意图;
75.图10是本技术实施例提供的一种文字数字化处理设备的结构示意图。
具体实施方式
76.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
77.应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
78.还应当理解,在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
79.请参见图1,图1是本技术实施例提供的一种文字数字化处理方法的流程示意图,图2是本技术实施例提供的一种目标文字的骨架信息的图像示意图,结合图2对本技术实施例提供的文字数字化处理方法进行具体描述,详述如下:
80.步骤s101,获取目标文字的第一骨架信息,上述第一骨架信息为从目标图像中提取到的多个像素点,上述目标图像为上述目标文字对应的图像。
81.在本技术实施例中,目标文字为用户比如书法老师书写的手写手稿中的任意一个文字。在获取目标文字的第一骨架信息之前,先通过设备采集用户的手写手稿得到一张图像,比如,通过设备对用户的手写手稿进行扫描得到一张扫描图像,然后通过图像裁剪处理得到该张扫描图像中的每个文字对应的图像,也即得到目标图像。在得到目标图像后,通过图像形态学算法和细化算法,从目标图像中提取目标文字的骨架信息,得到目标文字的骨架信息。
82.具体的,获取上述目标图像中的预定区域,上述预定区域为指定颜色的区域,该指定颜色一般为当前文字对应的颜色。从该预定区域中提取目标文字的图像信息和轮廓信息,再通过开合运算从所提取的图像信息和轮廓信息确定连通区域,得到较为清晰和均匀的连通区域,然后通过细化算法从连通区域中获取目标文字的骨架信息,这里所采用的细化算法为skeletonize算法。比如,使用上述方法对目标文字“拇”进行骨架信息提取,得到如图2所示的骨架信息。如图2所示,“拇”的骨架信息为图中的由多个像素点组成的黑色线条。
83.步骤s102,修正上述第一骨架信息中存在错误的像素点,得到第二骨架信息。
84.在本技术实施例中,根据每个像素点的连通性,可以得到只有一个连通方向的像素点,比如笔画的起始点或结束点;有两个或两个以上连通方向的像素点。
85.从图2中可以看出,所获取到的第一骨架信息中会存在部分错误信息,主要表现在笔画转折或者相交的位置,如果保留着这些错误的像素点,可能会导致最终还原得到的目标文字的相似度或者准确度不高,存在弯曲或抖动的现象,还原度和美观度无法达到理想效果。因此,需要对所获取到的第一骨架信息中存在错误的像素点进行修正,以得到修正后的第二骨架信息。
86.需要说明的是,第一骨架信息中存在错误的像素点,一般是在笔画转折或相交的位置对应的像素点,比如,一个具有四个连通方向的像素点可能被表现为两个具有三个连通方向的像素点,即两个具有三个连通方向的像素点可能是一个具有四个连通方向的像素点的错误表现方式,可以通过将该两个具有三个连通方向的像素点合并修正为一个像素点。
87.请参见图3,图3是本技术实施例提供的一种修正错误像素点的方法的流程示意图,图4是本技术实施例提供的一种目标文字的部分骨架信息的图像示意图,结合图4对本技术实施例提供的修正错误像素点的方法进行具体描述,详述如下:
88.步骤s301,获取满足预设条件的若干个像素点。
89.在本技术实施例中,上述预设条件为具有多个连通方向的任一像素点,由于具有两个方向的像素点并不容易产生错误,因此预设条件中的具有多个连通方向的任一像素点一般为具有三个或三个以上连通方向的像素点。
90.在第一骨架信息中可能存在多个满足预设条件的像素点,从第一骨架信息中获取
满足预设条件的若干个像素点,并对这些满足预设条件的像素点进行判断,确定某一像素点是否为存在错误的像素点。
91.步骤s302,确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离。
92.在本技术实施例中,按照一定顺序,从第一骨架信息中获取到满足预设条件的像素点之后,计算并确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离。
93.在本技术的一些实施例中,可以通过统计该相邻的两个像素点之间存在的其他不满足预设条件的像素点的数量来确定两者之间的距离,比如,在该相邻的两个像素点之间存在的其他不满足预设条件的像素点的数量为2,即认为该相邻的两个像素点之间的距离为2,以此类推。
94.步骤s303,当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,将相邻的两个像素点合并修正为一个像素点。
95.在本技术实施例中,阈值为预先设定的用于判断相邻的两个像素点是否存在错误像素点的值,当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,认为该相邻的两个像素点中的任意一个为错误的像素点,将该相邻的两个像素点合并修正为一个像素点。
96.如图4所示的方框中的两个灰色的像素点1和像素点2,两者之间的距离较小,可以认为两者中的任意一个像素点为错误的像素点,也即笔画“提”被分成了两笔,在本应与笔画“竖(丨)”相交的位置出现了错误,与笔画“竖(丨)”形成了两个相交点,也即图4中所示的像素点1和像素点2。
97.在本技术的一些实施例中,在将相邻的两个像素点合并修正为一个像素点时,并不是简单的删除或剔除该相邻的两个像素点中的任意一个像素点,而是将该相邻的两个像素点之间的所有像素点(包括该相邻的两个像素点)合并修正为一个像素点,所合并修正得到的像素点的位置在该相邻的两个像素点之间的任意一个像素点的位置,比如,将像素点1和像素2移到像素点1和像素2之间处于中间位置的像素点上,也即将三个像素点合并为一个像素点,以保证笔画还原的流畅性和美观效果。
98.步骤s103,对上述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息。
99.在本技术实施例中,由于第二骨架信息是由多个像素点组成,所有的笔画是连在一起的,为了顺利并准确地还原目标文字,还需要拆分第二骨架信息中的笔画,也就是对第二骨架信息进行笔画划分和笔顺还原,以得到目标文字的笔顺信息。
100.请参见图5,图5是本技术实施例提供的一种笔画划分方法的流程示意图,详述如下:
101.步骤s501,根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息。
102.在本技术实施例中,连通性遍历规则为以只有一个连通方向的像素点为起始点,按照第一方向优先级进行连通性遍历,直至找到对应的只有一个连通方向的像素点的终止点的原则。第一笔画信息由多个笔画集合组成,每个笔画集合由一笔笔画对应的像素点组成,每个笔画集合中包括作为起始点的像素点和作为终止点的像素点。
103.在这里,第一方向优先级为预先设定的进行连通性遍历时的方向优先级,一般按照字体书写习惯的方向设定,比如按照从上到下,从左到右的方向顺序对第二骨架信息中
的像素点进行遍历。当从起始点遍历到终止点时,遍历经过的所有像素点视为一笔笔画的像素点集合。
104.在本技术的一些实施例中,根据第一方向优先级,遍历上述第二骨架信息中的所有像素点,根据遍历结果,完成对上述第二骨架信息的笔画划分,得到上述第一笔画信息。在遍历过程中,将从起始点到终止点的像素点视为一笔笔画,也即一次遍历的结果,最终得到的第一笔画信息即为多个笔画的遍历结果。
105.在本技术的另一些实施例中,当遍历到具有多个连通方向即具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向,如果当前像素点的连通方向中存在与前一个像素点相同的连通方向,按照与前一个像素点相同的连通方向继续进行连通性遍历;如果当前像素点的连通方向中不存在与前一个像素点相同的连通方向,则按照第二方向优先级继续进行连通性遍历,直至找到对应的终止点,即仅具有一个连通方向的像素点作为笔画的结束点。比如,在当前像素点之前遍历的前一个像素点的连通方向为向下时,确定当前像素点存在向下的连通方向,则优先按照向下的方向继续进行连通性遍历;如果当前像素点不存在向下的连通方向,则按照第二方向优先级比如按照向下、向右、向右上、向上、向左下、向左、向右下、向左上等方向顺序进行连通性遍历,直至找到对应的终止点。这里所指的第二方向优先级中的各像素点的遍历方向不同第一方向优先级中的遍历方向。
106.在本技术的另一些实施例中,由于具有多个连通方向的像素点可能存在多个笔画信息,特别是具有三个及三个以上连通方向的像素点,可能存在两笔以上的笔画信息,例如,文字“十”,实际应为两笔笔画,但在进行连通性遍历时,两笔笔画相交的像素点具有四个连通方向,遍历得到的笔画信息中至少包括三笔笔画,比如从左到右的一笔笔画横;从左到右,再到下的一笔笔画横折;从上到下的一笔笔画等等,这时,如果当将从左到右,再到下的一笔笔画作为一个笔画时,将会导致最终得到的笔画信息并不准确,从而导致在还原笔顺时无法得到准确的笔顺信息,为了解决这一问题,本技术实施例在进行连通性遍历的过程中,记录已遍历过的且具有多个连通方向的像素点,以便于在确定遍历得到的笔画信息为错误的笔画信息时,再按照不同的方向优先级对这些具有多个连通方向的像素点进行连通性遍历,从而排除错误的笔画信息,得到更为准确的笔画信息。
107.请参见图6,图6是本技术实施例提供的另一种笔画划分方法的流程示意图,详述如下:
108.步骤s601,统计上述第一笔画信息中的笔画数量。
109.在本技术实施例中,在进行笔画划分的时候,每划分得到一笔笔画记录一次,最终统计得到第一笔画信息中的所有笔画的数量。
110.步骤s602,确定统计得到的上述笔画数量与上述目标文字的实际笔画数量是否一致。
111.在本技术实施例中,目标文字的实际笔画数量可以通过识别目标图像中的文字,获取相应文字的笔画数量。
112.步骤s603,当统计得到的上述笔画数量与上述目标文字的实际笔画数量不一致时,按照第三方向优先级,对上述第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至统计得到的上述笔画数量与上述目标文字的实际笔画数量相一致。
113.在本技术实施例中,通过统计遍历得到的笔画信息中的笔画数量,并将其与目标文字的实际笔画数量进行比较,如果两者的数量不一致,则认为遍历得到的笔画信息为错误的笔画信息,需要对按照不同的方向优先级对第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至遍历得到的笔画信息中的笔画数量与目标文字的实际笔画数量相一致。
114.在实际应用中,在对该像素点进行连通性遍历的过程中,记录下遍历过的所有的具有多个连通方向的像素点,以及该具有多个连通方向的像素点已遍历过的连通方向,比如当前具有多个连通方向的像素点以及按照向下的方式遍历了,在下一次对该具有多个连通方向的像素点进行连通遍历时,根据第三方向优先级选择已遍历过的方向之外的其他方向对该像素点进行连通性遍历。
115.在实际应用中,可能最终遍历得到笔画信息中的笔画数量与目标文字的实际笔画数量仍然无法达到一致,这时需要人为进行干预,标识部分存在较大干扰的像素点的实际连通方向,再重新根据该实际连通方向对该像素点进行连通性遍历直至最终遍历得到的笔画信息中的笔画数量与目标文字的实际笔画数量相一致。
116.步骤s502,将上述第一笔画信息和标准笔画信息进行比较。
117.步骤s503,根据比较结果还原上述目标文字的笔顺,得到上述第一笔顺信息。
118.在本技术实施例中,标准笔画信息为预先采集的标准字体的笔画集合,包括笔顺信息,通过将第一笔画信息和标准笔画信息进行比较,计算不同笔画之间的轨迹相似度,根据轨迹相似度的高低,从标准笔画信息中确定第一笔画信息中每个笔画集合对应的笔顺,得到第一笔画信息对应的笔顺信息。
119.在本技术的一些实施例中,轨迹相似度的计算所采用的算法为动态时间规整(dynamic time warping,dtw)算法,通过对第一笔画信息和标准笔画信息中的笔画集合进行两两比较,计算两个笔画集合的轨迹相似度,实现对目标文字的笔顺的还原。
120.在本技术的另一些实施例中,在根据比较结果还原上述目标文字的笔顺,得到第一笔顺信息后,由于每个笔画集合中的像素点过少,在最后还原目标文字时,会产生抖动或弯曲的现象,无法达到精确还原目标文字的目的,而且降低了目标文字的美观效果,为了避免这一情况的出现,需要对第一笔顺信息中的像素点进行加点处理,即为每个笔顺添加像素点。
121.在实际应用中,可以通过二次贝塞尔曲线的方式完成对第一笔顺信息的加点处理,得到第二笔顺信息。
122.步骤s104,根据线宽信息,对上述第一笔顺信息中的像素点进行加宽处理,得到上述目标文字的标准点集。
123.在本技术的实施例中,在得到第一笔顺信息或者第二笔顺信息后,基本可以得到目标文字数字化后的可还原的标准点集,基本可以实现提高对目标文字的数字化还原度目的,但是由于缺乏线宽的信息,导致最终得到的标准字点集中的每个笔画都是等宽的,从而使得数字化还原得到的文字的美观效果较低。为了提高对目标文字的数字化还原效果和美观效果,还需要获取轮廓上笔锋的线宽信息,对第一笔顺信息或第二笔顺信息中的像素点进行加宽处理,还原出目标文字的笔锋效果。
124.请参见图7,图7是本技术实施例提供的一种对像素点进行加宽处理的方法的流程
示意图,详述如下:
125.步骤s701,获取上述目标文字的轮廓信息,上述轮廓信息由多个轮廓点构成。
126.在本技术实施例中,从目标图像中获取目标文字的轮廓信息,如图2所示,目标图像中的白色部分为目标文字,从该目标图像中可以通过提取到目标文字的轮廓点,得到目标文字的轮廓信息。
127.步骤s702,计算并获取上述第一笔顺信息中每个像素点到上述轮廓点的距离信息。
128.在本技术实施例中,计算第一笔顺信息中每个像素点到所获取的轮廓点的距离信息,为了减少计算量,可以获取每个像素点的预定区域范围内的轮廓点,并计算该像素点与预定区域范围的轮廓点之间的距离,得到每个像素点与每个轮廓点之间的距离信息。
129.步骤s703,将上述距离信息中最小的距离值作为当前计算的像素点的线宽信息。
130.在本技术实施例中,将距离信息中最小的距离值作为当前计算的像素点的线宽,以该线宽为半径绘制圆,实现笔锋还原的目的,最终得到目标文字的标准点集。如图8所示,图8是本技术实施提供的一种对像素点进行加宽处理后得到的标准点集的效果示意图。
131.通过本技术实施例提供的上述方法,可以实现对书法手稿的多个目标文字的数字化处理,从而得到多样化的标准点集,方便提供多样化的标准字体以供用户进行书法书写学习,满足了人们对书法学习的个性化需求。
132.在本技术实施例中,通过修正目标文字的骨架信息中存在错误的像素点,再对修正后的骨架信息进行笔画划分和笔顺还原得到的笔顺信息进行加宽处理,减少了文字还原过程中出现的抖动和弯曲现象,从而有效的降低数字化后得到的标准点集在文字还原中出现的失真率,提高文字的还原度和美观效果。
133.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
134.基于上述实施例所提供的文字数字化处理方法,本技术实施例进一步给出实现上述方法实施例的装置实施例。
135.请参见图9,图9是本技术实施例提供的文字数字化处理装置的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图9,文字数字化处理装置9包括:
136.骨架信息获取单元91,用于获取目标文字的第一骨架信息,上述第一骨架信息为从目标图像中提取到的多个像素点,上述目标图像为上述目标文字对应的图像;
137.像素点修正单元92,用于修正上述第一骨架信息中存在错误的像素点,得到第二骨架信息;
138.笔顺还原单元93,用于对上述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息;
139.像素加宽单元94,用于根据线宽信息,对上述第一笔顺信息中的像素点进行加宽处理,得到上述目标文字的标准点集。
140.在本技术的一些实施例中,上述像素点修正单元92,包括:
141.像素点获取子单元,用于获取满足预设条件的若干个像素点,上述预设条件为具
有多个连通方向的任一像素点;
142.距离确定子单元,用于确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离;
143.像素点修正子单元,用于当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,将相邻的两个像素点合并修正为一个像素点。
144.在本技术的一些实施例中,上述笔顺还原单元93,包括:
145.笔画划分子单元,用于根据连通性遍历规则,对上述第二骨架信息进行笔画划分,得到第一笔画信息;
146.笔画信息比较子单元,用于将上述第一笔画信息和标准笔画信息进行比较;
147.笔顺还原子单元,用于根据比较结果还原上述目标文字的笔顺,得到上述第一笔顺信息。
148.在本技术的一些实施例中,上述笔画划分子单元具体用于:
149.根据第一方向优先级,遍历上述第二骨架信息中的所有像素点;
150.根据遍历结果,完成对上述第二骨架信息的笔画划分,得到上述第一笔画信息。
151.在本技术的一些实施例中,上述笔画划分子单元具体还用于:
152.当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向;
153.如果当前像素点的连通方向中存在与前一个像素点相同的连通方向,则按照与前一个像素点相同的连通方向继续进行连通性遍历。
154.在本技术的一些实施例中,上述笔画划分子单元具体还用于:
155.如果当前像素点的连通方向中不存在与前一个像素点相同的连通方向,则按照第二方向优先级继续进行连通性遍历。
156.在本技术的一些实施例中,上述笔画划分子单元具体还用于:
157.统计上述第一笔画信息中的笔画数量;
158.确定统计得到的上述笔画数量与上述目标文字的实际笔画数量是否一致;
159.当统计得到的上述笔画数量与上述目标文字的实际笔画数量不一致时,按照第三方向优先级,对上述第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至统计得到的上述笔画数量与上述目标文字的实际笔画数量相一致。
160.在本技术的一些实施例中,上述像素加宽单元94,包括:
161.轮廓信息获取子单元,用于获取上述目标文字的轮廓信息,上述轮廓信息由多个轮廓点构成;
162.距离获取子单元,用于计算并获取上述第一笔顺信息中每个像素点到上述轮廓点的距离信息;
163.线宽确定子单元,用于将上述距离信息中最小的距离值作为当前计算的像素点的线宽信息。
164.需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
165.图10是本技术实施例提供的文字数字化处理设备的示意图。如图10所示,该实施
例的文字数字化处理设备10包括:处理器100、存储器101以及存储在存储器101中并可在处理器100上运行的计算机程序102,例如语音识别程序。处理器100执行计算机程序102时实现上述各个文字数字化处理方法实施例中的步骤,例如图1所示的步骤101-104。或者,处理器100执行计算机程序102时实现上述各装置实施例中各模块/单元的功能,例如图9所示单元91-94的功能。
166.示例性的,计算机程序102可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器101中,并由处理器100执行,以完成本技术。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序102在文字数字化处理设备10中的执行过程。例如,计算机程序102可以被分割成骨架信息获取单元91、像素点修正单元92、笔顺还原单元93、像素加宽单元94,各单元具体功能请参阅图1对应的实施例中地相关描述,此处不赘述。
167.文字数字化处理设备可包括,但不仅限于,处理器100、存储器101。本领域技术人员可以理解,图10仅仅是文字数字化处理设备10的示例,并不构成对文字数字化处理设备10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如文字数字化处理设备还可以包括输入输出设备、网络接入设备、总线等。
168.所称处理器100可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
169.存储器101可以是文字数字化处理设备10的内部存储单元,例如文字数字化处理设备10的硬盘或内存。存储器101也可以是文字数字化处理设备10的外部存储设备,例如文字数字化处理设备10上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器101还可以既包括文字数字化处理设备10的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及文字数字化处理设备所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
170.本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时可实现上述文字数字化处理方法。
171.本技术实施例提供了一种计算机程序产品,当计算机程序产品在文字数字化处理设备上运行时,使得文字数字化处理设备执行时实现可实现上述文字数字化处理方法。
172.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单
元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
173.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
174.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
175.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1