文本图像合成方法、文本图像合成装置和计算机设备与流程

文档序号：29612322发布日期：2022-04-13 09:54阅读：43来源：国知局

1.本发明涉及图像处理领域，尤其涉及一种文本图像合成方法、文本图像合成装置和计算机设备。

背景技术：

2.随着互联网的发展，图像处理与自然语言处理等人工智能的各个领域正在逐步结合。其中，自然语言处理中的文本可能来源于图像，而图像处理的对象也极有可能是文本图像，同属于人工智能的这两者正在密切结合。
3.使用主流的人工智能技术进行“深度学习”的前提是要有大量的数据，这些数据包括文本数据或者图像数据等。然而获取到大量的数据并不是那么容易的，相关技术中解决数据量少的问题，常用的做法是使用数据增强技术，然而数据增强并不能很好地增加数据的多样性和复杂性。
4.在利用ocr(optical character recognition，光学字符识别)训练模型对带有文字的图像进行识别训练时，仅通过数据增强技术获取原始训练数据，得到的模型的识别准确性不高。

技术实现要素：

5.为了解决上述技术问题或者至少部分地解决上述技术问题，本发明提供了一种文本图像合成方法、文本图像合成装置和计算机设备。
6.第一方面，本发明提供了一种文本图像合成方法，包括：
7.获取第一图像及第二图像，其中，所述第二图像包括文本；
8.根据所述第二图像对所述第一图像进行切割，以获得切割子图像；
9.根据所述切割子图像确定所述切割子图像在所述第二图像中的对应区域；
10.将所述切割子图像合成到所述第二图像的对应区域上，得到合成图像。
11.可选地，所述第一图像为印章图像或指纹图像。
12.可选地，所述根据所述第二图像对所述第一图像进行切割，以获得切割子图像包括：获取所述第二图像的图像高度和图像宽度；
13.根据所述图像高度从水平方向上对所述第一图像进行一次切割，得到第一子图像；
14.根据所述图像宽度从垂直方向上对所述第一子图像进行二次切割，得到切割子图像。
15.可选地，所述根据所述第二图像对所述第一图像进行切割，以获得切割子图像包括：获取所述第二图像的图像高度和图像宽度；
16.根据所述图像宽度从垂直方向上对所述第一图像进行一次切割，得到第一子图像；
17.根据所述图像高度从水平方向上对所述第一子图像进行二次切割，得到切割子图
像。
18.可选地，所述根据所述切割子图像确定所述切割子图像在所述第二图像中的对应区域，包括：
19.判断所述第一子图像是否仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端，并判断所述切割子图像是否仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端；
20.若所述第一子图像仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端，或所述切割子图像仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端，则确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包括一边沿与所述第二图像的对应边沿重合的区域；
21.否则，则所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致的任一区域。
22.可选地，确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包含一边沿与所述第二图像的对应边沿重合的区域，包括：
23.在所述第一子图像仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端时，将所述第一子图像包含的所述第一图像在与一次切割的切割方向垂直的方向上的一端作为第一参考端；
24.确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包括第一边沿与所述第二图像的对应边沿重合的区域，所述第一边沿为与所述第一参考端相对的一端的边沿。
25.可选地，确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包含一边沿与所述第二图像的对应边沿重合的区域，包括：
26.在所述切割子图像仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端时，将所述切割子图像包含的所述第一子图像在与二次切割的切割方向垂直的方向上的一端作为第二参考端；
27.确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且第二边沿与所述第二图像的对应边沿重合的位置，所述第二边沿为与所述第二参考端相对的一端的边沿。
28.可选地，所述获取第一图像包括：获取原始图像，对所述原始图像进行旋转和/或淡化，得到所述第一图像。
29.第二方面，本发明提供了一种文本图像合成装置，包括：
30.图像获取模块，所述图像获取模块用于获取第一图像及第二图像，其中，所述第二图像包括文本；
31.切割子图像模块，所述切割子图像模块用于根据所述第二图像对所述第一图像进行切割，以获得切割子图像；
32.对应区域模块，所述对应区域模块用于根据所述切割子图像确定所述切割子图像在所述第二图像中的对应区域；
33.合成图像模块，所述合成图像模块用于将所述切割子图像合成到所述第二图像的对应区域上，得到合成图像。
34.第三方面，本发明提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述方法的步骤。
35.本发明实施例提供的上述技术方案与现有技术相比具有如下优点：
36.本发明实施例提供的文本图像合成方法能够合成与现实情况相似度较高的合成图像，为后续通过深度学习识别文字内容带来更多符合实际的合成图像，有效减少合成图像的搜集和处理时间。且能够获得具有多样性和复杂性的且可以用于人工智能训练模型中的合成图像，解决了现有技术中人工智能训练模型过程中合成图像的数据不足的问题。
附图说明
37.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。
38.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
39.图1是本发明实施例提供的文本图像合成方法的流程示意图；
40.图2至图8是本发明实施例提供的文本合成方法的一具体实施方式示意图；
41.图9是本发明实施例提供的文本图像合成装置的结构示意图；
42.图10是本发明实施例提供的计算机设备的内部结构图。
具体实施方式
43.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
44.在利用ocr训练模型对带有文字的图像进行识别训练时，需要大量带有文字的图片作为原始数据，输入到ocr训练模型中进行训练，而这种原始数据在现实中不容易获得。例如，用户需要训练一个能识别覆盖有印章的文字内容的模型时，需要获取大量的已经在文字上盖有印章的图像作为原始数据，而由于这些原材料在现实中不容易获取，在原始数据较少的情况下容易会导致模型训练后的识别效果不佳，而导致后续模型训练准确性不高。
45.参考图1，本发明一实施例提供了一种文本图像合成方法，通过将第一图像进行切割后与第二图像进行合并，为人工智能训练模型提供具有多样性和复杂性的合成图像，解决了现有技术中文本图像不易获取的问题。具体方案如下所示：
46.图1为本实施例提供的文本图像合成方法的流程示意图，该方法用于终端对带有文本的图像进行处理的情况，该方法可以由移动终端来执行，该移动终端可以为智能手机、平板电脑、可穿戴设备、笔记本电脑等，该方法具体包括如下步骤：
47.s101：获取第一图像及第二图像，第二图像包括文本。
48.其中，第一图像可以是带图形的图像，也可以是带有文字和图形的图像。第一图像可以包括但不限于印章图像或指纹图像。第一图像可以通过程序自动生成，或者手动通过相应的软件生成，或直接从现实材料中提取。第二图像可以是随机合成的，第二图像可以是包含文字的文本图像。第二图像中的文字内容与第一图像中的文字内容可以相同，也可以不相同。
49.获取第一图像包括：判断第一图像的格式，对第一图像的格式进行转换。判断第一图像的格式，如果第一图像的格式不是jpg或者png格式，例如是gif格式，则将第一图像的格式进行转换，转换为jpg或者png格式。如果获取的第二图像的格式不是jpg或者png格式，也可以对第二图像的格式进行转换。这样，提高图像合成的成功率，减少由于格式不匹配导致合成的图像出现乱码。
50.具体地，当第一图像的格式不是jpg或png格式时，将第一图像的格式另存为jpg或png格式。当然，也可以将第一图像进行分帧，得到jpg或png格式的第一图像。jpg格式和png格式便于图像合成，且这两种格式的图像在合成时不容易出错，提高图像合成的效率。
51.获取第一图像还包括：获取原始图像，对原始图像进行旋转，得到第一图像。
52.具体地，获取第一图像包括：对第一图像进行旋转。实际生活中，第一图像中的文字或图形可能不是完全正立的状态，为了更加贴近实际的图像，可以对第一图像中的文字和图形进行一定幅度的旋转。这样，第一图像具有多样性和复杂性，从而使得合成图像也具有多样性和复杂性。旋转的角度可以随机设置，也可以每次旋转相同的角度。
53.具体地，获取第一图像包括：对第一图像的显示效果进行淡化处理。实际应用中，第一图像根据不同的使用情况，颜色的深浅会发生改变。但是通过相应的软件工具生成的第一图像，其颜色大部分是深红色或深蓝色，此时需要对第一图像进行淡化处理，以便获得具有多样性和复杂性的第一图像，从而使得合成图像具有多样性和复杂性。
54.在一具体实施例中，获取第一图像包括：获取原始图像，对原始图像进行旋转和淡化，得到第一图像。
55.在一种优选的实施方式中，第二图像中的文本仅包含一行文字，第二图像的图像高度及宽度与文本的高度及宽度相同。实际应用中，在现实获取的文本图像中，通常为多行文字，在进行模型训练时，还需要对文本图像中的每一行文字进行切割以得到仅包含一行文字的文本图像，并将该文本图像作为人工智能训练模型的原始材料。因此，在合成文本图像时，选择第二图像仅包含一行文字，且第二图像的图像高度合宽度与文本的高度和宽度相同，以使得合成出来的合成图像能够直接作为训练模型的原材料，省去对后续合成图像的处理。
56.s102：根据第二图像对第一图像进行切割，以获得切割子图像。
57.对第一图像进行切割主要考虑第二图像的图像高度和图像宽度，根据第二图像的图像高度和图像宽度对第一图像进行切割。
58.在第一种可选的实施方式中，步骤s102包括：
59.获取第二图像的图像高度和图像宽度；
60.根据图像高度从水平方向上对第一图像进行一次切割，得到第一子图像；
61.根据图像宽度从垂直方向上对第一子图像进行二次切割，得到切割子图像。
62.在这种实施方式中，第一子图像为横向切割图像。
63.为确保切割出有效的切割子图像，即切割子图像必须包含第一图像的图像信息，设定切割范围为从水平方向上对第一图像进行一次切割的切割范围在第一高度位置与第二高度位置之间，从垂直方向上对横向子图像进行二次切割的切割范围在第一水平位置到第二水平位置之间，第一高度为低于第一图像的底端一个图像高度的位置，第二高度为高于第一图像的顶端一个图像高度的位置，第一水平位置为位于横向子图像左侧且与横向子图像的左端相距一个图像宽度的位置，第二水平位置为位于横向子图像右侧且与横向子图像的右端相距一个图像宽度的位置。
64.经过上述步骤进行切割后，若横向子图像仅包含第一图像的顶端或底端中的一个，则切割子图像的高度小于或等于图像高度，且横向子图像为第一图像的一部分图像，若横向子图像不包含第一图像的顶端和底端，则切割子图像的高度等于图像高度，且横向子图像为第一图像的一部分图像，若横向子图像包含第一图像的顶端和底端，则切割子图像的高度小于或等于图像高度，且横向子图像为第一图像的全部图像；同理，若切割子图像仅包含横向子图像的左端或右端中的一个，则切割子图像的宽度小于或等于图像宽度，且切割子图像为横向子图像的一部分图像，若切割子图像不包含第一子图像的左端和右端，则切割子图像的宽度等于图像宽度，且切割子图像为横向子图像的一部分图像，若切割子图像包含第一子图像的左端和右端，则切割子图像的宽度小于或等于图像宽度，且切割子图像为横向子图像的全部图像。
65.在第二种可选的实施方式中，步骤s102包括：
66.获取第二图像的图像高度和图像宽度；
67.根据图像宽度从垂直方向上对第一图像进行一次切割，得到第一子图像；
68.根据图像高度从水平方向上对第一子图像进行二次切割，得到切割子图像。
69.这时，第一子图像为纵向切割图像。
70.为确保切割出有效的切割子图像，设定切割范围为从垂直方向上对第一图像进行一次切割的切割范围在第一水平位置与第二水平位置之间，从水平方向上对纵向子图像进行二次切割的切割范围在第一高度位置到第二高度位置之间，第一水平位置为位于第一图像左侧且与第一图像的左端相距一个图像宽度的位置，第二水平位置为位于第一图像右侧且与第一图像的右端相距一个图像宽度的位置，第一高度为低于纵向子图像的底端一个图像高度的位置，第二高度为高于纵向子图像的顶端一个图像高度的位置。
71.经过上述切割步骤后，切割子图像的高度与图像高度的关系构成、切割子图像的宽度与图像宽度的关系构成、切割子图像与第一图像的关系构成与上述第一种可选的实施方式的原理一致，此处不再赘述。
72.因此，对第一图像进行切割，可以先从水平方向上对第一图像进行切割，然后再从垂直方向上对切割后的第一图像再进行切割。当然，也可以先从垂直方向上对第一图像进行切割，然后再从水平方向上对切割后的第一图像进行切割。这两种切割方式均可以实现对第一图像的切割。
73.应当知晓的是，对第一图像进行切割的原理为：图像的本质是数学中的数组或称为矩阵，通过获取矩阵的不同行列可以达到获取图像的不同部分的目的。
74.s103：根据切割子图像确定切割子图像在第二图像中的对应区域。
75.具体地，步骤s103包括子步骤：
76.判断第一子图像是否仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一端，并判断切割子图像是否仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端；
77.若第一子图像仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一端，或切割子图像仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端，则确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括一边沿与第二图像的对应边沿重合的区域；
78.否则，则确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致的任一区域。
79.对应上述第一种可选的实施方式，上述“判断第一子图像是否仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一端，并判断切割子图像是否仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端”步骤具体为：
80.判断横向切割图像是否仅包含第一图像的顶端或底端中的其中一端，并判断切割子图像是否仅包含横向切割图像的左端或右端中的其中一端。
81.对应上述第二种可选的实施方式，上述“判断第一子图像是否仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一端，并判断切割子图像是否仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端”步骤具体为：
82.判断纵向切割图像是否仅包含第一图像的左端或右端中的其中一端，并判断切割子图像是否仅包含纵向切割图像的顶端或底端中的其中一端。
83.在判断切割子图像在第二图像中的对应区域时，需要根据切割子图像中包含的图像信息来确定，当第一子图像仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一端，或切割子图像仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端时，表明切割子图像中有部分图像被切割掉且在现实图像中该切割边沿会与第一图像的对应边沿重合，因此，确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括一边沿与第二图像的对应边沿重合的区域。
84.当遇到其他情况，即第一子图像包含第一图像在与一次切割的切割方向垂直的方向上的两端且切割子图像包含第一子图像在与二次切割的切割方向垂直的方向上的两端，或第一子图像包含第一图像在与一次切割的切割方向垂直的方向上的两端且切割子图像不包含第一子图像在与二次切割的切割方向垂直的方向上的任何一端，或第一子图像不包含第一图像在与一次切割的切割方向垂直的方向上的任何一端且切割子图像包含第一子图像在与二次切割的切割方向垂直的方向上的两端，或第一子图像不包含第一图像在与一次切割的切割方向垂直的方向上的任何一端且切割子图像不包含第一子图像在与二次切割的切割方向垂直的方向上的任何一端时，说明此时切割子图像可以至于第二图像中与其大小相同的任一区域，因此确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致的任一区域。
85.具体地，确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包含一边沿与第二图像的对应边沿重合的区域，包括：
86.在第一子图像仅包含第一图像在与一次切割的切割方向垂直的方向上的其中一
端时，将第一子图像包含的第一图像在与一次切割的切割方向垂直的方向上的一端作为第一参考端；
87.确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括第一边沿与第二图像的对应边沿重合的区域，第一边沿为与第一参考端相对的一端的边沿。
88.若基于上述第一种可选的实施方式，上述步骤具体为：
89.在横向子图像仅包含第一图像顶端时，将顶端作为第一参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括下边沿与第二图像的下边沿重合的区域。与顶端相对的一端为底端，底端对应的边沿为下边沿。
90.在横向子图像仅包含第一图像底端时，将底端作为第一参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括上边沿与第二图像的上边沿重合的区域。与底端相对的一端为顶端，顶端对应的边沿为上边沿。
91.若基于第二种可选的实施方式，上述步骤具体为：
92.在纵向子图像仅包含第一图像左端时，将左端作为第一参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括右边沿与第二图像的右边沿重合的区域。与左端相对的一端为右端，右端对应的边沿为右边沿。
93.在纵向子图像仅包含第一图像右端时，将右端作为第一参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包括左边沿与第二图像的左边沿重合的区域。与右端相对的一端为左端，左端对应的边沿为左边沿。
94.具体地，确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且至少包含一边沿与第二图像的对应边沿重合的区域，包括：
95.在切割子图像仅包含第一子图像在与二次切割的切割方向垂直的方向上的其中一端时，将切割子图像包含的第一子图像在与二次切割的切割方向垂直的方向上的一端作为第二参考端；
96.确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且第二边沿与第二图像的对应边沿重合的位置，第二边沿为与第二参考端相对的一端的边沿。
97.若基于上述第一种可选的实施方式，上述步骤具体为：
98.在切割子图像仅包含横向子图像的左端时，将左端为第二参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且右边沿与第二图像的右边沿重合的位置。与左端相对的一端为右端，右端对应的边沿为右边沿。
99.在切割子图像仅包含横向子图像的右端时，将右端为第二参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且左边沿与第二图像的左边沿重合的位置。与右端相对的一端为左端，左端对应的边沿为左边沿。
100.若基于第二种可选的实施方式，上述步骤具体为：
101.在切割子图像仅包含纵向子图像的顶端时，将顶端为第二参考端；确定切割子图像在第二图像中的对应区域为第二图像中与切割子图像大小一致且下边沿与第二图像的下边沿重合的位置。与顶端相对的一端为底端，底端对应的边沿为下边沿。
102.在切割子图像仅包含纵向子图像的底端时，将底端为第二参考端；确定切割子图
像在第二图像中的对应区域为第二图像中与切割子图像大小一致且上边沿与第二图像的上边沿重合的位置。与底端相对的一端为顶端，顶端对应的边沿为上边沿。
103.为了能充分说明根据切割子图像包含的图像特征确定切割子图像在第二图像的对应区域的相关技术特征，此处将基于第一种可选的实施方式的基础上进行举例说明：
104.1、若横向子图像包含第一图像的顶端及底端，且切割子图像包含横向子图像的左端及右端，则表明此时切割子图像的高度小于图像高度且宽度小于图像宽度，同时也表明，该切割子图像包含第一图像的全部图像信息，此时，该切割子图像可至于第二图像中与切割子图像大小一致的任一区域；
105.2、若横向子图像不包含第一图像的顶端及底端，且切割子图像不包含横向子图像的左端及右端，则表明切割子图像的高度等于图像高度且宽度等于图像宽度，同时也表明，第一图像的高度大于图像高度，第一图像的宽度大于图像宽度，横向子图像包含第一图像的中间部分信息，切割子图像包含横向子图像的中间部分信息，此时，该切割子图像在第二图像中的对应区域为第二图像，也就是与该切割子图像大小一致的区域；
106.3、若横向子图像不包含第一图像的顶端及底端，且切割子图像包含横向子图像的左端及右端，则表明切割子图像的高度等于图像高度且宽度小于或等于图像宽度，同时也表明，横向子图像包含第一图像的中间部分信息，切割子图像包含完整的横向子图像的图像信息，此时，该切割子图像在第二图像中对应区域为与切割子图像大小一致的任一区域；
107.4、若横向子图像包含第一图像的顶端及底端，且切割子图像不包含横向子图像的左端及右端，则表明切割子图像的高度小于等于图像高度且宽度等于图像宽度，同时也表明，横向子图像包含完整的第一子图像的图像信息，切割子图像包含横向子图像的中间部分信息，此时，该切割子图像在第二图像中对应区域为与切割子图像大小一致的任一区域；
108.5、若横向子图像仅包含第一图像的顶端，且切割子图像包含横向子图像的左端及右端，则表明切割子图像的高度小于图像高度且宽度小于等于图像宽度，此时，横向子图像包含第一图像的部分图像，切割子图像包含横向子图像的全部图像，由于仅出现了第一图像的顶端，在实际中该切割子图像的下边沿会与第二图像的下边沿重合，因此该切割子图像在第二图像中对应区域为第二图像中与切割子图像大小一致且下边沿与第二图像的下边沿重合的区域；
109.6、若横向子图像仅包含第一图像的顶端，且切割子图像仅包含横向子图像的左端，则表明切割子图像的高度小于图像高度且宽度小于图像宽度，此时，横向子图像包含第一图像的部分图像，切割子图像包含横向子图像的部分图像，由于仅出现了第一图像的顶端，在实际中该切割子图像的下边沿会与第二图像的下边沿重合，同时由于仅出现了横向图像的左端，在实际中该切割子图像的右边沿会与第二图像的右边沿重合，因此该切割子图像在第二图像中对应区域为第二图像中与切割子图像大小一致、下边沿与第二图像的下边沿重合且右边沿与第二图像的右边沿重合的区域。
110.由于横向子图像仅包含第一图像的底端的情况与上述横向子图像仅包含第一图像的底端的情况相似，原理相同，此处将不再赘述。可以理解的是，基于第二种可选的实施方式时，根据切割子图像包含的图像特征确定切割子图像在第二图像的对应区域的方法与上述基于第一种可选的实施方式的方法相同，此处将不再赘述。
111.需要说明的是，这里的顶端、底端、左端和右端，按顺时针方向，从顶端开始，依次
是右端、底端和左端。
112.通过以上方法，获得的合成图像具有较高的真实性，且将合成图像作为训练数据，符合实际训练模型对数据的要求，提高模型训练的准确性。
113.实际应用中，可以设定人工智能训练模型所需要的合成图像的像素为32*280，切割后的切割子图像的高度不大于32像素，切割子图像的宽度并未采取限制。传统的图像合成要求合成的各个图像具有相同的尺寸，即宽、高、像素均相同。本实施例中利用了传统的图像合成，同时使得合成的多张图像相对于使用场景而言无需改变尺寸。
114.具体实现如下：根据切割子图像确定切割子图像在第二图像中的对应区域包括：分别将切割子图像的高度和宽度与第二图像的图像高度和图像宽度进行锁定。
115.合成图像的高度及宽度由第二图像的图像高度和图像宽度与切割子图像的宽度和高度共同决定。因此，需要先锁定切割子图像与第二图像对应的部分，然后再进行切割子图像与第二图像的合成。
116.首先需要在第二图像中锁定图像高度和图像宽度的起始h_start(w_start)及结束h_end(w_end)位置，起始位置和结束位置均随机产生。
117.s104：将切割子图像合成到第二图像的对应区域上，得到合成图像。
118.具体合成时，可将第二图像的对应区域进行切割，得到对应区域图像及其他区域图像，将对应区域图像与切割子图像先合成，后将合成得到的合成切割图像与其他区域图像结合，得到合成图像。
119.图1为一个实施例中文本图像合成方法的流程示意图。应该理解的是，虽然图1的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
120.在本实施例一具体实施方式中，参考图2至图8。获取第一图像，第一图像如图2所示。获取第二图像，第二图像如图3所示，第二图像包含文本。对第一图像进行一定角度的旋转，得到旋转后的第一图像，如图4所示。对旋转后的第一图像进行切割及颜色淡化后的得到的多个切割子图像，如图5a至图5c所示。获取需要合并的切割子图像，将需要合并的切割子图像与第二图像的对应区域进行合并，得到合成切割图像，如图7所示。将合成切割图像替换第二图像的对应区域，获得合成图像，即为训练模型所需要的文本图像，如图8所示。本发明能够合成与现实情况相似度较高的合成图像，为后续通过深度学习识别文字内容带来更多符合实际的合成图像，有效减少合成图像的搜集和处理时间。
121.在一个实施例中，如图9所示，提供了一种文本图像合成装置，包括：
122.图像获取模块100，图像获取模块100用于获取第一图像及第二图像，其中，第二图像包括文本；
123.切割子图像模块200，切割子图像模块200用于根据第二图像对第一图像进行切割，以获得切割子图像；
124.对应区域模块300，对应区域模块300用于根据切割子图像确定切割子图像在第二
图像中的对应区域；
125.合成图像模块400，合成图像模块400用于将切割子图像合成到第二图像的对应区域上，得到合成图像。
126.具体地，所述第一图像为印章图像或指纹图像。
127.具体地，所述切割子图像模块200包括：
128.图像获取子模块，用于获取所述第二图像的图像高度和图像宽度；
129.一次切割子模块，用于根据所述图像高度从水平方向上对所述第一图像进行一次切割，得到第一子图像；
130.二次切割子模块，用于根据所述图像宽度从垂直方向上对所述第一子图像进行二次切割，得到切割子图像。
131.具体地，切割子图像模块200包括：
132.图像获取子模块，用于获取所述第二图像的图像高度和图像宽度；
133.一次切割子模块，用于根据所述图像宽度从垂直方向上对所述第一图像进行一次切割，得到第一子图像；
134.二次切割子模块，用于根据所述图像高度从水平方向上对所述第一子图像进行二次切割，得到切割子图像。
135.具体地，对应区域模块300包括：
136.判断子模块，用于判断所述第一子图像是否仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端，并判断所述切割子图像是否仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端；
137.第一区域确定子模块，用于若所述第一子图像仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端，或所述切割子图像仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端，则确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包括一边沿与所述第二图像的对应边沿重合的区域；
138.第二区域确定子模块，用于否则，则所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致的任一区域。
139.具体地，第一区域确定子模块包括：
140.第一参考端确定子模块，用于在所述第一子图像仅包含所述第一图像在与一次切割的切割方向垂直的方向上的其中一端时，将所述第一子图像包含的所述第一图像在与一次切割的切割方向垂直的方向上的一端作为第一参考端；
141.第一确定模块，用于确定所述切割子图像在所述第二图像中的对应区域为所述第二图像中与所述切割子图像大小一致且至少包括第一边沿与所述第二图像的对应边沿重合的区域，所述第一边沿为与所述第一参考端相对的一端的边沿。
142.具体地，第一区域确定子模块包括：
143.第二参考端确定子模块，用于在所述切割子图像仅包含所述第一子图像在与二次切割的切割方向垂直的方向上的其中一端时，将所述切割子图像包含的所述第一子图像在与二次切割的切割方向垂直的方向上的一端作为第二参考端；
144.第二确定模块，用于确定所述切割子图像在所述第二图像中的对应区域为所述第
二图像中与所述切割子图像大小一致且第二边沿与所述第二图像的对应边沿重合的位置，所述第二边沿为与所述第二参考端相对的一端的边沿。
145.具体地，图像获取模块100包括：
146.第一图像获取子模块，用于获取第一图像；
147.第二图像获取子模块，用于获取第二图像。
148.具体地，第一图像获取子模块具体用于：
149.获取原始图像，对所述原始图像进行旋转和/或淡化，得到所述第一图像。
150.本发明实施例的文本图像合成装置与上述文本图像合成方法实施例的技术特征的作用及原理一一对应，此处将不再赘述。
151.图10示出了一个实施例中计算机设备的内部结构图。如图10所示，该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现文本图像合成方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行文本图像合成方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。
152.本领域技术人员可以理解，图10中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
153.在一个实施例中，本发明提供的文本图像合成装置可以实现为一种计算机程序的形式，计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该文本图像合成装置的各个程序模块，比如，图9所示的图像获取模块、切割子图像模块、对应区域模块和合成图像模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本发明各个实施例的文本图像合成方法中的步骤。
154.在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：
155.获取第一图像及第二图像，其中，第二图像包括文本；
156.根据第二图像对第一图像进行切割，以获得切割子图像；
157.根据切割子图像确定切割子图像在第二图像中的对应区域；
158.将切割子图像合成到第二图像的对应区域上，得到合成图像。
159.在一个实施例中，处理器执行计算机程序时还实现上述方法实施例的步骤，在此不再赘述。
160.在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：
161.获取第一图像及第二图像，其中，第二图像包括文本；
162.根据第二图像对第一图像进行切割，以获得切割子图像；
163.根据切割子图像确定切割子图像在第二图像中的对应区域；
164.将切割子图像合成到第二图像的对应区域上，得到合成图像。
165.在一个实施例中，计算机程序被处理器执行时还实现上述方法实施例的步骤，在此不再赘述。
166.在一个实施例中，提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机指令，计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行以下步骤：
167.获取第一图像及第二图像，其中，第二图像包括文本；
168.根据第二图像对第一图像进行切割，以获得切割子图像；
169.根据切割子图像确定切割子图像在第二图像中的对应区域；
170.将切割子图像合成到第二图像的对应区域上，得到合成图像。
171.在一个实施例中，计算机程序产品或计算机程序执行时还实现上述方法实施例的步骤，在此不再赘述。
172.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
173.需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
174.以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李存林
技术所有人：广州慧睿思通人工智能技术有限公司
我是此专利的发明人

上一篇：一种提高有机硅乳液稳定性的方法与流程
上一篇：咪唑啉酮衍生物及其在医药上的应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。