一种输入图像的生成方法、装置、电子设备及存储介质与流程

文档序号：23349328发布日期：2020-12-18 16:53阅读：65来源：国知局

本申请涉及计算机技术领域，尤其涉及信息交互、图像处理及图像识别技术领域，具体涉及一种输入图像的生成方法、装置、电子设备及存储介质。

背景技术：

随着移动互联网技术的发展，手机等智能终端的出现使得沟通变得越来越便利，在沟通的过程中，利用智能终端在网页和应用中进行输入和输出已经变得非常地普遍。

发明人在实现本发明的过程中，发现，目前智能终端上的输入法主要支持文字和语音的编辑，以及发送已有的图片和表情等内容。但是有些场景可能需要输入一些随意的内容才有利于信息的呈现和表达，而单一的文字或表情输入却很难满足上述需求，聊天人需要一定的表达技巧或者经过多轮交互才能准确表达，这会增加聊天人之间的交流成本，增加沟通时间。

技术实现要素：

本申请实施例提供了一种输入图像的生成方法、装置、电子设备及存储介质。

根据本申请实施例的第一方面，提供了一种输入图像的生成方法，包括：

获取输入轨迹图像；

在所述输入轨迹图像中，识别文字轨迹区域，并生成与所述文字轨迹区域中的文字内容匹配的文字；

将所述文字与所述输入轨迹图像进行融合，得到目标融合图像。

根据本申请实施例的第二方面，提供了一种输入图像的生成装置，包括：

输入轨迹图像获取模块，用于获取输入轨迹图像；

字轨迹区域识别模块，用于在所述输入轨迹图像中，识别文字轨迹区域，并生成与所述文字轨迹区域中的文字内容匹配的文字；

目标融合图像生成模块，用于将所述文字与所述输入轨迹图像进行融合，得到目标融合图像。

根据本申请实施例的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任意实施例提供的一种输入图像的生成方法。

根据本申请实施例的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请任意实施例提供的一种输入图像的生成方法。

本申请实施例的技术方案可以在输入法场景下，大大提高了用户的沟通自由度，降低了沟通成本，提高了沟通效率。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例的一种输入图像的生成方法的示意图；

图2是根据本申请实施例的一种输入图像的生成方法的示意图；

图3是根据本申请实施例的一种输入图像的生成方法的示意图；

图4a是根据本申请实施例的一种输入图像的生成方法的示意图；

图4b是可以实现本申请实施例的一种输入图像的生成方法的场景图；

图4c是可以实现本申请实施例的一种输入图像的生成方法的场景图；

图4d是可以实现本申请实施例的一种输入图像的生成方法的场景图；

图4e是可以实现本申请实施例的一种输入图像的生成方法的场景图；

图5是根据本申请实施例的一种输入图像的生成装置的示意图；

图6是用来实现本申请实施例的输入图像的生成方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1为本申请实施例提供的一种输入图像的生成方法的流程图，本申请实施例可适用于用户通过人工绘制的方式生成输入图像的情形，该方法可以由输入图像的生成装置来执行，该装置可以由软件和/或硬件来实现，并一般可以集成在具备轨迹图像输入功能的电子设备中，所述方法具体包括如下步骤：

步骤110、获取输入轨迹图像。

在此步骤中，用户可以在电子设备提供的轨迹图像输入界面中自由绘制各种轨迹，以形成图形、文字或者表情等特定信息载体。

相应的，当输入法检测到用户在该轨迹图像输入界面中进行连续的轨迹输入操作(例如，通过触摸的方式，或者通过鼠标点击滑动的方式等)后，获取用户在输入界面中的滑动轨迹，并根据连续的滑动轨迹，生成输入轨迹图像。

步骤120、在输入轨迹图像中，识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字。

在此步骤中，可选的，可以采用图像识别技术识别输入轨迹图像中包括的文字轨迹区域，然后采用光学字符识别技术识别文字轨迹区域中包括的文字内容，并生成与所述文字内容匹配的文字。

其中，所述文字可以是指设定规范字体或者规范字号的文字内容，其中，设定规范字体或字号包括使用频率较高的标准字体或字号，以及使用频率较低的其他字体或字号，且所述文字的字体和字号可以由用户进行设定。

由此，通过识别文字轨迹区域，并生成匹配的文字，可以实现输入轨迹图像中文字内容的规范化显示，提高用户的阅读体验。

需要再次强调的是，本申请实施例虽然开放了用户自由输入所需内容的权限，用户可以以最大的自由度输入各种轨迹以形成图形和文字，但是为了最大程度的保证输入轨迹图像的规整性，便于信息接收方的查看，或者用户自己的查看，创造性的提出了对输入轨迹图像进行文字内容的规整化处理，在保证用户自由输入各种图形的同时，也保证了文字的可读性(或者说可识别性)与规范性，最大程度的降低了歧义的出现。

步骤130、将文字与输入轨迹图像进行融合，得到目标融合图像。

图像融合，是指将多源信道所采集到的关于同一目标的图像数据经过图像处理和计算机技术等，最大限度的提取各自信道中的有利信息，最后综合成高质量的图像。在本实施例中，文字为输入轨迹图像中的文字轨迹区域内的规整化表达，通过将文字与输入轨迹图像进行融合，可以在保证用户输入自由度的基础上，最大程度的保证目标融合图像的规整化。

在此步骤中，可选的，可以将文字对应覆盖于所述输入轨迹图像中的文字轨迹区域之上，得到该目标融合图像，以实现使用文字对输入轨迹图像中文字轨迹区域的替换。

也即，该目标融合图像中同时包括了用户自由绘制的各种图形，以及用户自定义的规范格式的文字内容。

本申请实施例通过获取输入轨迹图像，然后在输入轨迹图像中，识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字，将文字与输入轨迹图像进行融合，得到目标融合图像的技术手段，提供了一种便于用户自由生成输入图像的方式，可以使用户之间的沟通内容更为直观，提高了用户的沟通自由度，在降低沟通成本的同时，提高了沟通效率。

本申请实施例在上述实施例的基础上，提供了获取输入轨迹图像的可选实施方式。与上述实施例相同或相应的术语解释，本申请实施例不再赘述。

图2为本申请实施例提供的一种输入图像的生成方法的流程图，本实施例的方法具体包括如下步骤：

步骤210、响应于在绘图画布中实时接收到的交互轨迹，获取输入轨迹图像。

在此步骤中，绘图画布为用户绘制输入图像的界面，所述绘图画布可以为用户提供调节笔刷大小、设置笔刷颜色以及橡皮擦等功能。

由此，当用户想要绘制输入图像时，通过设置专属的绘图画布，可以满足用户不同的绘图需求，便于获取用户的输入轨迹图像，提高输入轨迹图像的获取效率。

在本实施例中，可选的，可以将绘图画布中的触控轨迹或者光标滑动轨迹作为交互轨迹，将连续的交互轨迹进行连接，生成输入轨迹图像。

步骤220、在输入轨迹图像中，识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字。

在本申请实施例的一个实施方式中，在输入轨迹图像中，识别文字轨迹区域，包括：如果检测到输入轨迹图像在设定时长内未发生变化，则在输入轨迹图像中，识别文字轨迹区域。

其中，可选的，当检测到在设定时长内绘图画布中没有发生触控操作或者没有光标滑动时，可以确认输入轨迹图像未发生变化。

这样设置的好处在于：避免在输入轨迹图像发生变化的过程中，识别文字轨迹区域导致识别结果出现错误的问题，进而可以提高文字轨迹区域识别的准确率。

步骤230、将所述文字与所述输入轨迹图像进行融合，得到目标融合图像。

在本实施例中，可选的，在将文字与输入轨迹图像进行融合，得到目标融合图像之后，还可以包括：在绘图画布中，更新显示目标融合图像。

这样设置的好处是：便于用户在输入图像之前，对生成好的目标融合图像进行检查，避免文字生成错误，导致沟通内容出现偏差的问题。

本申请实施例通过响应于在绘图画布中实时接收到的交互轨迹，获取输入轨迹图像，在输入轨迹图像中识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字，将文字与输入轨迹图像进行融合，得到目标融合图像的技术手段，提供了一种便于用户自由生成输入图像的方式，可以满足用户不同的绘图需求，使用户之间的沟通内容更为直观，提高了用户的沟通自由度，在降低沟通成本的同时，提高了沟通效率。

在上述各实施例的基础上，在响应于在绘图画布中实时接收到的交互轨迹，获取输入轨迹图像之前，还包括：

响应于图像编辑指令，将与图像编辑指令匹配的待编辑图像传递至绘图画布，并对绘图画布进行展示。

其中，如果用户在沟通过程中发现本地存储与用户想要表达的想法相接近的图像，或者想要对已经输入的图像进行再次编辑时，用户可以通过屏幕截图或者直接选择图像的方式，选中待编辑的图像，然后为用户所选择的图像提供图像编辑选项，当用户选择该图像编辑选项时，触发生成图像编辑指令，并将该待编辑图像传递至所述绘图画布，并对绘图画布进行展示。

这样设置的好处是：简化用户的绘图流程，节省用户重新绘图所消耗的时间，提高用户的沟通效率。

在上述各实施例的基础上，响应于在绘图画布中实时接收到的交互轨迹，生成输入轨迹图像，可以包括：响应于在绘图画布中实时接收到的交互轨迹，获取交互轨迹在绘图画布中的作用像素位置；根据作用像素位置，更新与绘图画布匹配的像素矩阵，并根据更新后的像素矩阵，生成输入轨迹图像。

其中，作用像素位置为交互轨迹上每个像素点在绘图画布中的位置，可选的，可以根据作用像素位置以及用户在绘图画布中选择的当前笔刷颜色，更新与绘图画布匹配的像素矩阵，根据更新后的像素矩阵中各像素点的颜色值，生成输入轨迹图像。

这样设置的好处是：满足用户不同的绘图需求，提高用户的绘图体验。

其中，绘图画布可以对应一个像素矩阵，绘制画布中的不同位置，对应像素矩阵中不同像素点的像素值，进而，当用户对绘图画布上绘制输入轨迹时，可以相应调整该像素矩阵中对应位置的像素值，以最终通过该像素矩阵，表征用户的输入轨迹图像。

可选的，根据作用像素位置，更新与绘图画布匹配的像素矩阵，可以包括：在与绘图画布匹配的像素矩阵中，将作用像素位置处的各像素点的颜色值设置为绘图颜色。

其中，绘图颜色可以为用户选择的当前笔刷颜色，不同于绘图画布的背景颜色。

这样设置的好处是：将输入轨迹图像的颜色值与绘图画布背景颜色值进行区分，便于迅速获取输入轨迹图像。

本申请实施例在上述实施例的基础上，提供了获取输入轨迹图像和识别文字轨迹区域，并生成匹配的文字的一种可选实施方式。与上述实施例相同或相应的术语解释，本申请实施例不再赘述。

图3为本申请实施例提供的一种输入图像的生成方法的流程图，本实施例的方法具体包括如下步骤：

步骤310、在输入法的输入界面中，获取输入轨迹图像。

在此步骤中，输入法为将各种符号输入电子设备而采用的编码方法，电子设备可以为计算机或者其他智能终端，例如手机、平板等。一般来说，当用户通过电子设备中的聊天应用与其他用户进行信息交互时，需要使用系统自带的原生输入法，或者安装的输入法应用，实现信息的输入。

其中，所述输入法的输入界面具体是指用户输入信息的界面，该输入界面可以根据用户选择的信息输入形式，展现不同类型的辅助输入控件，例如，手写输入板、九宫格键盘或者全键盘等。

在本实施例中，扩充了输入法的输入形式，用户可以通过输入法提供的输入界面输入用户自由绘制的轨迹图像。

在一个可选的实施方式中，当用户通过聊天软件与其他人进行信息交互的过程中，如果用户想要绘制输入图像，例如：某种定制化窗户的样式，可以在输入法的设置栏中选择绘制图像的功能，通过输入法输入界面提供的绘图区域或者绘图控件，进行绘制图像。

在本申请实施例的一个实施方式中，在输入法的输入界面中，获取输入轨迹图像，可以包括：在输入法的输入界面中，展现绘图画布；响应于在所述绘图画布中实时接收到的交互轨迹，生成所述输入轨迹图像。

其中，在输入法的输入界面中，展现绘图画布，可以包括：响应于在输入法的输入界面中收到的绘图输入指令，展现绘图画布。

这样设置的好处是：避免绘图画布一直展现在输入界面中，降低用户的视觉体验。

可选的，输入法可以在现有的信息输入形式(手写，九宫格或者全键盘等)的基础上，增加绘图输入形式的选项，当用户选择使用绘图输入的按钮或者控件时，触发生成该绘图输入指令，进而在输入法的输入界面中，展现用于接收用户轨迹数据的绘图画布。

步骤320、将输入轨迹图像输入至预先训练的文字区域识别引擎中，并根据文字区域识别引擎的输出结果，获取文字轨迹区域。

其中，文字轨迹区域识别引擎用于识别文字轨迹区域在输入图像中的位置以及尺寸值。

在此步骤中，将输入轨迹图像输入至文字区域识别引擎后，文字区域识别引擎根据输入轨迹图像识别出疑似文字，并计算出疑似文字在输入轨迹图像中覆盖的最小矩形区域，将此矩形区域作为与输入轨迹图像对应的文字轨迹区域，并将该文字轨迹区域的长度、宽度以及坐标进行输出。

其中，在将输入轨迹图像输入至文字区域识别引擎之前，获取到多张携带文字内容的图像样本，将多张图像样本划分为训练数据集和测试数据集，使用训练数据集和测试数据集对神经网络模型进行迭代训练，得到所述文字区域识别引擎。

这样设置的好处在于：保证文字轨迹区域识别的准确性，为后续文字识别提供技术基础。

在本实施例中，可选的，文字区域识别引擎配置于客户端中。

这样设置的好处在于：使客户端具备识别文字轨迹区域的功能，避免客户端与服务器进行频繁交互，提高了文字轨迹区域的识别效率。

步骤330、将文字轨迹区域输入至光学字符识别解析器中，获取与文字轨迹区域对应的文字内容，并生成与文字内容对应的文字。

在此步骤中，光学字符识别解析器用于识别文字轨迹区域中包括的文字。

这样设置的好处在于：保证文字识别的准确性，提高用户之间的沟通效率。

步骤340、将文字与输入轨迹图像进行融合，得到目标融合图像。

本申请实施例通过在输入法的输入界面中，获取输入轨迹图像，将输入轨迹图像输入至预先训练的文字区域识别引擎中，并根据文字区域识别引擎的输出结果，获取文字轨迹区域，将文字轨迹区域输入至光学字符识别解析器中，获取与文字轨迹区域对应的文字内容，并生成与文字内容对应的文字，将文字与输入轨迹图像进行融合，得到目标融合图像的技术手段，提供了一种便于用户自由生成输入图像的方式，可以使用户之间的沟通内容更为直观，保证文字内容识别的准确性，大大扩充了输入法的功能，提高了用户的沟通自由度，在降低沟通成本的同时，提高了沟通效率。

在上述各实施例的基础上，在将文字与输入轨迹图像进行融合，得到目标融合图像之后，还包括：响应于图像选定指令，将目标融合图像拖拽至输入法所适配的聊天应用的信息输入框中；响应于信息发送指令，将信息输入框中的目标融合图像发送至匹配的目标聊天方。

其中，如果用户确定要发送目标融合图像，则在绘图画布中选定该目标融合图像，当检测到用户触发的图像选定指令时，将该目标融合图像拖拽至信息输入框中，当检测到用户触发信息发送指令时，将目标融合图像发送至目标聊天方。

这样设置的好处在于：便于用户对目标融合图像发送之前，核对目标融合图像是否正确，进而保证沟通内容的准确性。

本申请实施例在上述实施例的基础上，提供了将文字与输入轨迹图像进行融合，得到目标融合图像的一种可选实施方式。与上述实施例相同或相应的术语解释，本申请实施例不再赘述。

图4a为本申请实施例提供的一种输入图像的生成方法的流程图，本实施例的方法具体包括如下步骤：

步骤410、获取输入轨迹图像。

步骤420、在输入轨迹图像中，识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字。

步骤430、生成与文字对应的文字图层。

步骤440、根据文字图层与文字轨迹区域之间的尺寸比例关系，对文字图层进行缩放处理。

在此步骤中，可选的，可以按照文字图层与文字轨迹区域之间的尺寸比例关系，对文字图层的尺寸进行调整。例如，当文字图层的长度或者宽度大于文字轨迹区域的长度或宽度时，则将文字图层中文字的字体缩小成与文字轨迹区域尺寸匹配的字体。

这样设置的好处在于：保证文字图层中文字的尺寸更接近用户实际输入的文字尺寸，提高后续生成的目标融合图像的真实性。

步骤450、使用缩放处理后的文字图层，替换输入轨迹图像中的文字轨迹区域，得到目标融合图像。

在此步骤中，可选的，可以获取文字图层中各像素点的像素值，利用文字图层中各像素点的像素值替换文字轨迹区域中对应位置的像素点的像素值，得到目标融合图像。

这样设置的好处在于：保证目标融合图像的美观性，提高用户的阅读体验。

在本申请实施例的一个实施方式中，使用缩放处理后的文字图层，替换输入轨迹图像中的文字轨迹区域，得到所述目标融合图像，包括：将输入轨迹图像中文字轨迹区域内各像素点的颜色值，恢复为文字轨迹区域内的区域颜色值；将与文字轨迹区域匹配的文字图层，填充于文字轨迹区域中。

其中，文字轨迹区域内的区域颜色值为文字轨迹区域的背景颜色值，将文字轨迹区域内各像素点的颜色值，恢复为文字轨迹区域内的区域颜色值后，文字轨迹区域内的文字则被清空，然后将匹配的文字图层，填充于文字轨迹区域中，可以完成文字图层对文字轨迹区域的替换。

这样设置的好处在于：通过清空文字轨迹区域内的文字，可以保证良好的替换效果；其次，将文字图层直接填充于文字轨迹区域中，可以迅速完成文字图层对文字轨迹区域的替换，提高替换效率。

本申请实施例通过获取输入轨迹图像，在输入轨迹图像中，识别文字轨迹区域，并生成与文字轨迹区域中的文字内容匹配的文字，生成与文字对应的文字图层，根据文字图层与文字轨迹区域之间的尺寸比例关系，对文字图层进行缩放处理，并使用缩放处理后的文字图层，替换输入轨迹图像中的文字轨迹区域，得到目标融合图像的技术手段，提供了一种便于用户自由生成输入图像的方式，可以使用户之间的沟通内容更为直观，保证文字内容识别的准确性，提高了用户的沟通自由度，在降低沟通成本的同时，提高了沟通效率。

为了更好地对本申请实施例提供的技术方案进行介绍，本申请实施例提供了用户通过聊天应用与其他用户进行信息交互时，自由生成输入图像的实施方式：

步骤1：用户在输入法的输入界面中触发绘图输入指令，输入法展现绘图画布，或者用户通过在输入法的输入界面中触发图像编辑功能，选择待编辑的图像，输入法将选定的待编辑的图像复制到剪贴板，通过剪贴板将待编辑的图像传递给绘图画布，其中，绘图画布用于呈现用户绘制的轨迹数据。

步骤2：用户在绘图画布中通过触屏或者鼠标绘制等方式记录触点移动轨迹，如图4b所示，绘图画布401为文字输入框402下方的空白区域。根据触点移动轨迹上每个像素点的位置，将绘图画布中对应位置上的像素点的颜色值设置成绘图颜色(笔触颜色)，获取整个绘图画布对应的像素矩阵，当用户绘制的轨迹图像稳定后，将像素矩阵传递给步骤3。

步骤3：根据绘图画布对应的像素矩阵，通过在线推理引擎识别并计算轨迹图像中疑似文字覆盖的矩形区域。

步骤4：将步骤3的矩形区域输入至光学字符识别解析器，通过光学字符识别解析器识别矩形区域中包括的文字，并将矩形区域中包括的文字转换成设定文字格式的文字，将设定文字格式的文字称为字体文字。

步骤5：将步骤4生成的字体文字替换轨迹图像中对应的矩形区域：为了方便调整字体文字的大小，可以为每段字体文字生成独立的图层，将对应的矩形区域中各像素点的颜色清空成矩形区域内的背景颜色，将字体文字设置于矩形区域内，字体文字优先采用默认字号，根据矩形区域的尺寸对字体文字的字号进行缩放处理。其中，如果字体文字宽度或者高度超过矩形区域的宽度或者高度，则按照矩形区域的尺寸将字体文字的字号缩小成不超过矩形区域的字号。当字体文字自动调整后，将轨迹图像和字体文字合并生成待输入的图片。如图4c所示，用户在绘图画布401中绘制好输入图像后，输入法将生成的待输入图片输入至文字输入框402中。

步骤6：将步骤5生成的待输入的图片作为目标锚点的输入，并将该待输入的图片传递到相应位置。如图4d所示，用户对文字输入框402中的待输入图片进行选定后，将待输入图片发送至目标聊天方。

在本申请实施例中，用户还可以在输入法的输入界面中选定屏幕上的图像进行再次编辑。如图4e所示，用户对当前聊天界面403上的图像选定后，可以在绘图画布401中进行再次编辑。

本申请实施例提供的方法可以使用户之间的沟通内容更为直观，大大扩充了输入法的功能，提高了用户的沟通自由度，在降低沟通成本的同时，提高了沟通效率。

图5为本申请实施例提供的一种输入图像的生成装置500的结构图，该装置包括：输入轨迹图像获取模块510、文字轨迹区域识别模块520和目标融合图像生成模块530。

其中，输入轨迹图像获取模块510，用于获取输入轨迹图像；

文字轨迹区域识别模块520，用于在所述输入轨迹图像中，识别文字轨迹区域，并生成与所述文字轨迹区域中的文字内容匹配的文字；

目标融合图像生成模块530，用于将所述文字与所述输入轨迹图像进行融合，得到目标融合图像。

在上述各实施例的基础上，所述输入轨迹图像获取模块510，可以包括：

交互轨迹响应单元，用于响应于在绘图画布中实时接收到的交互轨迹，获取所述输入轨迹图像；

绘图画布展示子单元，用于响应于图像编辑指令，将与所述图像编辑指令匹配的待编辑图像传递至绘图画布，并对所述绘图画布进行展示；

输入界面处理单元，用于在输入法的输入界面中，获取输入轨迹图像。

所述文字轨迹区域识别模块520，可以包括：

输入轨迹图像检测单元，用于检测到所述输入轨迹图像在设定时长内未发生变化时，在所述输入轨迹图像中，识别文字轨迹区域；

输入轨迹图像输入单元，用于将所述输入轨迹图像输入至预先训练的文字区域识别引擎中，并根据所述文字区域识别引擎的输出结果，获取所述文字轨迹区域；其中，所述文字轨迹区域识别引擎用于识别文字轨迹区域在输入图像中的位置以及尺寸值；所述文字区域识别引擎配置于客户端中；

文字轨迹区域输入单元，用于将所述文字轨迹区域输入至光学字符识别解析器中，获取与所述文字轨迹区域对应的文字内容，并生成与所述文字内容对应的文字。

所述目标融合图像生成模块530，可以包括：

目标融合图像更新显示单元，用于在所述绘图画布中，更新显示所述目标融合图像；

文字图层生成单元，用于生成与所述文字对应的文字图层；

文字图层缩放单元，用于根据所述文字图层与文字轨迹区域之间的尺寸比例关系，对所述文字图层进行缩放处理；

文字轨迹区域替换单元，用于使用缩放处理后的所述文字图层，替换所述输入轨迹图像中的文字轨迹区域，得到所述目标融合图像；

颜色值恢复子单元，用于将所述输入轨迹图像中文字轨迹区域内各像素点的颜色值，恢复为所述文字轨迹区域内的区域颜色值；

文字图层填充子单元，用于将与所述文字轨迹区域匹配的文字图层，填充于所述文字轨迹区域中；

目标融合图像拖拽单元，用于响应于图像选定指令，将所述目标融合图像拖拽至所述输入法所适配的聊天应用的信息输入框中；

目标融合图像发送单元，用于响应于信息发送指令，将所述信息输入框中的所述目标融合图像发送至匹配的目标聊天方。

本申请实施例所提供的输入图像的生成装置可执行本申请任意实施例所提供的输入图像的生成方法，具备执行方法相应的功能模块和有益效果。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图6所示，是根据本申请实施例的输入图像的生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的输入图像的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的输入图像的生成方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的输入图像的生成的方法对应的程序指令/模块(例如，附图5所示的输入轨迹图像获取模块510、文字轨迹区域识别模块520和目标融合图像生成模块530)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的输入图像的生成方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据输入图像的生成方法的电子设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至输入图像的生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入图像的生成方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与输入图像的生成方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，led)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，可以使用户之间的沟通内容更为直观，提高了用户的沟通效率；其次，通过识别文字轨迹区域，并生成对应的文字，可以实现输入图像中文字内容的规范化，提高用户的阅读体验。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王群
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：硅微粒及其制造方法与流程
上一篇：固定化硫族元素及其在可再充电蓄电池中的应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。