一种纸媒网页链接发送方法及设备与流程

文档序号:14870717发布日期:2018-07-06 23:18阅读:292来源:国知局

本申请涉及计算机领域,尤其涉及一种纸媒网页链接发送方法及设备。



背景技术:

现有技术中,如图1所示,现有的纸媒通过在报纸上印刷二维码图案来完成纸媒与互联网的链接,但是二维码图案不够直观,所隐含的信息不能被人直接理解;同时,二维码图案需要占用纸媒一定的版面,不能为每篇文章生成唯一的二维码图案,还导致用户无法通过纸媒上尽快地链接至互联网上对应的数据内容信息。



技术实现要素:

本申请的一个目的是提供一种纸媒网页链接发送方法及设备,解决现有技术无法将纸媒快速地链接至互联网上对应的数据信息内容的问题。

根据本申请的一个方面,提供了一种在网络设备端的纸媒网页链接发送方法,该方法包括:

接收用户设备发送的从纸媒上拍摄的原始图像;

从所述原始图像中提取文本信息;

将与所述文本信息对应的网页链接发送给所述用户设备。

进一步地,上述方法中,所述将与所述文本信息对应的网页链接发送给所述用户设备,包括:

将所述文本信息与样本进行匹配,并将匹配值最高的样本对应的网页链接发送给所述用户设备。

进一步地,上述方法中,所述从所述原始图像中提取文本信息,包括:

依序对所述原始图像进行灰度化、灰度反转、图像二值化及图像膨胀处理,得到所述原始图像对应的灰度图像;

基于所述灰度图像,从所述原始图像中提取文本信息。

进一步地,上述方法中,所述基于所述灰度图像,从所述原始图像中提取文本信息,包括:

从所述原始图像对应的灰度图像中提取文本区域,并对所述文本区域进行掩模处理,得到所述原始图像对应的文本区域掩模图像;

基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

进一步地,上述方法中,所述基于所述文本区域掩模图像,从所述原始图像中提取文本信息,包括:

基于所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像;

从所述文本区域原始图像中提取所述文本信息。

进一步地,上述方法中,从所述文本区域原始图像中提取所述文本信息,包括:

基于预设的光学字符识别模型,从所述文本区域原始图像中提取所述文本信息。

根据本申请的另一方面,还提供了一种在用户设备端的纸媒网页链接接收方法,其中,所述方法包括:

获取从纸媒上拍摄的原始图像,并发送给网络设备;

接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;

通过所述网页链接访问对应的网页。

进一步地,上述方法中,通过所述网页链接访问对应的网页之后,还包括:

对所述网页的内容进行评论和/或关注操作。

进一步地,上述方法中,通过所述网页链接访问对应的网页之后,还包括:

获取所述网页的内容的关联数据信息。

根据本申请的另一方面,还提供了一种纸媒网页链接发送的网络设备,其中,所述网络设备包括:

图像接收装置,用于接收用户设备发送的从纸媒上拍摄的原始图像;

提取装置,用于从所述原始图像中提取文本信息;

网页链接发送装置,用于将与所述文本信息对应的网页链接发送给所述用户设备。

进一步地,上述网络设备中,所述网页链接发送装置用于:

将所述文本信息与样本进行匹配,并将匹配值最高的样本对应的网页链接发送给所述用户设备。

进一步地,上述网络设备中,所述提取装置用于:

依序对所述原始图像进行灰度化、灰度反转、图像二值化及图像膨胀处理,得到所述原始图像对应的灰度图像;

基于所述灰度图像,从所述原始图像中提取文本信息。

进一步地,上述网络设备中,所述提取装置用于:

从所述原始图像对应的灰度图像中提取文本区域,并对所述文本区域进行掩模处理,得到所述原始图像对应的文本区域掩模图像;

基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

进一步地,上述网络设备中,所述提取装置用于:

基于所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像;

从所述文本区域原始图像中提取所述文本信息。

进一步地,上述网络设备中,所述提取装置用于:

基于预设的光学字符识别模型,从所述文本区域原始图像中提取所述文本信息。

根据本申请的另一方面,还提供了一种纸媒网页链接接收的用户设备,其中,所述用户设备包括:

图像发送装置,用于获取从纸媒上拍摄的原始图像,并发送给网络设备;

网页链接接收装置,用于接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;

访问装置,用于通过所述网页链接访问对应的网页。

进一步地,上述用户设备中,所述访问装置还用于:

对所述网页的内容进行评论和/或关注操作。

进一步地,上述用户设备中,所述访问装置还用于:

获取所述网页的内容的关联数据信息。

根据本申请的另一方面,还提供了一种基于计算的设备,其中,该设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:

接收用户设备发送的从纸媒上拍摄的原始图像;

从所述原始图像中提取文本信息;

将与所述文本信息对应的网页链接发送给所述用户设备。

根据本申请的另一方面,还提供了一种基于计算的设备,其中,该设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:

获取从纸媒上拍摄的原始图像,并发送给网络设备;

接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;

通过所述网页链接访问对应的网页。

与现有技术相比,本申请通过在网络设备端接收用户设备发送的从纸媒上拍摄的原始图像;然后从所述原始图像中提取文本信息;最后将与所述文本信息对应的网页链接发送给所述用户设备,以便用户设备基于接收的该文本信息对应的网页链接访问对应的网页,实现了将纸媒通过网页链接与互联网中的网页进行连接,进而使得用户设备能够通过纸媒访问至对应的网页链接连接的网页。

进一步地,本申请通过在用户设备端获取从纸媒上拍摄的原始图像,并发送给网络设备;在网络设备对接收的所述原始图像进行文本信息提取之后,将与所述文本信息对应的网页链接发送给所述用户设备,使得用户设备接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;最后用户设备通过所述网页链接访问对应的网页,实现了用户能够在用户设备上浏览该纸媒上的文本信息对应的网页链接连接至的网页,使得用户能够通过用户设备将纸媒与网页链接对应的网页连接起来,提高了用户体验度。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1示出现有方案的纸媒版面通过二维码图像与互联网上对应网页连接的示例图;

图2示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法的流程图;

图3示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中接收的用户设备从纸媒上拍摄的原始图像的示意图;

图4示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中对原始图像进行的图像处理、文本信息检测及预设的光学字符识别模型处理流程示意图;

图5示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中对原始图像进行图像二值化处理后的原始图像的示意图;

图6示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中对原始图像进行图像膨胀处理之后的原始图像对应的灰度图像的示意图;

图7示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中对原始图像进行文本区域检测及图像掩模处理之后的所述原始图像对应的文本区域掩模图像的示意图;

图8示出根据本申请一个方面的一种在网络设备端的纸媒网页链接发送方法中基于图7中的文本区域掩模图像从图3中的原始图像中提取文本区域对应的文本区域原始图像的示意图;

图9示出根据本申请一个方面的一种纸媒网页链接发送设备的结构示意图;

图10示出根据本申请一个方面的一种在用户设备端的纸媒网页链接接收设备的结构示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

根据本申请一个方面的一种纸媒网页链接发送方法,该方法应用于将纸媒与互联网进行互动过程中的网络设备端,该方法包括步骤s11、步骤s12和步骤s13,其中,所述步骤s11接收用户设备发送的从纸媒上拍摄的原始图像;然后所述步骤s12对所述原始图像进行图像处理以从所述原始图像中提取文本信息;最后所述步骤s13将与所述文本信息对应的网页链接发送给所述用户设备,以便用户设备基于接收的该文本信息对应的网页链接访问对应的网页,实现了将纸媒通过网页链接与互联网中的网页进行连接,进而使得用户设备能够通过纸媒访问至对应的网页链接连接的网页,进而提高了用户体验度。

需要说明的是,所述纸媒是指纸质媒体,可以包括报纸、杂志等以纸张为载体的媒体,还可以包括以二维码纸巾为载体的纸媒,能够很好地将线下纸媒与线上互联网结合起来,进而达到更大的投放效果。当然,本领域的技术人员应能理解,其他现有的或今后可能出现的其他任何形式的所述纸媒如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

进一步地,所述步骤s13将与所述文本信息对应的网页链接发送给所述用户设备,包括:

将所述文本信息与样本进行匹配,并将匹配值最高的样本对应的网页链接发送给所述用户设备。

本申请一实施例中,如图2所示,在所述步骤s12中对接收的用户设备发送的从纸媒上拍摄的原始图像进行文本信息提取,接着所述步骤s13将提取得到的文本信息与网络设备端的本地的数据库中的所有样本(例如与文本信息匹配的文章或某一新闻等)进行匹配,若在本地的数据库中检索到与所述文本信息最匹配的样本,则将匹配值最高的样本(例如匹配值最高时对应的文章)对应的网页链接(例如,http://jishu.com/news等)发送给所述用户设备,以便用户能够在用户设备端基于返回的与该文本信息对应的样本的网页链接访问对应的网页,实现纸媒与互联网上对应的网页的连接;若在本地的数据库中没有检索到与所述文本信息匹配的样本,则说明在网络设备端进行与文本信息对应的样本的检索失败,则网络设备也会向用户设备发送检索失败信息,以通知用户设备检索失败,来提示用户网络设备端不存在与该纸媒上拍摄的原始图像中的文本信息对应匹配的样本。

进一步地,所述步骤s12从所述原始图像中提取文本信息,包括:

依序对所述原始图像进行灰度化、灰度反转、图像二值化及图像膨胀处理,得到所述原始图像对应的灰度图像;

基于所述灰度图像,从所述原始图像中提取文本信息。

需要说明的是,本申请的实施例中的所述图像二值化处理采用的算法可以是自适应阈值算法,也可以是给定阈值算法。当然,本领域的技术人员应能理解,其他现有的或今后可能出现的其他任何用于进行图像二值化处理的算法如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

本申请一实施例中,所述步骤s11接收的用户设备发送的从纸媒上拍摄的原始图像如图3所示,接着在所述步骤s12中如图4所示,首先对所述原始图像进行灰度化处理,使得原始图像中的所有像素点的灰度值统一,进而呈现的所述原始图像中的文本信息的灰度显现结果一样,以便减少后续对灰度化处理后的原始图像进行图像处理量和计算量;接着对灰度化处理后的原始图像进行灰度反转处理,即将灰度化处理后的原始图像中的像素点的灰度值为0的转换为灰度值为255,将像素点的灰度值为255的转换为灰度值为0,得到灰度反转处理后的原始图像;接着对灰度反转处理后的原始图像进行图像二值化处理,即根据像素点的灰度值将灰度反转处理后的原始图像处理成黑白两种颜色的图像如图5所示,以便减少后续对图像二值化处理后的原始图像进行的图像处理量和计算量,也使得整个二值化处理后的原始图像呈现出明显的黑白效果;然后所述步骤s12接着对图5中的图像二值化处理后的原始图像进行图像膨胀处理,即将图像二值化处理后的原始图像中的文本信息所在的像素点进行扩张,使相邻文字粘连在一起,进而增加图像的鲁棒性,依序经过上述灰度化、灰度反转、图像二值化及图像膨胀处理,得到的所述原始图像对应的灰度图像如图6所示;接着所述步骤s12基于得到的图6中的所述灰度图像,从如图3中的所述原始图像中提取文本信息,实现对原始图像进行图像处理之后并提取所述原始图像中的文本信息,以进行后续的在本地的数据库中进行的匹配操作。

进一步地,所述步骤s12中的基于所述灰度图像,从所述原始图像中提取文本信息,包括:

从所述原始图像对应的灰度图像中提取文本区域,并对所述文本区域进行掩模处理,得到所述原始图像对应的文本区域掩模图像;

基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

本申请一实施例中,如图4所示为了去掉所述原始图像对应的灰度图像中的图形图像区域,则所述步骤s12需要从所述原始图像对应的灰度图像中提取文本区域,以去掉所述灰度图像中的图形图像区域;为了只对所述原始图像对应的灰度图像中提取出的文本区域进行单独图像处理以及屏蔽对所述原始图像对应的灰度图像中的图形图像区域的处理或计算,则所述步骤s12继续对从所述原始图像对应的灰度图像中提取的所述文本区域进行掩模处理(mask),得到所述原始图像对应的文本区域掩模图像如图7所示;接着所述步骤s12基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

进一步地,所述步骤s12中的基于所述文本区域掩模图像,从所述原始图像中提取文本信息,包括:

基于所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像;

从所述文本区域原始图像中提取所述文本信息。

本申请一实施例中,如图4所示,基于图7中的所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像如图8所示,其中,该文本区域原始图像对应图8中的用条状的灰色遮住的部分,实现了通过对原始图像进行图像处理后得到只包含有文本信息的文本区域原始图像;接着所述步骤s12从图8中的用条状的灰色遮住的所述文本区域原始图像中提取对应的所述文本信息,例如图8中的“国办印发《关于进一步改革完善药品生产流通使用政策的若干意见》”、“新一轮药品改革开出“中国药方”及“新华全媒头条”等文本信息,以通过对原始图像进行上述的图像处理来实现对原始图像中的文本信息进行的提取操作。

进一步地,所述步骤s12中的从所述文本区域原始图像中提取所述文本信息,包括:

基于预设的光学字符识别模型,从所述文本区域原始图像中提取所述文本信息。

需要说明的是,所述光学字符识别模型(opticalcharacterrecognition模型,ocr模型)用于指示电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定纸上的字符的形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,例如能够对证件、名片等上的文本信息进行文本信息识别。

本申请一实施例中,如图4所示,在所述步骤s12中得到如图8中的所述文本区域原始图像,为了精确地获取到文本信息,则所述步骤s12将需要提取文本信息的所述文本区域原始图像送入预设的所述光学字符识别模型(ocr模型)中,基于该预设的所述光学字符识别模型(ocr模型)从所述文本区域原始图像中提取所述文本信息;接着在所述步骤s13中将从所述文本区域原始图像中提取的文本信息与本地的数据库中的样本进行匹配,将匹配值最高的样本对应的网页链接发送给所述用户设备,以便用户基于该网页链接打开纸媒对应的互联网上的网页,进而实现纸媒与互联网之间的互动。

根据本申请一个方面的一种在用户设备端的纸媒网页链接接收方法,该方法应用于将纸媒与互联网进行互动过程中的用户设备端,该方法包括步骤s21、步骤s22和步骤s23,其中,所述步骤s21获取从纸媒上拍摄的原始图像,并将所述原始图像发送给网络设备;在网络设备对接收的所述原始图像进行文本信息提取之后,将与所述文本信息对应的网页链接发送给所述用户设备,使得所述步骤s22接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;最后所述步骤s23通过所述网页链接访问对应的网页,实现了用户能够在用户设备上浏览该纸媒上的文本信息对应的网页链接连接至的网页,使得用户能够通过用户设备将纸媒与网页链接对应的网页上的内容连接起来,提高了用户体验度。

需要说明的是,所述步骤s21获取从纸媒上拍摄的原始图像,其中,所述原始图像可以是本用户设备拍摄获取的,也可以是其它用户设备拍摄之后并传送给本用户设备。

进一步地,所述步骤s23通过所述网页链接访问对应的网页之后,还包括:对所述网页的内容进行评论和/或关注操作。在本申请一实施例中,当接收到网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接之后,所述用户设备通过所述网页链接连接至互联网上对应的网页,并且还可以对所述网页上的内容(例如文章或新闻等)发表评论和/或对该网页上的内容(例如文章或新闻等)发起关注等操作,进而实现纸媒与互联网之间的互动过程;若所述用户设备接收到网络设备基于接收的所述原始图像,返回的在网络设备的本地的数据库中检索与原始图像中的文本信息对应的样本检索失败时的检索失败信息,则所述用户设备通过检索失败信息提示用户在网络设备中不存在与拍摄所述原始图像对应的纸媒上的文本信息对应的样本。

进一步地,所述步骤s23通过所述网页链接访问对应的网页之后,还包括:获取所述网页的内容的关联数据信息。在本申请一实施例中,当接收到网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接之后,所述用户设备通过所述网页链接连接至互联网上对应的网页,并且还可以获取与所述网页上的内容(例如文章或新闻等)相关联的关联数据信息,其中所述关联数据信息可以包括是所述网页推荐的与网页上的内容相关的数据信息,还可以是与所述网页上的内容相关的其他互联网业务内容等,以实现通过在所述纸媒中的文本信息对应的网页链接,访问的所述网页上的内容及获取与该内容相关联的关联数据信息,进而提高用户体验度,使用户能够获取更多的与网页上的内容相关的关联数据信息。

图9示出根据本申请一个方面的一种纸媒网页链接发送设备的结构示意图,应用于将纸媒与互联网进行互动过程中的网络设备端,该网络设备包括图像接收装置11、提取装置12和网页链接发送装置13,其中,所述图像接收装置11用于接收用户设备发送的从纸媒上拍摄的原始图像;然后所述提取装置12用于对所述原始图像进行图像处理以从所述原始图像中提取文本信息;最后所述网页链接发送装置13用于将与所述文本信息对应的网页链接发送给所述用户设备,以便用户设备基于接收的该文本信息对应的网页链接访问对应的网页,实现了将纸媒通过网页链接与互联网中的网页进行连接,进而使得用户设备能够通过纸媒访问至对应的网页链接连接的网页,进而提高了用户体验度。

需要说明的是,所述纸媒是指纸质媒体,可以包括报纸、杂志等以纸张为载体的媒体,还可以包括以二维码纸巾为载体的纸媒,能够很好地将线下纸媒与线上互联网结合起来,进而达到更大的投放效果。当然,本领域的技术人员应能理解,其他现有的或今后可能出现的其他任何形式的所述纸媒如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

进一步地,所述网页链接发送装置13用于:

将所述文本信息与样本进行匹配,并将匹配值最高的样本对应的网页链接发送给所述用户设备。

本申请一实施例中,如图2所示,在所述提取装置12中对接收的用户设备发送的从纸媒上拍摄的原始图像进行文本信息提取,接着所述网页链接发送装置13将提取得到的文本信息与网络设备端的本地的数据库中的所有样本(例如与文本信息匹配的文章或某一新闻等)进行匹配,若在本地的数据库中检索到与所述文本信息最匹配的样本,则将匹配值最高的样本(例如匹配值最高时对应的文章)对应的网页链接(例如,http://jishu.com/news等)发送给所述用户设备,以便用户能够在用户设备端基于返回的与该文本信息对应的样本的网页链接访问对应的网页,实现纸媒与互联网上对应的网页的连接;若在本地的数据库中没有检索到与所述文本信息匹配的样本,则说明在网络设备端进行与文本信息对应的样本的检索失败,则网络设备也会向用户设备发送检索失败信息,以通知用户设备检索失败,来提示用户网络设备端不存在与该纸媒上拍摄的原始图像中的文本信息对应匹配的样本。

进一步地,所述提取装置12用于:

依序对所述原始图像进行灰度化、灰度反转、图像二值化及图像膨胀处理,得到所述原始图像对应的灰度图像;

基于所述灰度图像,从所述原始图像中提取文本信息。

需要说明的是,本申请的实施例中的所述图像二值化处理采用的算法可以是自适应阈值算法,也可以是给定阈值算法。当然,本领域的技术人员应能理解,其他现有的或今后可能出现的其他任何用于进行图像二值化处理的算法如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

本申请一实施例中,所述图像接收装置11接收的用户设备发送的从纸媒上拍摄的原始图像如图3所示,接着在所述提取装置12中如图4所示,首先对所述原始图像进行灰度化处理,使得原始图像中的所有像素点的灰度值统一,进而呈现的所述原始图像中的文本信息的灰度显现结果一样,以便减少后续对灰度化处理后的原始图像进行图像处理量和计算量;接着对灰度化处理后的原始图像进行灰度反转处理,即将灰度化处理后的原始图像中的像素点的灰度值为0的转换为灰度值为255,将像素点的灰度值为255的转换为灰度值为0,得到灰度反转处理后的原始图像;接着对灰度反转处理后的原始图像进行图像二值化处理,即根据像素点的灰度值将灰度反转处理后的原始图像处理成黑白两种颜色的图像如图5所示,以便减少后续对图像二值化处理后的原始图像进行的图像处理量和计算量,也使得整个二值化处理后的原始图像呈现出明显的黑白效果;然后所述提取装置12接着对图5中的图像二值化处理后的原始图像进行图像膨胀处理,即将图像二值化处理后的原始图像中的文本信息所在的像素点进行扩张,使相邻文字粘连在一起,进而增加图像的鲁棒性,依序经过上述灰度化、灰度反转、图像二值化及图像膨胀处理,得到的所述原始图像对应的灰度图像如图6所示;接着所述提取装置12基于得到的图6中的所述灰度图像,从如图3中的所述原始图像中提取文本信息,实现对原始图像进行图像处理之后并提取所述原始图像中的文本信息,以进行后续的在本地的数据库中进行的匹配操作。

进一步地,所述提取装置12用于:

从所述原始图像对应的灰度图像中提取文本区域,并对所述文本区域进行掩模处理,得到所述原始图像对应的文本区域掩模图像;

基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

本申请一实施例中,为了去掉所述原始图像对应的灰度图像中的图形图像区域,则所述提取装置12需要从所述原始图像对应的灰度图像中提取文本区域,以去掉所述灰度图像中的图形图像区域;为了只对所述原始图像对应的灰度图像中提取出的文本区域进行单独图像处理以及屏蔽对所述原始图像对应的灰度图像中的图形图像区域的处理或计算,则所述提取装置12继续对从所述原始图像对应的灰度图像中提取的所述文本区域进行掩模处理(mask),得到所述原始图像对应的文本区域掩模图像如图7所示;接着所述提取装置12基于所述文本区域掩模图像,从所述原始图像中提取文本信息。

进一步地,所述提取装置12用于:

基于所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像;

从所述文本区域原始图像中提取所述文本信息。

本申请一实施例中,基于图7中的所述文本区域掩模图像,从所述原始图像中提取所述文本区域对应的文本区域原始图像如图8所示,其中,该文本区域原始图像对应图8中的用条状的灰色遮住的部分,实现了通过对原始图像进行图像处理后得到只包含有文本信息的文本区域原始图像;接着所述提取装置12从图8中的用条状的灰色遮住的所述文本区域原始图像中提取对应的所述文本信息,例如图8中的“国办印发《关于进一步改革完善药品生产流通使用政策的若干意见》”、“新一轮药品改革开出“中国药方”及“新华全媒头条”等文本信息,以通过对原始图像进行上述的图像处理来实现对原始图像中的文本信息进行的提取操作。

进一步地,所述提取装置12用于:

基于预设的光学字符识别模型,从所述文本区域原始图像中提取所述文本信息。

需要说明的是,所述光学字符识别模型(opticalcharacterrecognition模型,ocr模型)用于指示电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定纸上的字符的形状,然后用字符识别设备将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,例如能够对证件、名片等上的文本信息进行文本信息识别。

本申请一实施例中,在所述提取装置12中得到如图8中的所述文本区域原始图像,为了精确地获取到文本信息,则所述提取装置12将需要提取文本信息的所述文本区域原始图像送入预设的所述光学字符识别模型(ocr模型)中,基于该预设的所述光学字符识别模型(ocr模型)从所述文本区域原始图像中提取所述文本信息;接着在所述网页链接发送装置13中将从所述文本区域原始图像中提取的文本信息与本地的数据库中的样本进行匹配,将匹配值最高的样本对应的网页链接发送给所述用户设备,以便用户基于该网页链接打开纸媒对应的互联网上的网页,进而实现纸媒与互联网之间的互动。

图10示出根据本申请一个方面的一种在用户设备端的纸媒网页链接接收设备的结构示意图,应用于将纸媒与互联网进行互动过程中的用户设备端,该用户设备包括图像发送装置21、网页链接接收装置22和访问装置23,其中,所述图像发送装置21用于获取从纸媒上拍摄的原始图像,并将所述原始图像发送给网络设备;在网络设备对接收的所述原始图像进行文本信息提取之后,将与所述文本信息对应的网页链接发送给所述用户设备,使得所述网页链接接收装置22用于接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;最后所述访问装置23用于通过所述网页链接访问对应的网页,实现了用户能够在用户设备上浏览该纸媒上的文本信息对应的网页链接连接至的网页,使得用户能够通过用户设备将纸媒与网页链接对应的网页上的内容连接起来,提高了用户体验度。

需要说明的是,所述图像发送装置21中获取的从纸媒上拍摄的原始图像,可以是本用户设备拍摄获取的,也可以是其它用户设备拍摄之后并传送给本用户设备。

进一步地,所述访问装置23通过所述网页链接访问对应的网页之后,还用于:对所述网页的内容进行评论和/或关注操作。在本申请一实施例中,当接收到网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接之后,所述用户设备通过所述网页链接连接至互联网上对应的网页,并且还可以对所述网页上的内容(例如文章或新闻等)发表评论和/或对该网页上的内容(例如文章或新闻等)发起关注等操作,进而实现纸媒与互联网之间的互动过程;若所述用户设备接收到网络设备基于接收的所述原始图像,返回的在网络设备的本地的数据库中检索与原始图像中的文本信息对应的样本检索失败时的检索失败信息,则所述用户设备通过检索失败信息提示用户在网络设备中不存在与拍摄所述原始图像对应的纸媒上的文本信息对应的样本。

进一步地,所述访问装置23通过所述网页链接访问对应的网页之后,还用于:获取所述网页的内容的关联数据信息。在本申请一实施例中,当接收到网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接之后,所述用户设备通过所述网页链接连接至互联网上对应的网页,并且还可以获取与所述网页上的内容(例如文章或新闻等)相关联的关联数据信息,其中所述关联数据信息可以包括是所述网页推荐的与网页上的内容相关的数据信息,还可以是与所述网页上的内容相关的其他互联网业务内容等,以实现通过在所述纸媒中的文本信息对应的网页链接,访问的所述网页上的内容及获取与该内容相关联的关联数据信息,进而提高用户体验度,使用户能够获取更多的与网页上的内容相关的关联数据信息。

本申请提供的一种应用于将纸媒与互联网进行互动过程的实际应用场景中,该实际应用场景中包括用户设备与网络设备(例如云服务器等),在该实际应用场景中将纸媒优选为报纸,该报纸上的文本信息即为文本形式的新闻或者文章,通过在用户设备端获取报纸上的某篇文章对应网页链接,则所述用户设备打开识别应用程序,并通过该应用程序启动摄像头并拍摄这篇文章中的内容,得到从报纸上拍摄的原始图像,接着所述用户设备确认该原始图像并上传给网络设备;当网络设备接收到用户设备上传的从报纸上拍摄的原始图像之后,利用图像处理技术、文本区域检测以及ocr模型等技术对所述原始图像进行处理,提取出所述原始图像中包含的文本信息;接着所述网络设备将所述文本信息与本地的数据中的样本进行检索匹配,将匹配值最高的样本对应的网页链接发送给所述用户设备,若没有检索到的话,则将检索失败信息发送给用户设备,以提示用户设备在网络设备端检索失败;当用户设备接收到网络设备基于接收的原始图像返回的对应于所述原始图像中的文本信息的网页链接之后,所述用户设备通过所述网页链接连接至互联网上的对应网页并访问;之后用户设备还可以对所述网页上的内容发表评论操作和/或发起关注等操作,同时,所述用户设备还可以获取到与所述网页上的内容相关的关联数据信息(例如推荐数据信息或与该网页的内容相关的其他互联网业务等),实现将纸媒与互联网上的网页之间进行的互动过程。

本申请的上述实际应用场景中,所述网络设备接收到用户设备上传的从报纸上拍摄的原始图像之后,利用图像处理技术、文本区域检测以及ocr模型等技术对所述原始图像进行处理,提取出所述原始图像中包含的文本信息具体包括如下步骤:首先,对所述原始图像进行灰度化处理,以得到会都会处理之后的原始图像,将原始图像从彩色的原始图像转换为只有灰度值的灰色的原始图像;接着对灰度化处理之后的原始图像进行图像反转处理,将灰度化处理之后的原始图像中的像素点的灰度值为0的转换为灰度值为255,灰度值为255的转换为0,以减少后续图像处理的处理量和计算量;接着对图像反转处理之后的原始图像进行图像二值化处理,使得二值化处理之后的原始图像中只有黑白两种灰度值,减少后续对图像进行的处理量和计算量;接着对图像二值化处理后的原始图像进行图像膨胀处理,得到所述原始图像对应的灰度图像,使得该灰度图像中的文本信息所在的像素点扩张,使得文本信息中的文字相互粘连在一起,进而增加灰度图像的鲁棒性;接着对所述原始图像对应的灰度图像进行文本区域检测,得到所述原始图像中的文本区域,并对所述文本区域进行掩模处理(mask)处理,得到所述原始图像对应的文本区域掩模图像,接着基于该文本区域掩模图像从所述原始图像中提取出文本信息,其中通过ocr模型从所述原始图像中提取出文本信息,实现通过图像处理、文本区域检测及ocr模型等技术从所述原始图像中提取出精确地文本信息。

综上所述,本申请通过在网络设备端接收用户设备发送的从纸媒上拍摄的原始图像;然后从所述原始图像中提取文本信息;最后将与所述文本信息对应的网页链接发送给所述用户设备,以便用户设备基于接收的该文本信息对应的网页链接访问对应的网页,实现了将纸媒通过网页链接与互联网中的网页进行连接,进而使得用户设备能够通过纸媒访问至对应的网页链接连接的网页。

进一步地,本申请通过在用户设备端获取从纸媒上拍摄的原始图像,并发送给网络设备;在网络设备对接收的所述原始图像进行文本信息提取之后,将与所述文本信息对应的网页链接发送给所述用户设备,使得用户设备接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;最后用户设备通过所述网页链接访问对应的网页,实现了用户能够在用户设备上浏览该纸媒上的文本信息对应的网页链接连接至的网页,使得用户能够通过用户设备将纸媒与网页链接对应的网页连接起来,提高了用户体验度。

根据本申请的另一方面,还提供了一种基于计算的设备,其中,该设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:

接收用户设备发送的从纸媒上拍摄的原始图像;

从所述原始图像中提取文本信息;

将与所述文本信息对应的网页链接发送给所述用户设备。

根据本申请的另一方面,还提供了一种基于计算的设备,其中,该设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:

获取从纸媒上拍摄的原始图像,并发送给网络设备;

接收所述网络设备基于接收的所述原始图像,返回的对应于所述原始图像中的文本信息的网页链接;

通过所述网页链接访问对应的网页。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1