一种基于图像识别来获取特定信息的方法与装置制造方法
【专利摘要】本发明的目的是提供一种基于图像识别来获取特定信息的方法和装置。其中,用户设备获取包括特定信息的待识别的图像信息,接着,对该待识别的图像信息进行图像识别以获取该特定信息,随后,根据预定归属规则,基于该特定信息来确定该特定信息所归属的网络设备,接着,将该特定信息发送至其所归属的网络设备以供特定操作;使得用户仅需通过简单的操作,如选择待识别的图片,即可获取图像信息中的特定信息,极大地提高了信息获取效率;进一步,本发明还可以基于特定信息来进行特定操作,例如,基于充值账号和密码来进行支付操作,或者,基于优惠码来进行购物操作,从而提升了用户的使用体验。
【专利说明】一种基于图像识别来获取特定信息的方法与装置
【技术领域】
[0001] 本发明涉及计算机【技术领域】,尤其涉及一种基于图像识别来获取特定信息的技 术。
【背景技术】
[0002] 当前,当用户看到包括特定信息的图像信息时,该用户一般需要手动来记录该特 定信息,例如,户外广告中的电话,或者充值卡中的充值卡号、密码等。然而,当特定信息中 包含较大信息量,如较长的字符串时,采用手动记录的方式来获取特定信息不仅需要用户 花费较长时间,还容易出现记录错误,从而导致用户的信息获取效率较低,且使用体验较 差。在现有技术中,虽然存在基于二维码来获取特定信息的信息获取方式,但由于用户在信 任这种基于二维码来获取特定信息的方式基础上才会采用该信息获取方式,且使用该方法 需要用户已了解通过二维码获得的具体目标信息,故该信息获取方式的使用普及率较低, 因此,这种信息获取方式不能给用户带来所见即所得的使用体验。
【发明内容】
[0003] 本发明的目的是提供一种基于图像识别来获取特定信息的方法和装置。
[0004] 根据本发明的一个方面,提供了一种基于图像识别来获取特定信息的方法,该方 法包括以下步骤:
[0005] a获取待识别的图像信息,其中,所述待识别的图像信息中包括特定信息;
[0006] b对所述待识别的图像信息进行图像识别,以获取所述特定信息;
[0007] C根据预定归属规则,基于所述特定信息,来确定所述特定信息所归属的网络设 备;
[0008] d将所述特定信息发送至其所归属的网络设备,以供特定操作。
[0009] 根据本发明的另一个方面,还提供了一种基于图像识别来获取特定信息的装置, 该装置包括:
[0010] 图像获取装置,用于获取待识别的图像信息,其中,所述待识别的图像信息中包括 特定信息;
[0011] 图像识别装置,用于对所述待识别的图像信息进行图像识别,以获取所述特定信 息;
[0012] 网络设备确定装置,用于根据预定归属规则,基于所述特定信息,来确定所述特定 信息所归属的网络设备;
[0013] 信息发送装置,用于将所述特定信息发送至其所归属的网络设备,以供特定操作。
[0014] 与现有技术相比,本发明通过获取包括特定信息的待识别的图像信息,接着,对该 待识别的图像信息进行图像识别以获取该特定信息,随后,根据预定归属规则,基于该特定 信息来确定该特定信息所归属的网络设备,接着,将该特定信息发送至其所归属的网络设 备以供特定操作;使得用户仅需通过简单的操作,如选择待识别的图片,即可获取图像信息 中的特定信息,极大地提高了信息获取效率;进一步,本发明还可以基于特定信息来进行特 定操作,例如,基于充值账号和密码来进行支付操作,或者,基于优惠码来进行购物操作,从 而提升了用户的使用体验。
【专利附图】
【附图说明】
[0015] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显:
[0016] 图1示出根据本发明一个方面的基于图像识别来获取特定信息的方法的流程图;
[0017] 图2示出根据本发明另一个方面的基于图像识别来获取特定信息的获取装置的 示意图。
[0018] 附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0019] 下面结合附图对本发明作进一步详细描述。
[0020] 图1示出根据本发明一个方面的基于图像识别来获取特定信息的方法的流程图。
[0021] 其中,所述特定信息可以是一种充值信息,其包括但不限于充值卡卡号、密码;用 户设备将充值卡卡号、密码发送至该卡号、密码所归属的网络设备,以供特定操作,例如,支 付操作。本领域技术人员应能理解上述特定信息和特定操作仅为举例,其他现有的或今后 可能出现的特定信息和特定操作如可适用于本发明,也应包含在本发明保护范围以内,并 在此以引用方式包含于此。具体地,在步骤Sl中,用户设备获取待识别的图像信息,其中, 所述待识别的图像信息中包括特定信息;在步骤S2中,用户设备对所述待识别的图像信息 进行图像识别,以获取所述特定信息;在步骤S3中,根据预定归属规则,基于所述特定信 息,来确定所述特定信息所归属的网络设备;在步骤S4中,用户设备将所述特定信息发送 至其所归属的网络设备,以供特定操作。
[0022] 上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解"持续"是指上 述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,在用户设备端进行待 识别的图像信息的获取、特定信息的获取、特定信息所归属的网络设备的确定、特定信息的 发送等,直至用户设备停止获取待识别的图像信息。
[0023] 在此,所述网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集 或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量主机或网络服 务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级 虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、触摸板,或声控设备 进行人机交互的电子产品,例如计算机、智能手机、PDA等。
[0024] 本领域技术人员应能理解上述网络设备和用户设备仅为举例,其他现有的或今后 可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并 在此以引用方式包含于此。在此,网络设备和用户设备均包括一种能够按照事先设定或存 储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用 集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
[0025] 本领域技术人员应能理解本发明在用户设备端进行多个步骤的方式仅为举例,本 发明也可在第一网络设备端进行多个步骤中的一个或多个,例如,用户设备端可将所获取 的待识别的图像信息发送至第一网络设备,接着,第一网络设备获取该待识别的图像信息, 随后,第一网络设备对所述待识别的图像信息进行图像识别,以获取所述特定信息,接着, 第一网络设备根据预定归属规则,基于所述特定信息,来确定所述特定信息所归属的网络 设备,随后,第一网络设备将所述特定信息发送至其所归属的网络设备,以供特定操作。
[0026] 具体地,在步骤Sl中,用户设备获取待识别的图像信息,其中,待识别的图像信息 中包括特定信息。在此,所述待识别的图像信息是指,等待进行图像识别的图像信息。待识 别的图像信息包括但不限于原始图片、经处理后的图像信息。
[0027] 其中,所述获取待识别的图像信息的方式包括但不限于以下3种:
[0028] 1)用户设备从特定的图片库中获取待识别的图像信息,其中,所述特定的图片库 中包括一个或多个待识别的图像信息。特定的图片库可以是由用户设备所确定的文件夹, 也可以是由用户所指定的文件夹,该特定的图片库可以是用户设备中的文件夹,也可以是 第三方设备中的文件夹。用户设备可以按照预定的时间或按照预定的周期间隔,来读取特 定的图片库,以获取待识别的图像信息。用户设备还可对已读取的待识别的图像信息进行 记录,来确定未读取的待识别的图像信息,例如,对已读取的待识别的图像信息进行标记, 或者,将已读取的待识别的图像信息剪切至另一文件夹中。
[0029] 2)通过与用户的交互操作,来获取该用户选择的待识别的图像信息,其中,所述获 取该用户选择的待识别的图像信息的方式包括但不限于以下2种:
[0030] a)用户设备通过提供图形对象的方式来与用户进行交互操作;例如,所述图形对 象为可选择的按钮,当用户选择该按钮时,用户设备通过调用该用户设备中的摄像头来对 该用户提供的拍照对象进行拍照操作,接着,用户设备获取通过该拍照操作所获取的图片, 并将其作为待识别的图像信息。
[0031] b)用户设备将用于获取特定信息的图片呈现给用户,该用户通过游标选择或手势 选择的方式来对该图片执行范围选择操作,以确定该图片中包括特定信息的图片范围,用 户设备根据该图片范围进行图片截选处理,以获取该范围选择操作所对应的待识别的图像 信息。
[0032] 通过与用户的交互来确定包括特定信息的图片范围,以作为待识别的图像信息, 可以更精确地获取包括特定信息的待识别的图像信息,从而为后续图像识别的计算处理的 效率以及后续图像识别的准确率提供了有力保证。
[0033] 本领域技术人员应能理解上述获取待识别的图像信息的方式仅为举例,获取待识 别的图像信息的方式还可包括以上3种方式的组合,例如,先由用户对用于获取特定信息 的图片进行拍照操作,用户设备获取该图片,随后,该用户设备再通过与该用户的交互来确 定该图片中包括特定信息的图片范围,以作为待识别的图像信息;其他现有的或今后可能 出现的获取待识别的图像信息的方式如可适用于本发明,也应包含在本发明保护范围以 内,并在此以引用方式包含于此。
[0034] 在步骤S2中,用户设备对待识别的图像信息进行图像识别,以获取待识别的图像 信息中的特定信息。在此,特定信息包括但不限于充值卡号、密码、商品的优惠码等。
[0035] 其中,所述用户设备对待识别的图像信息进行图像识别的方式包括但不限于以下 2种:
[0036] 1)用户设备可直接对待识别的图像信息进行图像识别。在此,待识别的图像信息 为黑白图像信息。在该黑白图像信息对应的源文件中,"1"表示黑色,"〇"表示白色,或者, 灰度颜色的数值"255"表示黑色,灰度颜色的数值"0"表示白色,用户设备可据此区分开前 景像素点和背景像素点。具体地,用户设备可采用模式识别的方式来获取用于图像识别的 决策树,例如,用户设备预先采用特征提取识别法(Feature Extraction)来将每个字符分 解为多个不同的字符特征,这些字符特征包括但不限于斜线、垂直线、水平线和曲线等,用 户设备基于这些特征与待识别的图像信息对应的源文件进行匹配,例如,用户设备判断待 识别的图像信息对应的源文件中多个"1"所表示的前景像素点对应的位置信息构成了水平 线的特征时,用户设备采用决策树可以确定该待识别的图像信息中的字符可能为"2"、"4"、 "5"、"7",接着,用户设备判断待识别的图像信息对应的源文件中与所确定的水平线的位置 信息能够接续的多个"1"所表示的前景像素点对应的位置信息构成了垂直线的特征时,用 户设备采用决策树可以确定该字符为"4",即所获取的特定信息。在此,用户设备可通过与 用户进行交互的方式,来校验图像识别的结果是否正确,并根据校验的结果来更新决策树。 [0037] 2)用户设备先对待识别的图像信息进行预处理,以获取适于识别的待识别的图像 信息;接着,该用户设备再对该适于识别的待识别的图像信息进行图像识别,以获取该特定 信息。
[0038] 其中,所述预处理包括但不限于以下2项:
[0039] a对待识别的图像信息进行灰度处理;
[0040] b对待识别的图像信息进行二值化处理。
[0041] 在此,待识别的图像信息为彩色图像信息,在该彩色图像信息对应的源文件中,用 R、G、B三个分量来确定该彩色图像中每个像素点对应的颜色,当R=G=B时,该像素点对应的 颜色为一种灰度颜色。首先,用户设备可采取加权平均的计算方式,来对R、G、B三个分量进 行计算,以获得单一数值作为该像素点对应的灰度颜色的数值。例如,对于R=2〇〇, G=150, B=180对应的像素点的颜色,用户设备可采取加权平均的计算方式,获得R=G=B=200*0. 3+1 50*0. 5+180*0. 2=171,即一种灰度颜色。在此,加权因子可根据经验进行确定,例如,人眼对 绿色的敏感度最高,因此绿色G对应的加权因子可设定为最高,人眼对蓝色敏感度最低,因 此蓝色B对应的加权因子可设定为最低。
[0042] 接着,用户设备根据预定阈值,对所获得的灰度颜色的数值进行处理,例如,将高 于该预定阈值的灰度颜色的数值设置为"1",将低于该预定阈值的灰度颜色的数值设置为 "〇",或者,将高于该预定阈值的灰度颜色的数值设置为"255",将低于该预定阈值的灰度颜 色的数值设置为"〇",用户设备即可获得区分开前景像素点和背景像素点的二值化图,以作 为适于识别的待识别的图像信息。
[0043] 随后,用户设备再对该适于识别的待识别的图像信息进行图像识别,以获取该特 定信息。图像识别的过程与上述对待识别的图像信息进行图像识别的第1种方式相同或基 本相同,故此处不再赘述,并通过引用的方式包含于此。
[0044] 优选地,首先,用户设备对该适于识别的待识别的图像信息进行图像优化处理,以 获取优化后的图像信息;随后,用户设备对该优化后的图像信息进行图像识别,以获取该特 定信息。
[0045] 其中,所述图像优化处理包括但不限于以下至少任一项:
[0046] 1)噪声去除操作。适于识别的待识别的图像信息中可能存在"胡椒噪声",例如,如 果用户在刮出充值卡卡号和密码的时候,不能有效地将充值卡卡号和密码全部清楚展现, 那么有可能出现很多噪声块,即"胡椒噪声"。用户设备可采用谐波均值滤波器的方式去除 噪声,例如采用邻域平均法的均值滤波器,用户设备将每一像素点的灰度颜色的数值设置 为该点某邻域窗口内的所有像素点灰度颜色的数值的平均值,"胡椒噪声"的像素点经过取 邻域窗口内的所有像素点灰度颜色的数值的平均值,可以减小与邻域窗口内的所有像素点 的差值,从而将"胡椒噪声"去除掉。
[0047] 用户设备对经过噪声处理操作的优化后的图像信息进行图像识别,可以获取更准 确的特定信息。
[0048] 2)插值处理操作。用户设备可对适于识别的待识别的图像信息进行插值处理,例 如,通过双线性的插值方式,用户设备通过确定两个或更多个临近的前景像素点,并根据这 些前景像素点的位置,在水平和垂直的两个方向上分别进行一次线性插值,以使得这些前 景像素点之间的像素点同样成为前景像素点,以获取连续的前景像素点。
[0049] 用户设备对经过插值处理操作的优化后的图像信息进行图像识别,可以获取更准 确的特定信息。
[0050] 3)倾斜校正操作。用户设备可对适于识别的待识别的图像信息进行倾斜校正操 作,用户设备可根据适于识别的待识别的图像信息中前景像素点整体的位置信息,来确定 一条水平线,在该水平线两侧,分布着均匀的前景像素点,并根据该水平线来对适于识别的 待识别的图像信息进行适度的转换。用户设备还可根据适于识别的待识别的图像信息中前 景像素点整体的位置信息来进行切图处理,以切除额外的部分。
[0051] 用户设备对经过倾斜校正操作的优化后的图像信息进行图像识别,可以获取更准 确的特定信息。
[0052] 在此,图像优化处理的方式还可包括以上3种方式的组合,例如,用户设备对该适 于识别的待识别的图像信息进行噪声去除操作、插值处理操作、倾斜校正操作,以获取优化 后的图像信息。
[0053] 随后,用户设备对该优化后的图像信息进行图像识别,以获取该特定信息。图像识 别的过程与上述对待识别的图像信息进行图像识别的第1种方式相同或基本相同,故此处 不再赘述,并通过引用的方式包含于此。
[0054] 本领域技术人员应能理解上述对待识别的图像信息进行图像识别以获取特定信 息的方式仅为举例,其他现有的或今后可能出现的对待识别的图像信息进行图像识别以获 取特定信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方 式包含于此。
[0055] 在步骤S3中,用户设备根据预定归属规则,基于特定信息,来确定该特定信息所 归属的网络设备。具体地,用户设备可基于特定信息所包括的字符串的位数和/或具体数 字,来与预定归属规则进行匹配,以确定特定信息所归属的网络设备。例如,用户设备所获 取的特定信息是两个字符串Al和A2, Al包括17位数字,A2包括18位数字,用户设备根 据下表1所示出的预定归属规则,可判断出Al是全国移动充值卡的充值卡号,A2是全国移 动充值卡的充值密码,并且该特定信息所归属的网络设备是全国移动充值卡对应的支付设 备。
[0056]
【权利要求】
1. 一种基于图像识别来获取特定信息的方法,该方法包括以下步骤: a获取待识别的图像信息,其中,所述待识别的图像信息中包括特定信息; b对所述待识别的图像信息进行图像识别,以获取所述特定信息; c根据预定归属规则,基于所述特定信息,来确定所述特定信息所归属的网络设备; d将所述特定信息发送至其所归属的网络设备,以供特定操作。
2. 根据权利要求1所述的方法,其中,所述获取待识别的图像信息包括: -通过与用户的交互操作,来获取所述用户选择的待识别的图像信息。
3. 根据权利要求2所述的方法,其中,所述通过与用户的交互操作来获取所述用户选 择的待识别的图像信息包括: al将用于获取特定信息的图片呈现给所述用户; a2通过所述用户对所述图片执行的范围选择操作,来获取所述范围选择操作对应的待 识别的图像信息。
4. 根据权利要求1至3中任一项所述的方法,其中,所述步骤b包括: bl对所述待识别的图像信息进行预处理,以获取适于识别的待识别的图像信息; b2对所述适于识别的待识别的图像信息进行图像识别,以获取所述特定信息。
5. 根据权利要求4所述的方法,其中,所述预处理包括但不限于以下两项: -对图像进行灰度处理; -对图像进行二值化处理。
6. 根据权利要求4或5所述的方法,其中,该方法还包括: -对所述适于识别的待识别的图像信息进行图像优化处理,以获取优化后的图像信 息; 其中,所述步骤b2包括: -对所述优化后的图像信息进行图像识别,以获取所述特定信息。
7. 根据权利要求6所述的方法,其中,所述图像优化处理操作包括但不限于以下至少 任一项: -噪声去除操作; -插值处理操作; -倾斜校正操作。
8. 根据权利要求1至7中任一项所述的方法,其中,所述特定信息包括充值信息,其中, 所述特定操作包括支付操作。
9. 一种基于图像识别来获取特定信息的装置,该装置包括: 图像获取装置,用于获取待识别的图像信息,其中,所述待识别的图像信息中包括特定 信息; 图像识别装置,用于对所述待识别的图像信息进行图像识别,以获取所述特定信息; 网络设备确定装置,用于根据预定归属规则,基于所述特定信息,来确定所述特定信息 所归属的网络设备; 信息发送装置,用于将所述特定信息发送至其所归属的网络设备,以供特定操作。
10. 根据权利要求9所述的装置,其中,所述图像获取装置包括: 交互获取单元,用于通过与用户的交互操作,来获取所述用户选择的待识别的图像信 肩、。
11. 根据权利要求10所述的装置,其中,所述交互获取单元包括: 呈现单元,用于将用于获取特定信息的图片呈现给所述用户; 选择获取单元,用于通过所述用户对所述图片执行的范围选择操作,来获取所述范围 选择操作对应的待识别的图像信息。
12. 根据权利要求9至11中任一项所述的装置,其中,所述图像识别装置包括: 预处理单元,用于对所述待识别的图像信息进行预处理,以获取适于识别的待识别的 图像信息; 第一信息获取单元,用于对所述适于识别的待识别的图像信息进行图像识别,以获取 所述特定信息。
13. 根据权利要求12所述的装置,其中,所述预处理包括但不限于以下两项: -对图像进行灰度处理; -对图像进行二值化处理。
14. 根据权利要求12或13所述的装置,其中,该装置还包括: 图像优化装置,用于对所述适于识别的待识别的图像信息进行图像优化处理,以获取 优化后的图像信息; 其中,所述图像识别装置包括: 第二信息获取单元,用于对所述优化后的图像信息进行图像识别,以获取所述特定信 肩、。
15. 根据权利要求14所述的装置,其中,所述图像优化处理操作包括但不限于以下至 少任一项: -噪声去除操作; -插值处理操作; -倾斜校正操作。
16. 根据权利要求9至15中任一项所述的装置,其中,所述特定信息包括充值信息,其 中,所述特定操作包括支付操作。
【文档编号】G06Q20/00GK104424485SQ201310370181
【公开日】2015年3月18日 申请日期:2013年8月22日 优先权日:2013年8月22日
【发明者】唐琪森, 姜春生, 张宁, 昝智 申请人:北京卓易讯畅科技有限公司