识别图像中的字符的方法及装置的制造方法_4

文档序号:8922953阅读:来源:国知局
麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风 被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通 信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
[0144]I/O接口 612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可 以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁 定按钮。
[0145] 传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评 估。例如,传感器组件614可以检测到装置600的打开/关闭状态,组件的相对定位,例如 所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600 一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和 装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物 理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或C⑶图像 传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传 感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0146] 通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装 置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性 实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关 信息。在一个示例性实施例中,所述通信部件616还包括近场通信(NFC)模块,以促进短程 通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带 (UWB)技术,蓝牙(BT)技术和其他技术来实现。
[0147] 在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字 信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列 (FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0148] 在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例 如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例 如,所述非临时性计算机可读存储介质可以是R0M、随机存取存储器(RAM)、CD-ROM、磁带、 软盘和光数据存储设备等。
[0149] 本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其 它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或 者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识 或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的 权利要求指出。
[0150] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并 且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1. 一种识别图像中的字符的方法,其特征在于,所述方法包括: 确定所述图像中所包含的字符的第一个数; 将所述图像中所包含的字符分割为所述第一个数的字符图片; 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图 片单元; 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。2. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,执行所述确定所述图 像中所包含的字符的第一个数的步骤。3. 根据权利要求2所述的方法,其特征在于,所述方法还包括: 从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像 中的梯度; 通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,执行所述 根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字 符图片的步骤。4. 根据权利要求1所述的方法,其特征在于,所述根据所述第二个数的图片单元内的 非零像素点的个数识别所述图像中的字符,包括: 依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的第一 组非零像素点的个数; 依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率 大小的第二组非零像素点的个数; 根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中 的字符。5. 根据权利要求4所述的方法,其特征在于,所述根据所述第一组非零像素点的个数 和所述第二组非零像素点的个数识别所述图像中的字符,包括: 依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个 数的差值的绝对值; 确定所述第二个数的绝对值的和值中的最小值对应的字符模板; 将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。6. -种识别图像中的字符的装置,其特征在于,所述装置包括: 第一确定模块,被配置为确定所述图像中所包含的字符的第一个数; 第一分割模块,被配置为将所述图像中所包含的字符分割为所述第一确定模块确定的 所述第一个数的字符图片; 第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定大小 的窗口滑动从而将所述字符图片分割成第二个数的图片单元; 识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元内的 非零像素点的个数识别所述图像中的字符。7. 根据权利要求6所述的装置,其特征在于,所述装置还包括: 图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的图像; 之后,所述第一确定模块执行所述确定所述图像中所包含的字符的第一个数的步骤。8. 根据权利要求7所述的装置,其特征在于,所述装置还包括: 第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向与竖 直方向确定所述第一个数的字符在所述图像中的梯度; 第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在所述 水平方向与所述竖直方向的边界;之后,所述第一分割模块执行所述根据所述水平边界和 所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。9. 根据权利要求6所述的装置,其特征在于,所述识别模块包括: 第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所述第 二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数; 第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的模板 对应的模板单元的分辨率大小的第二组非零像素点的个数; 第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零像素 点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述图像 中的字符。10. 根据权利要求9所述的装置,其特征在于,所述第一识别子模块包括: 计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第 二组非零像素点的个数的差值的绝对值; 确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的和值 中的最小值对应的字符模板; 第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板对应 的字符识别为所述字符图片中的字符。11. 一种识别图像中的字符的装置,其特征在于,所述装置包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为: 确定所述图像中所包含的字符的第一个数; 将所述图像中所包含的字符分割为所述第一个数的字符图片; 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图 片单元; 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
【专利摘要】本公开是关于一种确定图像中的字符的方法及装置,用以降低字符识别过程中的计算量。所述方法包括:确定所述图像中所包含的字符的第一个数;将所述图像中所包含的字符分割为所述第一个数的字符图片;将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。本公开技术方案简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强字符识别时的鲁棒性。
【IPC分类】G06K9/34
【公开号】CN104899588
【申请号】CN201510369334
【发明人】龙飞, 陈志军, 张涛
【申请人】小米科技有限责任公司
【公开日】2015年9月9日
【申请日】2015年6月26日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1