专利名称:多功能便携式电子助视器的制作方法
技术领域:
本实用新型涉及一种助视器,尤其涉及一种既能将纸质文字放大或提高其显示的清晰度 ,以改善低视力患者和老年人的阅读能力,又能播放音频和视频文件,实现多媒体功能的多 功能便携式电子助视器。
背景技术:
低视力人群,尤其是弱视和老花眼等患者在阅读书籍、报纸等普通印刷品的时候存在着 各种程度的障碍。传统的助视器一般都是光学设备,如放大镜、老花眼镜等,这些设备只能 将纸件上的文字连同背景一起放大,不能过滤掉背景而突出文字,因此仍然存在清晰度不够 的问题,对低视力人群而言还不能达到一个非常理想的助视效果。由此出现了电子助视器, 但是目前的电子助视器只能解决阅读障碍问题,功能比较单一,无法满足低视力者的娱乐要 求,不能和这个信息高度发展、人们生活质量大大提高的时代相协调。
发明内容
本实用新型主要解决原有的电子助视器只能解决阅读障碍问题,功能比较单一,无法满 足低视力者的娱乐要求的技术问题;提供一种既能将纸质文字放大或提高其显示的清晰度, 以改善低视力患者和老年人的阅读能力,又能播放音频和视频文件,实现多媒体功能的多功 能便携式电子助视器。
本实用新型的上述技术问题主要是通过下述技术方案得以解决的本实用新型包括控制
单元、存储单元以及依次相连的图像采集单元、图像处理单元、文字识别单元、智能判断单 元、图像显示单元,控制单元与图像采集单元、图像处理单元、文字识别单元、智能判断单 元、图像显示单元相连,图像采集单元、图像处理单元与存储单元相连,智能判断单元与存 储单元相连,还包括数据通信接口、视频解码单元、音频解码单元、音频播放单元,数据通 信接口与所述的控制单元相连,视频解码单元、音频解码单元与所述的控制单元、存储单元 相连,视频解码单元还与所述的图像显示单元相连,音频解码单元与音频播放单元相连,音 频播放单元与所述的控制单元相连。纸质上的文字通过图像采集单元获取,然后一方面送存 储单元存储,另一方面送给图像处理单元处理,使文字更加清晰,再由文字识别单元对文字 进行识别,由智能判断单元对文字的方向进行判断,若正确则直接送图像显示单元显示,若 不正确则进行旋转,再送图像显示单元显示,便于低视力者能清晰地阅读。数据通信接口可与电脑相连,从电脑上拷贝下MP3、 MP4数据放入存储单元,在控制单元的控制下,视频解码 单元、音频解码单元从存储单元获取视频、音频数据并进行相应的解码,解码后的视频数据 送图像显示单元显示,解码后的音频数据送音频播放单元播放,使低视力者既能听又能看, 实现多媒体功能,提高娱乐性。通过数据通信接口还可从电脑上拷贝下电子书,再通过图像 处理后由图像显示单元显示给读者放大、清晰的文字,便于低视力者阅读。
作为优选,所述的音频解码单元包括依次相连的帧解包模块、霍夫曼解码模块、逆变换 模块、综合滤波器、反离散余弦变换模块、多相位综合滤波器,帧解包模块与所述的存储单 元相连,多相位综合滤波器与所述的音频播放单元相连。存储单元过来的MP3数据由帧解包 模块解出帧头信息和边带信息,接着由霍夫曼解码模块解出比特分配信息,在逆变换模块中 利用频谱系数,在综合滤波器中将32位子带合并成一个宽带信号,再进行反离散余弦变换, 获得18个连续的频谱,最后由多相位综合滤波器将这些频谱转换到时域,完成波形重构,生 成立体声PCM音频数据,送往音频播放单元播放,使低视力者能听到美妙的立体声。
作为优选,所述的视频解码单元包括解复用模块及与解复用模块相连的运动解码模块、 纹理解码模块,运动解码模块接运动补偿模块,运动补偿模块的输出、纹理解码模块的输出 均接重建视频对象平台模块,重建视频对象平台模块的输出既与运动补偿模块相连,又与所 述的图像显示单元相连,解复用模块与所述的存储单元相连。视频解码包括运动解码和纹理 解码。存储单元过来的MP4数据首先经解复用处理,接着运动解码后获得运动矢量并进行运 动补偿,纹理解码获得残差值,将这两部分组合起来才能重建视频对象平台,最后送图像显 示单元显示,使低视力者能看到电影等活动的图像。
作为优选,所述的纹理解码模块包括依次相连的变长解码模块、逆扫描模块、逆DC/AC 预测模块、逆量化模块、逆离散余弦变换模块,所述的变长解码模块的输入端与解复用模块 的输出相连,所述的逆离散余弦变换模块的输出端接重建视频对象平台模块。
作为优选,所述的控制单元包括相连的系统流程自动控制模块、控制器模块,控制器模 块上连接有若干按键,系统流程自动控制模块与所述的图像显示单元相连。使用者通过按动 按键对工作状态进行设置或控制,设置信号和控制信号通过控制器模块、系统流程自动控制 模块处理后发给其它相应的工作模块,使之按使用者的需要进行工作。
作为优选,所述的图像采集单元采用摄像头,包括镜头模块、数字取像模块、A/D转换 模块,镜头模块接数字取像模块,数字取像模块接A/D转换模块,A/D转换模块的输出接所述 的图像处理单元、存储单元。在工作时镜头模块收集光线进入感应光强度的感应区,即数字 取像模块,再由A/D转换模块将图像等模拟信号转换成数字信号输送给图像处理单元和存储单元。
作为优选,所述的图像处理单元包括依次相连的自动曝光控制模块、自动增益控制模块 、自动白平衡控制模块、自动亮度控制模块、颜色饱和度控制模块、色调控制模块、锐度控 制模块、伽马校正控制模块,自动曝光控制模块与所述的图像采集单元、存储单元相连,伽 马校正控制模块与所述的文字识别单元相连。
作为优选,所述的智能判断单元包括依次相连的标准词库模块、文义智能判断査找模块 、统计判别模块、判断结果输出模块。
本实用新型的有益效果是纸质阅读资料通过图像采集单元转换成数字信号,电子书等 电子阅读资料通过数据通信接口存入存储单元,这些数字信号经过图像处理、智能转换后成 为清晰合理的、方便低视力患者阅读的尺寸、排版格式和颜色对比模式,清晰度和放大倍数 都大大高于传统助视器。另一方面,通过数据通信接口存入存储单元的MP3、 MP4等音、视频 文件,通过音频解码、视频解码后,由音频播放单元播放立体声,由图像显示单元播放视频 文件,实现多媒体功能,使低视力者既能看又能听,提高娱乐性,大大方便和丰富了低视力 患者的生活。
图1是本实用新型的 一种电路连接框图。 图2是本实用新型中音频解码单元的一种电路连接框图。 图3是本实用新型中视频解码单元的一种电路连接框图。 图4是本实用新型中视频解码单元的帧解码流程图。 图5是本实用新型中控制单元的一种电路连接框图。 图6是本实用新型中图像采集单元的一种电路连接框图。 图7是本实用新型中图像处理单元的一种电路连接框图。 图8是本实用新型中智能判断单元的一种电路连接框图。
具体实施方式
下面通过实施例,并结合附图,对本实用新型的技术方案作进一步具体的说明。 实施例l:本实施例的一种多功能便携式电子助视器,如图1所示,包括控制单元l、存 储单元2、数据通信接口8、视频解码单元9、音频解码单元IO、音频播放单元ll以及依次相 连的图像采集单元3、图像处理单元4、文字识别单元5、智能判断单元6、图像显示单元7。 控制单元1与图像采集单元3、图像处理单元4、文字识别单元5、智能判断单元6、图像显示 单元7、数据通信接口8、视频解码单元9、音频解码单元IO、音频播放单元ll相连,存储单元2与图像采集单元3、图像处理单元4、智能判断单元6、视频解码单元9、音频解码单元IO 相连,视频解码单元9与图像显示单元7相连,音频解码单元10与音频播放单元11相连。
如图5所示,控制单元l包括相连的系统流程自动控制模块l-l、控制器模块l-2,控制器 模块l-2上连接有十个按键l-3,系统流程自动控制模块1-1与图像显示单元7相连。控制器模 块主要功能是接受使用者的指令,经处理后通过系统流程自动控制模块发送给其它相应的工 作模块。十个按键控制十个命令,每一个命令对应一个按键,分别是电源键、H0LD键、定格 键、上键、下键、左键、右键、确定键、返回键和主菜单键,使用者在阅读过程中的任何控 制命令都通过按键发出指令,经过控制器模块的编码,发送给系统流程自动控制模块。系统 流程自动控制模块负责控制整个助视器的运行,并发送当前助视器的运行状态给控制器模块 。控制单元合成当前系统运行状态的图像,由图像显示模块显示当前运行状态的提示图像, 图像提示对于低视力使用者是非常重要的。本实施例中,系统流程自动控制模块和控制器模 块均采用基于ZORAN公司出品的ZR36系列的ZR36482BGCF实现的。
如图6所示,图像采集单元3采用摄像头,包括镜头模块31、数字取像模块32、 A/D转换 模块33。镜头模块31接数字取像模块32,数字取像模块32接A/D转换模块33, A/D转换模块 33的输出接图像处理单元4、存储单元2。镜头模块收集光线进入感应光强度的感应区,即数 字取像模块,再由A/D转换模块将图像等模拟信号转换成数字信号输送给图像处理单元和存 储单元。本实施例中,数字取像模块和A/D转换模块采用OmniVision Technologies公司出品 的0V76XX系列的0V7670 。
如图7所示,图像处理单元4包括依次相连的自动曝光控制模块41、自动增益控制模块 42、自动白平衡控制模块43、自动亮度控制模块44、颜色饱和度控制模块45、色调控制模块 46、锐度控制模块47、伽马校正控制模块48,自动曝光控制模块41与图像采集单元3、存储 单元2相连,伽马校正控制模块48与文字识别单元5相连。自动曝光控制模块的自动化程度最 高,并且设置是自动决定,不能人为修改,使用这种设置在大多数情况下能得到一张正常的 图像,这种设置是为了最大程度地减少操作失误而设计的,如测光模式、IS0设置等等都是 由自己决定的。自动增益控制模块对从存储单元中读取的图像数据去除图像中的噪声点,以 提高文字识别的准确度。自动白平衡控制模块的主要功能是使大屏幕拼接墙技术有良好的色 彩一致性,由于在正常光线下看起来是白颜色的东西在较暗的光线下看起来可能就不是白色 ,所以会自动修正光线的改变。自动亮度控制模块的主要功能是将去除噪声后的图像增强对 比度,并根据图像本身的特性自适应地调整亮度,增加识别率。颜色饱和度控制模块的主要 功能是,当光谱色掺入的白光成分愈多,就愈不饱和时,或者当物体对光谱某一较窄波段的反射率高,而对其它波长的反射率很低或没有反射,这一颜色的饱和度就高时,会自动调节 颜色的纯洁性。当锐度高的时候,显示文本、图片时会让你觉得边缘特别清晰锐利,但难免 让人觉得有些刺眼,而当锐度低的时候,显示文本、图片时会让你觉得边缘很不清晰。锐度 控制模块会自动调节文本、图片的边缘到最佳状态。色调控制模块的功能是调整明亮度,将 事物客观存在的明度、色相的光源色经过调节真实的反应出来,色调的范围是0 255,共为 256种色调。伽马校正控制模块的功能是使得整屏显示均匀,色彩、白平衡平滑过渡,最大 限度的减少马赛克现象,增强画面层次感、均匀度,有效提高画面质量。即同样的驱动电流 ,其发光强度不同;驱动IC之间、同一片驱动IC的不同管脚之间也存在参数的离散,这样使 得LCD显示屏的亮度也呈现离散化现象,为解决这种离散现象产生的亮度不均匀,除了对 LCD进行进一步的细化分选外,还需要对显示模组的控制参数进行初始化,这样保证了模组 间的亮度一致性。图像的处理是系统的核心部分。首先,根据取景框大小在原始摄像头数据 上取部分数据,根据快速双线性插值算法,映射到LCD或VGA大小的中间层buffer里,在这个 过程中,同时对插值结果进行亮度、对比度调整。处理黑白图像时,还需要在临时buffer里 进行二值化操作。结合文字识别单元整合整幅图像中的识别结果信息,并传送给智能判断单 元。
如图8所示,智能判断单元6包括依次相连的标准词库模块61 、文义智能判断査找模块 62、统计判别模块63、判断结果输出模块64。标准词库模块中含有大量的汉语和英语的词库 ,是为文义智能判断査找模块提供智能判断的标准。文义智能判断査找模块对每一个由文字 识别单元识别得出的识别结果文字在标准词库模块中査找所有的词,并且与识别结果中该字 符的实际上下文进行比较,如果识别结果的实际上下文中都不能在标准词库模块中査找到相 应的词语,那么就认为这个字不能成词,并将这一结果传给统计判别模块。统计判别模块统 计识别结果全文中所有字符的成词率。经过大量的实践证明,如果一段文字中所有字符的总 成词数量除以文章的总字符数小于一定的数值,那么可以认为这段文字是无意义的乱码。在 阅读过程中,如果使用者不慎将纸质文字资料方向放错,那么虽然可以得出识别结论,但却 是没有意义的乱码。经过统计判别模块的判断,可以得出该次扫描识别的结果是否有效的结 论。通过控制单元中的系统自动流程控制模块将图像进行旋转操作,并重新进行识别流程, 直到图像旋转到该文档的正确位置,也就是最能够被识别的位置,然后再将数据传送给图像 显示单元。
在本实施例中,图像处理单元、文字识别单元、智能判断单元均采用基于ZORAN公司的 ZR36系列芯片实现。存储单元由HYNIX存储器HY27US08561 A-TPCB和HY5PS 121621CFP实现。如图2所示,音频解码单元10包括依次相连的帧解包模块101、霍夫曼解码模块102、逆 变换模块103、综合滤波器104、反离散余弦变换模块105、多相位综合滤波器106,帧解包模 块101与存储单元2相连,多相位综合滤波器106与音频播放单元11相连。音频解码单元是由 ZORAN公司出品的ZR36系列的ZR36482BGCF完成的。首先将存储单元过来的MP3数据由帧解包 模块进行帧解包,解出帧头信息和边带信息,然后由霍夫曼解码模块解出比特分配信息,接 着在逆变换模块中利用频谱系数,在综合滤波器中将32位子带合并成一个宽带信号,在反离 散余弦变换模块中18个频谱值执行32位逆改进型离散余弦变换,将生成的576个频谱值变换 成长度为32的18个连续的频谱,通过18次运算,多相位综合滤波器将这些频谱转换到时域, 完成波形重构,生成立体声PCM音频数据,最后送往音频播放单元播放出立体声。
如图3所示,视频解码单元9包括解复用模块91及与解复用模块91相连的运动解码模块 92、纹理解码模块93。解复用模块91与存储单元2相连,接受存储单元过来的视频数据。纹 理解码模块93包括依次相连的变长解码模块931、逆扫描模块932、逆DC/AC预测模块933、逆 量化模块934、逆离散余弦变换模块935,变长解码模块931的输入端与解复用模块91的输出 相连。运动解码模块92接运动补偿模块94,运动补偿模块94的输出、逆离散余弦变换模块 935的输出均接重建视频对象平台模块95,重建视频对象平台模块95的输出既与运动补偿模 块94相连,又与图像显示单元7相连。视频解码单元也是由Z0RAN公司出品的ZR36系列的 ZR36482BGCF完成的。解码过程实际上就是从视频编码码流中恢复出视频对象平台(VOP)数 据的过程。视频解码有运动解码和纹理解码。I帧中只含有纹理信息,因此只须解码纹理信 息即可恢复I帧。而P帧中不仅包含纹理信息,还包含运动信息,所以须解码运动信息,获得 运动矢量并进行运动补偿。另外,还须进行纹理解码获得残差值,将这两部分组合起来才能 重建P帧,最后输送给图像显示单元,使低视力者能看到电影等活动的图像。
如图4所示,解码的实现主要是提供一个简单的接口函数,供解码时调用。该接口函数 根据解码的不同需要和不同阶段提供了5个入口。 5个接口函数中4个供初始化、预处理及 后续处理时调用,l个是帧解码的实现函数。视频序列按照视频对象层VOL、视频对象平台 VOP、宏块MB视顺序编成一串码流。程序首先从码流中解出VOL和VOP的头,然后根据这些 头信息以宏块为单位进行解码。MB解码单独做成函数,也是首先解出头信息,据此判断出 宏块类型帧内MB、帧间MB、帧间4VMB。帧内MB解码是以l块为单位作纹理解码,解出的 纹理值最后存入宏块缓存区内;帧间MB解码是先解出运动矢量MV,根据MV进行运动补偿得 到预测值存入宏块缓存区,再以块为单位进行纹理解码,解出残差值存入Block中,最后将 Block加入到宏块缓存区中得到最后结果。
权利要求权利要求1一种多功能便携式电子助视器,包括控制单元(1)、存储单元(2)以及依次相连的图像采集单元(3)、图像处理单元(4)、文字识别单元(5)、智能判断单元(6)、图像显示单元(7),控制单元(1)与图像采集单元(3)、图像处理单元(4)、文字识别单元(5)、智能判断单元(6)、图像显示单元(7)相连,图像采集单元(3)、图像处理单元(4)与存储单元(2)相连,智能判断单元(6)与存储单元(2)相连,其特征在于还包括数据通信接口(8)、视频解码单元(9)、音频解码单元(10)、音频播放单元(11),数据通信接口(8)与所述的控制单元(1)相连,视频解码单元(9)、音频解码单元(10)与所述的控制单元(1)、存储单元(2)相连,视频解码单元(9)还与所述的图像显示单元(7)相连,音频解码单元(10)与音频播放单元(11)相连,音频播放单元(11)与所述的控制单元(1)相连。
2.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的音频解码单元(10)包括依次相连的帧解包模块(101)、霍夫曼解码模块(102)、逆变 换模块(103)、综合滤波器(104)、反离散余弦变换模块(105)、多相位综合滤波器( 106),帧解包模块(101)与所述的存储单元(2)相连,多相位综合滤波器(106)与所述 的音频播放单元(11)相连。
3.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的视频解码单元(9)包括解复用模块(91)及与解复用模块(91)相连的运动解码模块( 92)、纹理解码模块(93),运动解码模块(92)接运动补偿模块(94),运动补偿模块( 94)的输出、纹理解码模块(93)的输出均接重建视频对象平台模块(95),重建视频对象 平台模块(95)的输出既与运动补偿模块(94)相连,又与所述的图像显示单元(7)相连 ,解复用模块(91)与所述的存储单元(2)相连。
4.根据权利要求3所述的多功能便携式电子助视器,其特征在于所述 的纹理解码模块(93)包括依次相连的变长解码模块(931)、逆扫描模块(932)、逆 DC/AC预测模块(933)、逆量化模块(934)、逆离散余弦变换模块(935),所述的变长解码模块(931)的输入端与解复用模块(91)的输出相连,所述的逆离散余弦变换模块(935 )的输出端接重建视频对象平台模块(95)。
5.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的控制单元(1)包括相连的系统流程自动控制模块(1-1)、控制器模块(1-2),控制器 模块(1-2)上连接有若干按键(1-3),系统流程自动控制模块(1-1)与所述的图像显示 单元(7)相连。
6.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的图像采集单元(3)采用摄像头,包括镜头模块(31)、数字取像模块(32) 、 A/D转换模 块(33),镜头模块(31)接数字取像模块(32),数字取像模块(32)接A/D转换模块( 33) , A/D转换模块(33)的输出接所述的图像处理单元(4)、存储单元(2)。
7.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的图像处理单元(4)包括依次相连的自动曝光控制模块(41)、自动增益控制模块(42) 、自动白平衡控制模块(43)、自动亮度控制模块(44)、颜色饱和度控制模块(45)、色 调控制模块(46)、锐度控制模块(47)、伽马校正控制模块(48),自动曝光控制模块( 41)与所述的图像采集单元(3)、存储单元(2)相连,伽马校正控制模块(48)与所述的 文字识别单元(5)相连。
8.根据权利要求l所述的多功能便携式电子助视器,其特征在于所述 的智能判断单元(6)包括依次相连的标准词库模块(61)、文义智能判断査找模块(62) 、统计判别模块(63)、判断结果输出模块(64)。
专利摘要本实用新型涉及一种多功能便携式电子助视器,包括依次相连的图像采集单元、图像处理单元、文字识别单元、智能判断单元、图像显示单元,它的控制单元与图像采集单元、图像处理单元、文字识别单元、智能判断单元、图像显示单元、数据通信接口、视频解码单元、音频解码单元、音频播放单元相连,存储单元与图像采集单元、图像处理单元、智能判断单元、视频解码单元、音频解码单元相连,视频解码单元与图像显示单元相连,音频解码单元与音频播放单元相连。本实用新型既能将纸质文字或电子书放大或提高其显示的清晰度,以改善低视力患者和老年人的阅读能力,又能播放音频和视频文件,实现多媒体功能,使低视力者既能看又能听,提高娱乐性。
文档编号H04N1/393GK201315627SQ20082030390
公开日2009年9月23日 申请日期2008年12月30日 优先权日2008年12月30日
发明者张海燕, 响 李, 蒋清晓 申请人:蒋清晓