一种出租车顶灯语音控制系统的制作方法
【专利摘要】本实用新型属于出租车智能顶灯及车载智能设备【技术领域】,公开了一种出租车顶灯语音控制系统,包括:设置于车厢内的控制器和车内显示屏,以及设置于车顶的LED顶灯;所述控制器包括:用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器。本实用新型通过设计具有语音输入功能的出租车专用的LED顶灯控制器的方式构建出租车顶灯控制系统,有效解决了手动输入顶灯显示内容操作不便、浪费乘客时间、导致安全隐患等问题。
【专利说明】一种出租车顶灯语音控制系统
【技术领域】
[0001]本实用新型属于出租车智能顶灯及车载智能设备【技术领域】,涉及语音控制出租车顶灯及车载显示设备的技术。
【背景技术】
[0002]出租车作为营运车辆,需要在行驶过程中向路边及车内乘客显示如空车、载客等状态信息,而随着城市交通的日益拥堵及有限的出租车资源越发不能满足日益增长的打车需求,在乘客同意的前提下,拼车成了节约资源,约解高峰打车难问题的有效方法。因此,在行驶过程中向路边乘客传达本车目标方向信息,成为实现拼车的一个关键需求。
[0003]早期出租车一般在驾驶室内对应前车窗处安装空车提示牌,乘客上车后,司机手动将提示牌翻倒,乘客下车后,司机再手动将提示牌翻起。显然,这种提示牌的提示信息非常单一,且操作麻烦。随着LED显示技术及单片机技术的发展,出现一种通过LED显示屏显示空车或载客字样的智能提示牌。相比翻上翻下的传统提示牌,这种提示牌不需要翻动,但仍需司机手动控制显示内容在“空车”和“载客”之间变换。
[0004]为了更醒目地区别于私家车辆,出租车一般会在车顶上设置顶灯,随着智能提示牌的出现,也出现了一种同样包括LED显示屏的智能顶灯,智能顶灯可以把“空车”和“载客”等营运状态信息更大更醒目地显示出来。此外,智能顶灯相对于智能提示牌,具有显示面积大的优势。除显示“空车”和“载客”等营运状态信息外,还使其具有了显示目标方向的可能。但是由于乘客的目的地具有随机性,无法一一预设在操作键盘上,只能由司机,在乘客上车后,手动输入以使其在顶灯上显示。文字输入过程即给司机带来操作上的麻烦,又浪费了乘客的时间。如司机在车轴起步后进行目标方向的输入,则会带来行车安全隐患。
【发明内容】
[0005]本实用新型的目的是,针对现有技术中存在的上述不足,提供一种可以免除司机手工控制提示牌或出租车顶灯的方案。该方案公开一种基于语音控制的出租车顶灯及车载显不设备控制系统。
[0006]为了实现上述目的,本实用新型所采用的技术方案是:一种出租车顶灯语音控制系统,包括:设置于车厢内的控制器和车内显示屏,以及设置于车顶的LED顶灯;
[0007]所述控制器包括:用于采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器;
[0008]所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的输入端与A/D采样电路的输出端连接;音频编码模块按语音识别模块可识别的编码规则对A/D采样电路输出的数字音频信号进行编码,语音识别模块的数据输入端连接音频编码模块的数据输出接口;
[0009]语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的文字特征库,进行特征匹配,将特征匹配的文字信息输出;
[0010]语音识别模块的数据输出端通过数字接口接CPU ;CPU通过RS232接口连接车内显示屏和LED顶灯;CPU接收语音识别模块输出的文字信息,并将文字信息显示到车内显示屏和LED顶灯。
[0011]此外,本实用新型还公开一种改进方案,具体为:一种出租车顶灯语音控制系统,包括:设置于车厢内的控制器和车内显示屏,以及设置于车顶的LED顶灯;
[0012]所述控制器包括:用于采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器,以及用于控制语音采集起止的按键;
[0013]所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的输入端与A/D采样电路的输出端连接;音频编码模块按语音识别模块可识别的编码规则对A/D采样电路输出的数字音频信号进行编码,语音识别模块的数据输入端连接音频编码模块的数据输出接口 ;语音识别模块的数据输出接口通过数字接口接CPU;
[0014]CPU通过数字接口分别连接音频采集模块、音频编码模块、语音识别模块的中断控制接口,CPU响应按键的触发信号,控制音频采集模块、音频编码模块开始采集并编码音频信号,检测无语音信号达到预设延时后,CPU控制音频采集模块、音频编码模块停止,并控制语音识别模块开始语音识别;
[0015]语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的文字特征库,进行特征匹配,将特征匹配的文字信息输出;
[0016]CPU通过RS232接口与车内显示屏和LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到车内显示屏和LED顶灯。
[0017]本实用新型通过设计具有语音输入功能的出租车专用的LED顶灯控制器的方式构建出租车顶灯控制系统,有效解决了手动输入顶灯显示内容操作不便、浪费乘客时间、导致安全隐患等问题。
【专利附图】
【附图说明】
[0018]图1为本实用新型所述出租车顶灯控制系统的原理框图。
[0019]图2为出租车顶灯控制系统的控制器的一种具体硬件拓扑结构图。
[0020]图3为出租车顶灯控制系统的一种具体软件流程图。
[0021 ]图4为语音识别算法原理图。
[0022]图5为MFCC计算流程图。
[0023]图6为DWT算法搜索路径图。
【具体实施方式】
[0024]下面针对本实用新型上述方案,给出一个具体实例,以进一步说明本实用新型所述的出租车顶灯控制系统。
[0025]在本例中,所述控制器的语音识别采用Mel倒谱提取MFCC的改进算和动态时间规整(DTW)算法。该改进算法不直接对语音短时幅度谱进行提取,而是首先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,从而降低基音频率对其的影响。根据提取梅尔倒谱系数和动态时间弯折的模板匹配的优点,对输入语音信号进行端点检测,可以较好地对特定人的孤立词进行识别。同时算法给出了 MFCC参数提取,对断点检测进行性能分析和评价。实验结果表明算法具有非常高准确的识别效果。
[0026]一、硬件设计
[0027]本例控制器硬件拓扑结构如图2所示,主要由音频解码模块、降噪合成模块、CPU核心处理模块、电源模块(电源驱动电路)、备有不间断电源1、/0接口、串口输入输出、3G通讯模块、A/D转换模块、音频采集器、等搭建而成,系统还增设了通讯模块,通讯模块备选,是设备的语音等各类信息通过通讯模块上传至后台,实现信息化管理,系统使用的核心处理器采用的是ARM高速处理芯片。语音信息通过音频信号采集、过滤、降噪后提供高保真的音频信息,经A/D转换模块将模拟信号转换成数字型号,处理器通过专用算法识别关键词语并动态编辑关键词列表,输出结果由I/O端口确认,输出正确的显示信息或控制指令通过总线传送至电子营运证执行和智能顶灯显示语音信息。本系统是通过嵌入式语音识别技术,在处理复杂的音频处理系统中能灵活地输入输出音频数据。固件、硬件设计上在保护模式下完全禁止访问FLASH存储器。编程后,可以从嵌入式存储器启动,从而充当一个完全定制语音识别设备。从而更有效的提高设备的语音识别率。
[0028]所述音频采集模块采用抗噪音麦克风,音频编码芯片选用vsl005,其主要功能是将语音信号采集到信号处理模块内,并通过语音识别算法提取出相应的语音特征数据。音频编码芯片VS1005能获得非常好的音效,并且比软件省电。VS1005是一片灵活的音频平台器件。它基于VS_DPS4构件,这是一个功能强大的DSP (数字信号处理器)核心。在独立应用中,数字接口提供了灵活的外部器件访问。在复杂的音频处理系统中能灵活地输入输出音频数据。模拟接口提供了高保真的音频输入和输出,例如控制ADC可以作为电阻式触摸屏接口。VS1005拥有8Mbit (IMByte)VLSI或定制方或第三方定制的嵌入式FLASH存储器。固件和硬件设计上在保护模式下完全禁止访问FLASH存储器。编程后,VS1005可以从嵌入式存储器启动,从而充当一个完全定制的独立音频处理器。
[0029]CPU 选用 ARM9 高速处理器 S3C2440 芯片,S3C2440 采用了 ARM920t 的内核,0.13um的CMOS标准宏单元和存储单元。其低功耗,简单,优雅,且全静态设计特别适合于对成本和功率敏感型的应用。
[0030]语音识别模块采用LD3320专用语音识别芯片。LD3320芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路,包括AD、DA转换器、麦克风接口、声音输出接口等。本芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以任意动态编辑的。
[0031]二、软件设计
[0032]本系统软件流程图如图3所示
[0033]2.1系统调度
[0034]本系统采用音频编解码芯片VS1005音频模块对语音信号进行采集,通过定时中断来控制系统运行。
[0035]主程序使能音频编码模块,从音频编码模块的缓冲区内读取音频数据到DDRSDRAM存储器中。当音频模块缓冲区全部为空时,主程序对DDR内的数据进行预处理、端点检测、MFCC参数提取。模式匹配算法采用动态时间规整(DTW)算法。
[0036]2.2算法原理
[0037]语音识别模块的基本结构如图4所示,MFCC计算流程如图5所示。
[0038]2.2.1分帧、预加重处理
[0039]预加重的目的是为了对语音的高频部分进行加重增加其高频分辨率,一般通过传递函数为H(Z)=1-Ci Z' α取0.98;语音信号具有短时平稳的特点,因此可以对语音信号进行分帧处理,从而减小因语音信号时变性强带来的负面效果。
[0040]预加重算法:
[0041]sign (n) =s (n) -a*s (η-1)
[0042]式中:α取0.9 ;s(n)为数字化的语音信号;sign(n)为加重后的语音信号。
[0043]分帧算法:
【权利要求】
1.一种出租车顶灯语音控制系统,其特征在于,包括:设置于车厢内的控制器和车内显示屏,以及设置于车顶的LED顶灯; 所述控制器包括:用于采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器; 所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的输入端与A/D采样电路的输出端连接;音频编码模块按语音识别模块可识别的编码规则对A/D采样电路输出的数字音频信号进行编码,语音识别模块的数据输入端连接音频编码模块的数据输出接口; 语音识别模块的数据输出端通过数字接口接CPU ;CPU通过RS232接口连接车内显示屏和LED顶灯;CPU接收语音识别模块输出的文字信息,并将文字信息显示到车内显示屏和LED顶灯。
2.—种出租车顶灯语音控制系统,其特征在于,包括:设置于车厢内的控制器和车内显示屏,以及设置于车顶的LED顶灯; 所述控制器包括:用于采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器,以及用于控制语音采集起止的按键; 所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的输入端与A/D采样电路的输出端连接;音频编码模块按语音识别模块可识别的编码规则对A/D采样电路输出的数字音频信号进行编码,语音识别模块的数据输入端连接音频编码模块的数据输出接口 ;语音识别模块的数据输出接口通过数字接口接CPU ; CPU通过数字接口分别连接音频采集模块、音频编码模块、语音识别模块的中断控制接Π, CPU通过RS232接口与车内显示屏和LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到车内显示屏和LED顶灯。
【文档编号】B60Q1/50GK203419063SQ201320172221
【公开日】2014年2月5日 申请日期:2013年4月8日 优先权日:2013年4月8日
【发明者】洪海峰, 楼远志, 周艳会 申请人:浙江海联电子有限公司