专利名称:一种出租车顶灯语音控制系统的制作方法
技术领域:
本发明属于出租车智能顶灯及车载智能设备技术领域,涉及语音控制出租车顶灯及车载显示设备的技术。
背景技术:
出租车作为营运车辆,需要在行驶过程中向路边及车内乘客显示如空车、载客等状态信息,而随着城市交通的日益拥堵及有限的出租车资源越发不能满足日益增长的打车需求,在乘客同意的前提下,拼车成了节约资源,约解高峰打车难问题的有效方法。因此,在行驶过程中向路边乘客传达本车目标方向信息,成为实现拼车的一个关键需求。早期出租车一般在驾驶室内对应前车窗处安装空车提示牌,乘客上车后,司机手动将提示牌翻倒,乘客下车后,司机再手动将提示牌翻起。显然,这种提示牌的提示信息非常单一,且操作麻烦。随着LED显示技术及单片机技术的发展,出现一种通过LED显示屏显示空车或载客字样的智能提示牌。相比翻上翻下的传统提示牌,这种提示牌不需要翻动,但仍需司机手动控制显示内容在“空车”和“载客”之间变换。为了更醒目地区别于私家车辆,出租车一般会在车顶上设置顶灯,随着智能提示牌的出现,也出现了一种同样包括LED显示屏的智能顶灯,智能顶灯可以把“空车”和“载客”等营运状态信息更大更醒目地显示出来。此外,智能顶灯相对于智能提示牌,具有显示面积大的优势。除显示“空车”和“载客”等营运状态信息外,还使其具有了显示目标方向的可能。但是由于乘客的目的地具有随机性,无法一一预设在操作键盘上,只能由司机,在乘客上车后,手动输入以使其在顶灯上显示。文字输入过程即给司机带来操作上的麻烦,又浪费了乘客的时间。如司机在车轴起步后进行目标方向的输入,则会带来行车安全隐患。
发明内容
本发明的目的是,针对现有技术中存在的上述不足,提供一种可以免除司机手工控制提示牌或出租车顶灯的方案。该方案公开一种基于语音控制的出租车顶灯及车载显示设备控制系统。为了实现上述目的,本发明所采用的技术方案是:一种出租车顶灯语音控制系统,包括设置于车厢内的控制器和设置于车顶的LED顶灯。所述控制器包括:包括用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器、及用于提供人机交互界面的触摸显示屏;所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的音频信号输入接口与A/D采样电路的输出端连接;语音识别模块的数据输入接口连接音频编码模块的音频数据输出接口 ;CPU通过数字接口与音频采集模块、音频编码模块、及语音识别模块的控制接口连接;
CPU通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮,提示语音录入的按钮被触发后,CPU控制音频采集模块、音频编码模块开始采集并编码音频信号,同时在触摸显示屏上输出用于提示停止语音录入的按钮,提示停止语音录入的按钮被触后或者检测无语音信号达到预设延时后,控制音频采集模块、音频编码模块停止,并控制语音识别模块开始语音识别;语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的文字特征库,进行特征匹配,将特征匹配的文字信息输出,若无匹配文字时,则输出当前音频数据的特征数据;CPU通过数字接口与语音识别模块的输出接口连接,通过RS232接口与LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到LED顶灯,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮;CPU检测到语音识别模块输出为音频数据的特征数据后,在触摸显示屏上输出提示驾驶员手动输入文字的提示信息及用于文字输入的触摸键盘或手写框,CPU触摸显示屏输入的文字及对应的特征及语音识别模块输出的音频数据的特征数据存入文字特征库,更新特征模型,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮。本发明通过设计具有语音输入功能的出租车专用的LED顶灯控制器的方式构建出租车顶灯控制系统,有效解决了手动输入顶灯显示内容操作不便、浪费乘客时间、导致安全隐患等问题。此外,鉴于出租车运行环境多处于嘈杂的环境之中,出租车大多行驶于大街小巷,人流密集的环境之下,加上出租车司机的口音差别极大,以及同一辆车会有多个司机轮流驾驶的情况,为了提高语音识别率,特别为控制器增加了特征学习功能。通过提示驾驶员手动输入当前音频数据对应的文字信息的方式,不断扩大文字特征库,进而提高控制器的语音识别能力。由于单辆出租车司机相对固定(一般一台出租车由一到两个司机驾驶)的特点,针对特定的出租车司机进行长期特征学习后,识别率将显著提高。针对两个出租车司机驾驶同一辆出租车的情况,为了避免不同司机口音不同相互影响,妨碍语音识别率的提高,本发明还提出了一种基于多个文字特征库的改进方案,具体为:一种出租车顶灯语音控制系统,包括设置于车厢内的控制器和设置于车顶的LED顶灯。所述控制器包括:包括用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器、及用于提供人机交互界面的触摸显示屏;所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的音频信号输入接口与A/D采样电路的输出端连接;语音识别模块的数据输入接口连接音频编码模块的音频数据输出接口 ;所述语音特征库包括分别对应不同ID号码的多个语音特征库;CPU通过数字接口与音频采集模块、音频编码模块、及语音识别模块的控制连接;CPU通过触摸显示屏驱动电路在触摸显示屏上输出驾驶员ID选择界面,并将被选的ID号码寄存在存储器内;CPU通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮,提示语音录入的按钮被触发后,CPU控制音频采集模块、音频编码模块开始采集并编码音频信号,同时在触摸显示屏上输出用于提示停止语音录入的按钮,提示停止语音录入的按钮被触后或者检测到无语音信号达到预设延时后,CPU控制音频采集模块、音频编码模块停止,并控制语音识别模块开始语音识别;语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的对应被选ID号码的文字特征库,进行特征匹配,将特征匹配的文字信息输出,若无匹配文字时,则输出当前音频数据的特征数据;CPU通过数字接口与语音识别模块的输出接口连接,通过RS232接口与LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到LED顶灯,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮;CPU检测到语音识别模块输出为音频数据的特征数据后,在触摸显示屏上输出提示驾驶员手动输入文字的提示信息及用于文字输入的触摸键盘或手写框,CPU触摸显示屏输入的文字及语音识别模块输出的音频数据的特征数据存入对应被选ID号码的文字特征库,更新特征模型,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮。此改进方案,可以针对不同驾驶员使用不同的文字特征库,有效地避免不同司机口音不同相互影响的问题,可大大提高控制器的语音识别能力。
图1为本发明所述出租车顶灯控制系统的原理框图。图2为出租车顶灯控制系统的控制器的一种具体硬件拓扑结构图。图3为出租车顶灯控制系统的一种具体软件流程图。图4为语音识别算法原理图。图5为MFCC计算流程图。图6为DWT算法搜索路径图。
具体实施例方式下面针对本发明上述方案,给出一个具体实例,以进一步说明本发明所述的出租车顶灯控制系统。在本例中,所述控制器的语音识别采用Mel倒谱提取MFCC的改进算和动态时间规整(DTW)算法。该改进算法不直接对语音短时幅度谱进行提取,而是首先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,从而降低基音频率对其的影响。根据提取梅尔倒谱系数和动态时间弯折的模板匹配的优点,对输入语音信号进行端点检测,可以较好地对特定人的孤立词进行识别。同时算法给出了 MFCC参数提取,对断点检测进行性能分析和评价。实验结果表明算法具有非常高准确的识别效果。一、硬件设计本例控制器硬件拓扑结构如图2所示,主要由音频解码模块、降噪合成模块、CPU核心处理模块、电源模块(电源驱动电路)、备有不间断电源1、/0接口、串口输入输出、3G通讯模块、A/D转换模块、音频采集器、等搭建而成,系统还增设了通讯模块,通讯模块备选,是设备的语音等各类信息通过通讯模块上传至后台,实现信息化管理,系统使用的核心处理器采用的是ARM高速处理芯片。语音信息通过音频信号采集、过滤、降噪后提供高保真的音频信息,经A/D转换模块将模拟信号转换成数字型号,处理器通过专用算法识别关键词语并动态编辑关键词列表,输出结果由I/O端口确认,输出正确的显示信息或控制指令通过总线传送至电子营运证执行和智能顶灯显示语音信息。本系统是通过嵌入式语音识别技术,在处理复杂的音频处理系统中能灵活地输入输出音频数据。固件、硬件设计上在保护模式下完全禁止访问FLASH存储器。编程后,可以从嵌入式存储器启动,从而充当一个完全定制语音识别设备。从而更有效的提高设备的语音识别率。所述音频采集模块采用抗噪音麦克风,音频编码芯片选用vsl005,其主要功能是将语音信号采集到信号处理模块内,并通过语音识别算法提取出相应的语音特征数据。音频编码芯片VS1005能获得非常好的音效,并且比软件省电。VS1005是一片灵活的音频平台器件。它基于VS_DPS4构件,这是一个功能强大的DSP (数字信号处理器)核心。在独立应用中,数字接口提供了灵活的外部器件访问。在复杂的音频处理系统中能灵活地输入输出音频数据。模拟接口提供了高保真的音频输入和输出,例如控制ADC可以作为电阻式触摸屏接口。VS1005拥有8Mbit (IMByte)VLSI或定制方或第三方定制的嵌入式FLASH存储器。固件和硬件设计上在保护模式下完全禁止访问FLASH存储器。编程后,VS1005可以从嵌入式存储器启动,从而充当一个完全定制的独立音频处理器。CPU 选用 ARM9 高速处理器 S3C2440 芯片,S3C2440 采用了 ARM920t 的内核,0.13um的CMOS标准宏单元和存储单元。其低功耗,简单,优雅,且全静态设计特别适合于对成本和功率敏感型的应用。语音识别模块采用LD3320专用语音识别芯片。LD3320芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路,包括AD、DA转换器、麦克风接口、声音输出接口等。本芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以任意动态编辑的。二、软件设计本系统软件流程图如图3所示2.1系统调度本系统采用音频编解码芯片VS1005音频模块对语音信号进行采集,通过定时中断来控制系统运行。主程序使能音频模块,从音频模块的缓冲区内读取音频数据到DDR SDRAM存储器中。当音频模块缓冲区全部为空时,主程序对DDR内的数据进行预处理、端点检测、MFCC参数提取。模式匹配算法采用动态时间规整(DTW)算法。2.2算法原理语音识别模块的基本结构如图4所示,MFCC计算流程如图5所示。2.2.1分帧、预加重处理预加重的目的是为了对语音的高频部分进行加重增加其高频分辨率,一般通过传递函数为H(Z)=1-αZ-1。 α取0.98;语音信号具有短时平稳的特点,因此可以对语音信号进行分帧处理,从而减小因语音信号时变性强带来的负面效果。预加重算法:sign (n) =s (n) -a*s (n-1)式中:α取0.9 ;s(n)为数字化的语音信号;sign(n)为加重后的语音信号。分帧算法:
权利要求
1.一种出租车顶灯语音控制系统,包括设置于车厢内的控制器和设置于车顶的LED顶灯; 所述控制器包括:包括用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器、及用于提供人机交互界面的触摸显示屏; 所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的音频信号输入接口与A/D采样电路的输出端连接;语音识别模块的数据输入接口连接音频编码模块的音频数据输出接口; CPU通过数字接口与音频采集模块、音频编码模块、及语音识别模块的控制接口连接;(PU通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮,提示语音录入的按钮被触发后,CPU控制音频采集模块、音频编码模块开始采集并编码音频信号,同时在触摸显示屏上输出用于提示停止语音录入的按钮,提示停止语音录入的按钮被触后或者检测无语音信号达到预设延时后,控制音频采集模块、音频编码模块停止,并控制语音识别模块开始语音识别; 语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的文字特征库,进行特征匹配,将特征匹配的文字信息输出,若无匹配文字时,则输出当前音频数据的特征数据; CPU通过数字接口与语音识别模块的输出接口连接,通过RS232接口与LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到LED顶灯,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮; CPU检测到语音识别模块输出为音频数据的特征数据后,在触摸显示屏上输出提示驾驶员手动输入文字的提示信息及用于文字输入的触摸键盘或手写框,CPU触摸显示屏输入的文字及对应的特征及语音识别模块输出的音频数据的特征数据存入文字特征库,更新特征模型,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮。
2.—种出租车顶灯语音控制系统,包括设置于车厢内的控制器和设置于车顶的LED顶灯; 所述控制器包括:包括用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器、及用于提供人机交互界面的触摸显示屏; 所述音频采集模块包括麦克风和A/D采样电路,A/D采样电路采样麦克风生成的模拟音频信号并输出;所述音频编码模块的音频信号输入接口与A/D采样电路的输出端连接;语音识别模块的数据输入接口连接音频编码模块的音频数据输出接口; 所述语音特征库包括分别对应不同ID号码的多个语音特征库; CPU通过数字接口与音频采集模块、音频编码模块、及语音识别模块的控制连接; (PU通过触摸显示屏驱动电路在触摸显示屏上输出驾驶员ID选择界面,并将被选的ID号码寄存在存储器内; (PU通过触摸显示屏驱 动电路在触摸显示屏上输出用于提示语音录入的按钮,提示语音录入的按钮被触发后,CPU控制音频采集模块、音频编码模块开始采集并编码音频信号,同时在触摸显示屏上输出用于提示停止语音录入的按钮,提示停止语音录入的按钮被触后或者检测到无语音信号达到预设延时后,CPU控制音频采集模块、音频编码模块停止,并控制语音识别模块开始语音识别; 语音识别模块读取音频编码模块缓冲区中音频数据,提取音频数据的特征,并搜索预存于存储器中的对应被选ID号码的文字特征库,进行特征匹配,将特征匹配的文字信息输出,若无匹配文字时,则输出当前音频数据的特征数据; CPU通过数字接口与语音识别模块的输出接口连接,通过RS232接口与LED顶灯连接,CPU通过RS232接口将语音识别模块输出的文字信息显示到LED顶灯,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮; CPU检测到语音识别模块输出为音频数据的特征数据后,在触摸显示屏上输出提示驾驶员手动输入文字的提示信息及用于文字输入的触摸键盘或手写框,CPU触摸显示屏输入的文字及语音识别模块输出的音频数据的特征数据存入对应被选ID号码的文字特征库,更新特征模型,同时通过触摸显示屏驱动电路在触摸显示屏上输出用于提示语音录入的按钮。`
全文摘要
本发明属于出租车智能顶灯及车载智能设备技术领域,公开了一种出租车顶灯语音控制系统,包括设置于车厢内的控制器和设置于车顶的LED顶灯,所述控制器包括包括用采集司机语音的音频采集模块、用于编码音频信号的音频编码模块、用于识别音频信号的语音识别模块、用于为各模块提供电源的电源驱动电路、CPU、用于存储语音特征库及程序代码的存储器、及用于提供人机交互界面的触摸显示屏。本发明通过设计具有语音输入功能的出租车专用的LED顶灯控制器的方式构建出租车顶灯控制系统,有效解决了手动输入顶灯显示内容操作不便、浪费乘客时间、导致安全隐患等问题。
文档编号B60Q1/50GK103204100SQ20131011991
公开日2013年7月17日 申请日期2013年4月8日 优先权日2013年4月8日
发明者洪海峰, 楼远志, 周艳会 申请人:浙江海联电子有限公司