一种基于非特定人语音识别的四旋翼飞行器控制系统的制作方法

文档序号:18088939发布日期:2019-07-06 10:39阅读:271来源:国知局
一种基于非特定人语音识别的四旋翼飞行器控制系统的制作方法

本发明涉及通信、信号处理与嵌入式技术领域,尤其是一种非特定人语音识别的控制系统。



背景技术:

随着科学技术的迅速发展和人民生活水平的不断提高,遥控飞行器极大地方便了和丰富了人们的日常生产、生活,越来越受到人们的青睐。其中,四旋翼飞行器采用四个旋翼作为飞行的直接动力源,旋翼对称分布在机体的前后、左右四个方向,四个旋翼处于同一高度平面,且四个旋翼的结构和半径都相同,旋翼1和旋翼3逆时针旋转,旋翼2和旋翼4顺时针旋转(针对x型接线方式,机头右侧为旋翼1,逆时针依次为旋翼2,旋翼3,旋翼4,为表述方便,自己定义旋翼的序号,实际只需满足电机旋转方向与正反桨的配合,使四旋翼产生向上的升力即可),四个电机对称的安装在飞行器的支架端,支架中间空间安放飞行控制计算机和外部设备。与传统的直升机不同,四旋翼飞行器只能通过改变螺旋桨的速度来实现各种动作,传统的由遥控器控制的四旋翼飞行器,由于遥控器必须与飞行器配套使用,且其操作性复杂,仅适用于具有一定的操作能力的人群,存在通用性、普适性差等问题,限制了人们的使用需求。



技术实现要素:

为了克服现有技术的不足,解决现有的四旋翼飞行器控制操作性复杂、普适性差等问题,本发明提出一种基于非特定人语音识别技术的四旋翼飞行器控制系统,降低了操作四旋翼飞行器的难度,具有较强的普适性。

本发明解决其技术问题所采用的技术方案是:

一种基于非特定人语音识别技术的四旋翼飞行器控制系统,包括语音输入装置、语音识别模块、主控模块、串口转wifi模块、wifi接收模块、飞行控制模块、一号电源模块和二号电源模块,其中,所述语音输入装置、语音识别模块、主控模块、串口转wifi模块和一号电源模块安装在操纵遥控器上,wifi接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上。

所述语音输入装置为麦克风,语音识别模块将识别后的语音输入到主控模块,主控模块将语音信号输入串口转wifi模块,串口转wifi模块与四旋翼飞行器上的wifi接受模块通过tcp/ip协议的网络连接,一号电源模块同时为语音输入装置、语音识别模块、主控模块、串口转wifi模块供电;四旋翼飞行器的wifi接收模块接收到语音信号后,将信号输入飞行控制模块,二号电源模块为wifi接受模块和飞行控制模块供电。

所述语音输入装置将语音信号转化为50毫伏的电压信号,所述语音识别模块包含放大滤波单元、语音识别处理单元和中断信号输出单元,经麦克风转化后的电压信号经过放大滤波单元后,进入语音识别处理单元,通过与语音库进行对比模板进行匹配识别,进行判决,如果匹配成功,语音识别处理单元将会输出判决信号,判决信号进入中断信号输出单元,中断信号输出单元输出触发中断信号进入主控模块,语音识别模块以嵌入式微处理器为核心,采用ld332x系列语音识别芯片和控制电路,设计实现非特定语音控制系统。

所述主控模块接收语音识别模块输出的触发中断信号,中断接收单元开始接收触发中断信号,同时mcu(microcontrollerunit)单元通过串口输出单元向串口转wifi模块发送at指令;

所述串口转wifi模块的串口接收单元接收到串口输出单元发出的at指令,通过无线协议单元中的ieee802.11nwifi协议进行转换,然后将at指令通过at指令发送单元进行发射。

所述wifi接收模块包含at指令接收单元,用于接收串口转wifi模块发出的at指令。

所述飞行控制模块,根据飞行控制模块i/o口管角发送的脉冲宽度调制信号,利用姿态控制算法得到四旋翼的四个电机的等效电压,通过改变飞行控制模块管角输出电压波形的占空比,进而改变其等效电压,使得每一个电机的转速不同,进而改变飞行姿态,进而实现对四旋翼飞行器的飞行姿态的控制。

所述一号电源模块和二号电源模块均包含电池单元和电平转换单元。

本发明的有益效果在于由于采用语音识别技术,能够通过非特定人语音来控制四旋翼飞行器,适用性强,解决了传统遥控飞行器遥控器操作复杂性、普适性差的问题,同时语音识别结合pnsc的语言特征提取方法是的语音的输入对环境质量的要求大大降低,采集得到的语音信号信噪比大大提高,因此语音信号的识别正确率得到了提高。

附图说明

图1是为本发明的系统组成原理图;

图2为本发明所述系统的控制流程图;

图3为本发明语音识别原理流程框图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

一种基于非特定人语音识别技术的四旋翼飞行器控制系统,如图1所示,包括语音输入装置(麦克风)、语音识别模块、主控模块、串口转wifi模块、wifi接收模块、飞行控制模块、一号电源模块和二号电源模块,其中,所述语音输入装置、语音识别模块、主控模块、串口转wifi模块和一号电源模块安装在操纵遥控器上,wifi接收模块、飞行控制模块和二号电源模块安装在四旋翼飞行器上。

所述语音输入装置为麦克风,语音识别模块将识别后的语音输入到主控模块,主控模块将语音信号输入串口转wifi模块,串口转wifi模块与四旋翼飞行器上的wifi接受模块通过tcp/ip协议的网络连接,一号电源模块同时为语音输入装置、语音识别模块、主控模块、串口转wifi模块供电;四旋翼飞行器的wifi接收模块接收到语音信号后,将信号输入飞行控制模块,二号电源模块为wifi接受模块和飞行控制模块供电。

所述语音输入装置将语音信号转化为50毫伏的电压信号,所述语音识别模块包含放大滤波单元、语音识别处理单元和中断信号输出单元,经麦克风转化后的电压信号经过放大滤波单元后,进入语音识别处理单元,通过与语音库进行对比模板进行匹配识别,进行判决,如果匹配成功,语音识别处理单元将会输出判决信号,判决信号进入中断信号输出单元,中断信号输出单元输出触发中断信号进入主控模块,语音识别模块以嵌入式微处理器为核心,采用ld332x系列语音识别芯片和控制电路,设计实现非特定语音控制系统。

所述主控模块接收语音识别模块输出的触发中断信号,中断接收单元开始接收触发中断信号,同时mcu(microcontrollerunit)单元通过串口输出单元向串口转wifi模块发送at指令;

所述串口转wifi模块的串口接收单元接收到串口输出单元发出的at指令,通过无线协议单元中的ieee802.11nwifi协议进行转换,然后将at指令通过at指令发送单元进行发射。

所述wifi接收模块包含at指令接收单元,用于接收串口转wifi模块发出的at指令。

所述飞行控制模块,根据飞行控制模块i/o口管角发送的脉冲宽度调制信号,利用姿态控制算法得到四旋翼的四个电机的等效电压,通过改变飞行控制模块管角输出电压波形的占空比,进而改变其等效电压,使得每一个电机的转速不同,进而改变飞行姿态,进而实现对四旋翼飞行器的飞行姿态的控制。

所述一号电源模块和二号电源模块均包含电池单元和电平转换单元。

所述语音输入装置(麦克风)用于将非特定人语音信号转化为微弱的电信号。

所述语音识别模块,包含放大滤波单元、语音识别处理单元和中断信号输出单元。其中,放大滤波单元用于滤除声音信号的杂波,在进行放大,便于语音识别处理单元的特征参数提取和对比,中断信号输出单元用于触发主控模块的中断响应。

对于放大滤波单元,要求带通频率范围为300hz-3400hz,所述的语音识别处理单元,采用ld3320语音识别芯片和相关控制电路,ld3320芯片集成了语音识别处理器和外部电路,包括ad和da转换器、麦克风、声音输出接口。

所述主控模块,包含中断接收单元、mcu单元和串口输出单元,其中,经多次试验论证,为能够保证控制系统的数据运算能力,要求微处理器主频不低于8mhz,字长不低于8位,内存不少于8kb(保证系统稳定工作的最低要求);同时,要求具有通用i/o接口,外部中断/事件控制器,用于产生中断/事件请求,串口输出单元(9)用于向串口转wifi模块的输出相应的at指令。本实施例中,主控模块可选择意法半导体公司stm32单片机。

所述串口转wifi模块,包含串口接收单元、无线协议单元和at指令发送单元。无线协议单元(12)采用tcp/ip协议即internet的协议规范。采用uart接口,内置ieee802.11协议以及tcp/ip协议,能够实现用户串口到无线网络之间的转换。at指令发送单元(13)即将串口接收单元(11)接收的数据发送到该网络。

所述wifi接收模块(14),包含at指令接收单元(15)。其中,该wifi接收模块(14)作为ap接入点,而串口转wifi模块(10)作为客户端。网络参数如:串口配置,格式如下:波特率,数据位,校验位,停止位;网络模式,选择client、server或者none;服务器域名或者ip地址等都可以自己设置。

所述飞行控制模块(16),包括飞行控制mcu单元(17),姿态调整单元(18)。其中,经多次试验论证,为能够保证控制系统的数据运算能力,要求飞行控制mcu单元(17)主频不低于16mhz,字长不低于8位,内存不少于64kb,拥有8位以上定时器和6路以上10位模数转换器,具有i2c通信功能;姿态调整单元(18)中,要求陀螺仪具有i2c通信功能,测量角速度范围±2000rad/s之间,输出数字信号频率不低于400hz;要求加速度计测量范围不低于8g,分辨率不低于10位,具有i2c通信功能。为满足以上技术要求,本实施例中,控制器可选择意法半导体公司stm32单片机,陀螺仪选择l3g4200d三轴陀螺仪,加速度及选择adxl345三轴加速度计。

所述电源模块(19)、(22),包括电池1单元(20)、电池2单元(23)和电平转换单元(21)、(24)。电池1单元(20)的作用是提供为各个模块的总电源,电平转换单元(21)作用是根据系统中各功能模块的工作电平为它们供电。电池2单元(23)的作用是提供系统总电源并为四旋翼飞行器的电机供电;电平转换单元(24)作用是根据系统中各功能模块的工作电平为它们供电。为保证较长的续航时间和较大的供电电压,要求电池2单元(23)容量不低于2000mah,本实施例中选择电池2单元(23)容量2000mah,电压12v;电平转换单元(24)需要能将电池2单元(23)电压转换为3.3v--5v的连续可调电压,本实施例中要求将12v输入电压转换并稳定至5v输出电压,输出电压误差控制在±4%以内,振荡频率误差在±15%以内,可选择lm2596开关电压调节器作为电平转换单元(24)。

所述语音输入装置(麦克风)、语音识别模块、主控模块、串口转wifi模块、电源模块(19)均作为用户端。所述wifi接收模块、飞行控制模块、电源模块(22)均安装在四旋翼飞行器上。

语音输入装置与语音识别模块相连,语音识别模块与主控模块相连,主控模块与串口转wifi模块相连,串口转wifi模块与四旋翼飞行器上的wifi模块通过tcp/ip协议的网络连接,四旋翼飞行器的wifi模块与飞行控制模块相连。电源模块(19)同时与语音输入装置、语音识别模块、主控模块、串口转wifi模块。电源模块(22)与wifi模块、飞行控制模块相连。

本发明采用高性能ld3320语音识别芯片和控制电路,实现非特定人语音控制四旋翼飞行控制器。

语音识别技术即语音识别过程,主要包括两个阶段:训练阶段和识别阶段。两个阶段都必须对输入语音进行预处理和特征提取。

(1)训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征参数,最后通过特征参数建模达到建立训练语音的参考模型库的目的。

(2)识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出,从而达到了语音识别的目的。

一种基于非特定人语音识别的四旋翼飞行器控制系统,所述非特定人语音识别控制四旋翼飞行器的具体工作流程包括:

a)语音识别单元将非特定人语音进行识别,并转化成相应的at指令。

b)串口转wifi单元将与语音识别相应的at指令发送出去。

c)飞行控制模块通过wifi接收模块,接收相应的at指令,生成控制各个轴的转速的pwm波,调整飞行姿态。

所述基于非特定人语音识别技术的四旋翼飞行器控制系统中进行语音识别的步骤如下:

步骤1将通过mic录入的语音信号首先经过预处理,所述预处理包括语音信号的采样、反混叠滤波和语音增强;

步骤2:对录入的语音信号提取语音特征,从语音信号波形中提取一组或多组描述语音信号特征的参数,包括语音信号的周期、幅值和初相位,得到语音的特征信息(即语音内容的关键词),将储存在芯片存储器中的关键词数据库(即训练模板)中的数据与对录入的语音信号进行提取的语音内容的关键词,芯片中所存储的关键词数据库中的关键词数据库是事先由训练模式下,人为输入语音信息进行语音信号特征提取之后得到的内容关键词语数据,将关键词语数据保存得到的关键词数据库,词表中每个词对应一个参考模式。

步骤3:经过信号分析后对输入的语音信号与训练模板中事先在训练模板中所储存的语音信号,进行频率,幅值,初相位相比,与训练模板中的语音信号相比,参数越接近,芯片自动根据相似度,对识别结果进行打分,训练模板中存储的语音信号的周期为2s,另一个训练模板中存储的语音信号数据的周期为1s,当输入的语音信号经过特征提取后周期为1.8s,则芯片自动判断,此输入信号与对应周期为2s的语音信号更为接近,根据比例计算得分,同理比较初相位等其他参数,最终总分之和越高,以此类推,找出得分最高的关键词语作为识别结果输出。

根据语音识别芯片的识别结果,即判断是否符合数据库中的关键词,单片机会根据语音芯片的识别结果输出不同状态的逻辑电平信号,即满足数据库中的关键词,单片机输出电平信号,不满足时输出相反逻辑的电平信号,(这里由用户在单片机的程序代码中进行自定义),单片机输出的电平信号来控制部件工作,其电平信号通过外部模块可以驱动无人机工作,进而实现整个系统的语音控制。比如当识别到包含“起飞”关键词语的语音信号,并经过语音芯片判断结果为正确,单片机输出电平信号驱动电机转动,无人机开始起飞,识别控制过程完成。

本系统非特定人语音识别技术的创新点在于抗噪声的语音识别,在语音的特征矢量参数上采用了基于“pnsc”的语音特征提取方法。目前常用的mel尺度倒谱mfcc系数分析为安静环境中的语音提供了一个很好的语音特征表达,然而训练环境与识别环境的不匹配时,即使用纯净语音训练出的模型去识别带噪声语音时,其性能将急剧下降。谱压缩技术是一种能有效地减少模型训练和应用环境间失配的技术,该技术是用一个固定的压缩因子来压缩语音信号的功率谱,使训练与识别环境更加匹配,最终达到提高识别率的目的。采用同样的压缩因子,可能会过分压缩某些分量而同时轻微压缩另外一些分量。pnsc即一种基于感知的非均匀谱压缩技术,pnsc技术用根据各个频率点或频带特性来生成的不同压缩因子取代同一固定压缩因子压缩各个频率点或频带。本系统采用基于mfcc系数的算法并运用psnc技术,在各种环境噪声下的识别效果如下表:

表1噪声环境下基于mfcc系数算法的识别率

如图2所示,使用上述系统对四旋翼飞行器进行控制的方法如下:

首先,打开电源模块(19)和四旋翼飞行器上的电源模块(22),等待飞行控制模块上的自检。

当看到串口转wifi模块(10)上的指示灯黄绿间接闪烁,表明正常工作,等待发送at指令。

当看到螺旋桨转了一下并且听到“唧唧”声,表明程序初始化成功且电机正常通电;

当看到四旋翼飞行器上的指示灯由红变绿,表明wifi模块(14)正常工作,等待接收at指令。

当完成这些准备工作,可以通过语音控制四旋翼飞行器。控制者可以对着麦克风发出命令:“起飞”、“着陆”、“向上”、“向下”“向左”、“向右”、“向前”、“向后”。语音识别模块(2)中的放大滤波单元(3)对该命令的电信号进行放大滤波,语音识别处理单元(4)进行命令匹配,若匹配成功,主控模块(6)向串口转wifi模块(10),写入at指令,分别为at*ref=1,290718208(起飞)、at*ref=1,290717696(着陆)、at*pcmd=1,1,0,0,1036831949,0(向上)、at*pcmd=1,1,0,0,-1110651699,0(向下)、at*pcmd=1,1,-1110651699,0,0,0(向左)、at*pcmd=1,1,1036831949,0,0,0(向右)、at*pcmd=1,1,0,-1110651699,0,0(向前)、at*pcmd=1,1,0,1036831949,0,0(向后);若匹配不成功,则指令无效。

wifi接收模块(14)接收到该at指令,然后传送到飞行控制mcu单元(17),此单元将指令信息转换为一组脉冲调制信号。

姿态调整单元(18)根据脉冲调制信号产生pwm波调制电机转速。“起飞”执行结果即四旋翼飞行器悬停在垂直距离起飞点1m处,然后对于“向上”、“向下”“向左”、“向右”、“向前”、“向后的命令,即有效执行一次,所处位置距离上次位置0.1m。

以四旋翼飞行器执行一次飞行动作为例。

接通电源模块,等待初始化完成;

对着麦克风说“起飞”,四旋翼飞行器启动,悬停在垂直距离起飞点1m左右;

对着麦克风说“向上”,四旋翼飞行器向上飞行0.1m左右;

对着麦克风说“向上”,四旋翼飞行器继续向上飞行0.1m左右;

对着麦克风说“向前”,四旋翼飞行器向前飞行0.1m左右;

对着减小pwm波输出,直至降落地面。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1