基于5.8GHz无线传输电视远场语音识别系统及方法与流程

文档序号:15562087发布日期:2018-09-29 02:29阅读:305来源:国知局

本发明涉及电视机技术领域,特别涉及一种基于5.8ghz无线传输电视远场语音识别系统及方法。



背景技术:

随着智能电视技术的发展,人机交互方式日益多样化,目前基于语音识别技术在电视机中的应用日趋广泛,语音技术能够让客户更方便快捷的操作电视。

目前大多智能电视自带的语音识别功能需要用户距离电视很近的距离,甚至贴近电视交互才能正确的识别用户指令,随着距离的增加,识别率也随之下降。基于上述问题,无线传输成为了一种理想的解决方案,无线传输能够摆脱数据线的限制,从而解决用户语音交互距离局限性,目前无线传输的方式很多,例如zigbee、蓝牙或者wifi等,但是上述方式存在一定的局限性,其中最重要的瓶颈就是各设备当前使用的2.4ghz频段越来越拥挤,并且受到的干扰越来越多,尤其对于智能电视,自身集成的2.4ghz模块很多,如wifi和蓝牙,很容易对语音信号造成干扰,影响语音识别效果。更为重要的是,2.4ghz的无线传输技术为了解决相互干扰问题,大多采用了跳频技术,然而由于跳频协议的使用造成了无线数据额外的传输时延,造成人机交互不理想,这对语音识别来说无疑是致命的缺陷。基于上述问题可知,当前智能电视远场语音识别系统存在局限性,满足不了电视远场语音识别的需求。



技术实现要素:

本发明的主要目的是提供一种基于5.8ghz无线传输电视远场语音识别系统,旨在减少无线数据额外的传输时延,以使人机交互更理想,从而满足当前电视远场语音识别的要求。

为实现上述目的,本发明提出一种基于5.8ghz无线传输电视远场语音识别系统,该基于5.8ghz无线传输电视远场语音识别系统包括移动语音端及电视端,所述移动语音端包括麦克风阵列模块、adc模块、dsp处理模块、第一5.8ghz射频模块;所述电视端包括第二5.8ghz射频模块及电视端soc系统;其中,

所述麦克风阵列模块,用于采集混场语音数据,所述混场语音数据包括用户发出的语音指令及电视端发出的声音数据;所述adc模块,用于对所述混场语音数据进行模数转换;所述dsp处理模块,用于获取经所述adc模块模数转换后的混场语音数据以及通过所述第一5.8ghz射频模块获取所述电视端发出的声音数据,并通过预设算法滤除所述电视端的声音数据以获得所述用户发出的语音指令,并将所述语音指令输出至所述第一5.8ghz射频模块;所述第一5.8ghz射频模块,用于获取所述电视端发出的声音数据以及将所述dsp处理模块输出的所述语音指令调制为频段为5.8ghz的语音指令;所述第二5.8ghz射频模块,用于接收所述频段为5.8ghz的语音指令,并对所述频段为5.8ghz的语音指令进行解调处理,并将解调处理后的语音指令发送至所述电视端soc系统;所述电视端soc系统,用于将接收到的语音指令与云端语音数据库进行数据对比,生成操作指令,进而控制所述电视端的app完成对应的语音指令操作。

优选地,所述adc模块的第一信号端与所述麦克风阵列模块的信号输出端连接,所述adc模块的第二信号端与所述dsp处理模块的第一信号端连接。

优选地,所述dsp处理模块包括语音处理芯片,所述语音处理芯片包括用于处理不同通道音频数据的多个逻辑处理核、用于数据缓存的sram单元以及用于语音数据缓存的flash单元。

优选地,所述第一5.8ghz射频模块包括具有和所述dsp处理模块进行数据通信的第一通信单元和具有对所述用户发出的语音指令或者所述电视端发出的声音数据进行调制和解调的第一调制解调单元,所述第一通信单元的第一信号端与所述dsp处理模块的第二信号端连接,所述第一通信单元的第二信号端与所述第一调制解调单元的信号端连接。

优选地,所述第二5.8ghz射频模块包括具有和所述电视端soc系统进行数据通信的第二通信单元以及对所述用户发出的语音指令或者所述电视端发出的声音数据进行调制和解调的第二调制解调单元,所述第二通信单元的第一信号端与第二调制解调单元的信号端连接,所述第二通信单元的第二信号端与所述电视端soc系统的信号端连接。

为实现上述目的,本发明还提出一种基于5.8ghz无线传输电视远场语音识别方法,该方法包括:

步骤s100、采集混场语音数据并对所述混场语音数据进行模数转换,所述混场语音数据包括用户发出的语音指令及电视端发出的声音数据;步骤s200、获取所述模数转换后的混场语音数据以及所述电视端发出的声音数据,并根据预设算法滤除电视端发出的声音数据,以获得用户发出的语音指令;步骤s300、将所述语音指令调制为频段为5.8ghz的语音指令并输出;步骤s400、接收所述频段为5.8ghz的语音指令且对接收到的所述频段为5.8ghz的语音指令进行解调处理;步骤s500、将接收到的语音指令与云端语音数据库进行数据对比,生成操作指令,进而控制电视端的app执行对应的语音指令操作。

优选地,步骤s200包括:步骤s210、获取所述模数转换后的混场语音数据以及电视端发出的声音数据,并对所述电视端发出的声音数据进行缓存;步骤s220、根据预设算法所述电视端发出的声音数据以获得所述用户发出的语音指令;步骤s230、对所述语音指令进行信号预加重以及加窗预处理后输出。

优选地,步骤s300包括:步骤s310、接收所述预加重以及加窗预处理后的语音指令并对接收到的所述预加重以及加窗预处理后的语音指令变频为中频信号;步骤s320、对所述中频信号进行低通滤波、并变频为频段为5.8ghz的高频载波信号;步骤s330、对所述频段为5.8ghz的高频载波信号进行滤波、信号放大并通过天线发射。

优选地,步骤s400包括:步骤s410、接收所述频段为5.8ghz的高频载波信号并对接收到的所述频段为5.8ghz的高频载波信号进行低噪声放大处理;步骤s420、对低噪声放大处理后的高频载波信号进行混频以获得中频信号;步骤s430、对所述中频信号进行滤波、变频以获得所述用户发出的语音指令并输出。

优选地,步骤s500包括:步骤s510、接收所述用户发出的语音指令,并对接收到的所述用户发出的语音指令进行语音分析以及测度分析;步骤s520、对语音分析以及测度分析后的语音指令与云端语音数据库进行数据搜索及对比,进而作出识别判决;步骤s530、控制电视端的app执行对应的语音指令操作。

本发明技术方案通过采用麦克风阵列模块、adc模块、dsp处理模块、第一5.8ghz射频模块、第二5.8ghz射频模块及电视端soc系统组成基于5.8ghz无线传输电视远场语音识别系统,工作时,麦克风阵列模块采集多方位的混场声音数据,adc模块对混场语音数据进行模数转换并将数字语音信号发送至dsp处理模块,dsp处理模块接收到数字语音数据以及通过第一5.8ghz射频模块接收电视端发出的声音数据,同时实现电视端发出的声音数据的本地存储,并通过预设的dsp算法实现电视喇叭声音、人发出的指令声音和环境噪声的识别,特征提取、消躁,从而滤除电视端发出的声音数据等处理,第一5.8ghz射频模块和第二5.8ghz射频模块同时实现多信道语音指令或者电视端发出的声音数据的调制解调,同时完成和dsp处理模块以及电视端soc系统的数据通信,第二5.8ghz射频模块将处理后的语音指令发送至电视端,电视端soc系统接收到用户发出的语音指令后,将用户发出的语音指令与云端语音数据库进行数据对比处理,识别语音指令,进而控制电视端的app完成语音对应的指令操作。本发明采用5.8ghz频段载波的无线技术传输语音数据,相比2.4ghz频段载波的无线技术拥有更宽的传输带宽,并且,5.8ghz系统采用直接序列扩频技术,信道更多,频率更高,抗干扰能力更强,无额外的传输时延,人机交互更理想,能够更好的满足电视远程语音识别及数据传输的需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为本发明基于5.8ghz无线传输电视远场语音识别系统一实施例的功能模块示意图;

图2为本发明基于5.8ghz无线传输电视远场语音识别系统中5.8ghz音频数据传输协议栈的数据结构示意图;

图3为基于5.8ghz无线传输电视远场语音识别系统中所述第一5.8ghz射频模块的结构示意图;

图4为本发明基于5.8ghz无线传输电视远场语音识别系统中所述第一调制解调单元的结构示意图;

图5为本发明基于5.8ghz无线传输电视远场语音识别方法第一实施例的流程示意图;

图6为本发明基于5.8ghz无线传输电视远场语音识别方法第二实施例的流程示意图;

图7为本发明基于5.8ghz无线传输电视远场语音识别方法第三实施例的流程示意图;

图8为本发明基于5.8ghz无线传输电视远场语音识别方法第四实施例的流程示意图;

图9为本发明基于5.8ghz无线传输电视远场语音识别方法第五实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

本发明提出一种基于5.8ghz无线传输电视远场语音识别系统,旨在解决当前2.4ghz载波通信无法满足当前电视远场语音识别的需求。

如图1所示,图1为本发明基于5.8ghz无线传输电视远场语音识别系统一实施例的功能模块示意图,本发明提出的基于5.8ghz无线传输电视远场语音识别系统包括移动语音端100及电视端200,移动语音端100包括麦克风阵列模块110、adc模块120、dsp处理模块130、第一5.8ghz射频模块140;电视端200包括第二5.8ghz射频模块210及电视端soc系统220。

需要说明的是,本发明适用的主体包括所有具有语音识别技术的电视机,在此不做任何限制,移动语音端100还包括第一电源模块150以及第二电源模块230,电源模块由变压单元、整流单元、滤波单元以及dc/dc芯片单元组成,第一电源模块150为移动语音端100中的各模块提供直流电压,第二电源模块230为电视端200中的各模块提供直流电压。

具体地,麦克风阵列模块110,用于采集混场语音数据,混场语音数据包括用户发出的语音指令及电视端发出的声音数据。

需要说明的是,麦克风阵列模块110是指一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置等信息。根据声源和麦克风阵列模块110之间距离的远近,可将阵列分为近场模型和远场模型。根据麦克风阵列模块110的拓扑结构,则可分为线性阵列、平面阵列、体阵列等,本实施例中,采用的是远场模型阵列,具体采用的阵列可根据实际使用情况进行选择,在此不做限制。

可以理解的是,现实中语音信号为模拟信号,由于模拟语音信号的传输抗干扰能力差,信号易衰减,不利于语音信号的长距离传输,所以本实施例中采用数字麦克风阵列模块110实现原始语音信号的采集,并且在人体发出语音指令时,当前电视机可能处在播放状态,所以麦克风阵列模块110采集的混场语音数据包括电视自身喇叭所发出的声音数据以及来自用户发出的语音指令。

adc模块120,用于对混场语音数据进行模数转换。

需要说明的是,用户发出的语音指令为模拟信号,由于模拟语音信号的传输抗干扰能力差,信号易衰减,不利于语音信号的长距离传输,且dsp处理模块130内部处理的信号为数字信号,所以需要adc模块120对模拟语音数据进行转换,输出数字语音信号至dsp处理模块130,本实施例中,adc模块120的第一信号端与麦克风阵列110麦克风阵列模块110的信号输出端连接,adc模块120的第二信号端与dsp处理模块130的第一信号端连接,其中,adc模块120支持多通道数据转换以及i2s总线接口通信,i2s总线接口是立体声音频信号和系统之间传递的接口,以实现与dsp处理模块130以及麦克风阵列模块110通信的要求。

dsp处理模块130,用于获取经adc模块120模数转换后的混场语音数据以及通过第一5.8ghz射频模块140获取电视端发出的声音数据,并通过预设算法滤除电视端的声音数据以获得用户发出的语音指令,并将语音指令输出至所述第一5.8ghz射频模块140。

可以理解的是,在用户发出语音指令时,电视可能处于正常播放状态,dsp处理模块130通过adc模块120获取了数字混场语音数据的同时,dsp处理模块130还通过第一5.8ghz射频模块140接收电视端200发出的声音数据,dsp处理模块130同时将电视端发出的声音数据存储在自身集成的flash中,然后通过dsp算法滤除混场语音数据中的电视端发出的声音数据,进而得到单一的用户发出的语音指令。语音指令再进行信号预加重、加窗等预处理,预加重指的是在语音指令引入之前采用预加重网络,加重第一5.8ghz射频模块140输入信号的高频分量,有效地提高了输出信噪比,在信号处理中,因为5.8ghz射频模块只能处理有限长度的信号,因此语音信号要以t(采样时间)截断,即有限化,成为xt(t)后再进一步处理,这个过程序就是加窗处理,从而保证语音指令完整及时的传送至电视端200。

第一5.8ghz射频模块140,用于获取电视端发出的声音数据以及将dsp处理模块130输出的语音指令调制为频段为5.8ghz的语音指令,第二5.8ghz射频模块210,用于接收频段为5.8ghz的语音指令,并对频段为5.8ghz的语音指令进行解调处理,并将解调处理后的语音指令发送至电视端soc系统220。

需要说明的是,5.8ghz与2.4ghz为两个不同的频段,2.4ghz载波频段大约容纳11个通道,而当前大多电视机设备使用的频段均为2.4ghz的载波频段,所以当前的2.4ghz频段过于拥挤,而5.8ghz载波频段使用设备少,与2.4ghz载波频段相比,可容纳的通道多出几倍,并且频率更高,抗干扰能力更强,同时5.8ghz无线传输采用ofdm(正交频分复用)和点对点、点对多点的组网方式,单扇区高达54mbps,比2.4ghz载波拥有更宽的传输带宽,能够更好的好的满足电视远程语音数据传输需求。

工作时,第一5.8ghz射频模块140通过获取电视端200输出的声音数据并发送至dsp处理模块130进行数据处理,同时第一5.8ghz射频模块接收由dsp处理模块130输出的多信道语音指令并进行调制为频段为5.8ghz的语音指令,调制后的语音指令通过天线发送至第二5.8ghz射频模块210,第二5.8ghz射频模块210接收频段为5.8ghz的语音指令,并对5.8ghz频段语音载波信号的进行解调,以获得用户发出的语音指令,用户发出的语音指令通过数据总线发送至电视端soc系统220处理,另外,5.8ghz射频模块还要同时完成和dsp处理器以及电视端soc系统220的数据通信,并且在第一5.8ghz射频模块及第二5.8ghz射频模块中采用专用协议栈,其中包含多次错误校正、丢包复传等功能,进而实现语音数据的点对点、多信道、低延迟、强抗干扰传输。

如图2所示,图2为本发明基于5.8ghz无线传输电视远场语音识别系统中5.8ghz音频数据传输协议栈的数据结构示意图,为保证语音数据无线传输的可靠性和稳定性,5.8ghz射频模块的语音数据包应遵循统一的协议标准,即数据帧结构定义。本发明特定的协议帧主要包括:同步帧、帧长、地址、混合数据帧、校验帧、结束符。

其中地址帧主要包括源地址和通道地址,源地址即收发模块的自设定地址,通道id为收发模块不同通道的节点编号,混合数据帧主要包括状态帧、数据载荷,其中状态帧中包括准备状态:标志收发模块是否准备好,传输状态标志目前收发模块的数据传输状态,重传次数标志数据在无线收发失败后重传次数。数据载荷包括数据类型和语音数据,数据类型标志语音数据类型,其中包括电视端发出的声音数据、混场语音数据、处理后的语音指令。本发明5.8ghz音频数据传输采用点对点、点对多点的专用传输协议,相比其他基于tcp/ip协议栈无线传输模式,避免了由于tcp/ip协议复杂的路由寻址进程造成的传输延迟,大大减少了语音数据的传输时延,提高系统的反应速度。

电视端soc系统220,用于将接收到的语音指令与云端语音数据库进行数据对比,生成操作指令,进而控制电视端的app完成对应的语音操作指令。

电视端soc系统220通过i2s数据总线接收第二5.8ghz射频模块210解调后的语音数据,此外,电视端soc系统220还将电视本体喇叭发出的音频数据通过i2s总线传输给第二5.8ghz射频模块210,第二5.8ghz射频模块210将电视本体喇叭发出的音频数据调制发送至移动语音端100进行混场语音滤噪处理,电视端soc系统220接收到处理后的语音指令后,通过连接云端语音数据库300进行数据识别、对比,生成操作指令,进而控制电视端的app完成对应的语音操作,例如翻页、换台等。

本发明技术方案通过采用麦克风阵列模块110、adc模块120、dsp处理模块130、第一5.8ghz射频模块140、第二5.8ghz射频模块210及电视端soc系统220组成基于5.8ghz无线传输电视远场语音识别系统,工作时,麦克风阵列模块110采集多方位的混场声音数据,adc模块120对混场语音数据进行模数转换并将数字语音信号发送至dsp处理模块130,dsp处理模块130接收到数字语音数据以及通过第一5.8ghz射频模块140接收电视端发出的声音数据,同时实现电视端发出的声音数据的本地存储,并通过预设的dsp算法实现电视喇叭声音、人发出的指令声音和环境噪声的识别,特征提取、消躁,从而滤除电视端发出的声音数据等处理,第一5.8ghz射频模块140和第二5.8ghz射频模块210同时实现多信道语音指令或者电视端发出的声音数据的调制解调,同时完成和dsp处理模块130以及电视端soc系统220的数据通信,第二5.8ghz射频模块210将处理后的语音指令发送至电视端200,电视端soc系统220接收到用户发出的语音指令后,将用户发出的语音指令与云端语音数据库300进行数据对比处理,识别语音指令,进而控制电视端的app完成语音对应的指令操作。本发明采用5.8ghz频段载波的无线技术传输语音数据,相比2.4ghz频段载波的无线技术拥有更宽的传输带宽,并且,5.8ghz系统采用直接序列扩频技术,信道更多,频率更高,抗干扰能力更强,无额外的传输时延,人机交互更理想,能够很好的满足电视远程语音识别及数据传输的需求。

本实施例中,dsp处理模块130包括语音处理芯片,语音处理芯片包括用于处理不同通道音频数据的多个逻辑处理核、用于数据缓存的sram单元以及用于语音数据缓存的flash单元。

需要说明的是,本实施例中,dsp处理模块130采用xmosxuf216语音处理芯片,主要对语音数据进行相关算法处理,该芯片内部集成了16个实时逻辑处理核,每个dsp核可以独立并行处理不同通道音频数据,此外,该芯片还集成了512kb用于数据缓存的sram单元以及2mb用于语音数据本地存储的flash单元,dsp处理模块130通过第一5.8ghz射频模块140接收电视端发出的语音数据,语音数据储存在flash单元中,语音处理芯片在处理语音信号是调用flash单元中的语音数据,并通过语音处理芯片中预存的dsp算法滤除混场语音数据中电视端发出的声音数据,从而获得单一的用户发出的语音指令,语音处理芯片通过i2s数据总线发送语音指令至第一5.8ghz射频模块140。

此外,dsp处理模块130同时支持多路spi、i2c及i2s接口,用于和其他模块进行数据通信,随着科技的发展,dsp处理模块130内部集成的实时逻辑处理核、sram单元以及flash单元数量和容量大小会呈现相应变化,因此,对其具体的数量及容量大小在此不做任何限制。

如图3所示,图3为基于5.8ghz无线传输电视远场语音识别系统中所述第一5.8ghz射频模块的结构示意图,需要说明的是,第一5.8ghz射频模块140和第二5.8ghz射频模块210结构相同,本实施例中,5.8ghz射频模块包括具有和dsp处理模块130或者电视端soc系统220操作控制以及数据通信功能的通信单元和具有对语音信号进行5.8ghz载波调制和解调功能的调制解调单元。

需要说明的是,当5.8ghz射频模块为第一5.8ghz射频模块140时,第一通信单元141的第一信号端与dsp处理模块130的第二信号端连接,第一通信单元141的第二信号端与第一调制解调单元142的信号端连接,在dsp处理模块130通过第一通信单元141输出处理后的语音指令至第一调制解调单元142时,第一调制解调单元142对语音指令进行数字调制并通过天线发送至电视端200,在第一调制解调单元142通过天线接收电视端200输出的电视声音信号,检波解调后通过第一通信单元141输出至dsp处理模块130,以使dsp处理模块130完成滤除混场语音中的电视端发出的声音数据从而得到单一的用户发出的语音指令。

当5.8ghz射频模块为第二5.8ghz射频模块210时,第二通信单元212的第一信号端与第二调制解调单元211的信号端连接,第二通信单元212的第二信号端与电视端soc系统220的信号端连接,在第二调制解调单元211通过天线接收移动语音端100发出的语音数据时,第二调制解调单元211对语音数据进行检波、解调并通过第二通信单元212输出至电视端soc系统220,以使电视端soc系统220通过连接云端语音数据库300进行数据对比,生成操作指令,进而控制电视端的app完成语音操作,在电视端soc系统220通过第二通信单元212输出电视端发出的声音数据时,第二调制解调单元211对电视端发出的声音数据进行调制并通过天线输出至移动语音端100以进行混场语音滤噪处理。

如图4所示,图4为本发明基于5.8ghz无线传输电视远场语音识别系统中第一调制解调单元141的结构示意图,需要说明的是,第一调制解调单元141与第二调制解调单元211结构相同,本实施例中,调制解调单元包括中频处理单元u1、射频处理单元u2、频率合成器h1、多个滤波器及多个放大器,中频处理单元u1与射频处理单元u2主要由if和rf收发器组成,当第一调制解调单元141或者第二调制解调单元211作为发射电路时,dsp处理模块130输出的语音指令或者电视端soc系统220输出的声音数据输出至txi端或者txq端,语音信号经过中频处理单元u1变频为380mhz的固定中频信号,固定中频信号经过低通滤波器c1滤波、射频处理单元u2变频输出所需的5.8ghz的高频信号,高频信号经过滤波、功率放大后,由天线发送至电视端或者移动语音端,当第一调制解调单元141或者第二调制解调单元211作为接收电路时,天线接收语音信号时,语音信号经过低噪声放大后,通过射频处理单元u2进行混频,将接收到的语音信号变频为380mhz的固定中频信号,固定中频信号经过低通滤波器c1滤波、中频处理单元u1进行变频,输出语音信号至电视端soc系统220或者dsp处理模块130,因此第一调制解调单元141或者第二调制解调单元211可实现双向收发的功能。

一并参照图1和图4,本实施例基于5.8ghz无线传输电视远场语音识别系统的工作原理具体描述如下:

本实施例中,基于5.8ghz无线传输电视远场语音识别系统包括移动语音端100及电视端200,移动语音端100包括麦克风阵列模块110、adc模块120、dsp处理模块130、第一5.8ghz射频模块140;电视端200包括第二5.8ghz射频模块210及电视端soc系统220。

工作时,工作时,麦克风阵列模块110采集多方位的混场声音数据,adc模块120对混场语音数据进行模数转换并将数字语音信号发送至dsp处理模块130,dsp处理模块130接收到数字语音数据以及通过第一5.8ghz射频模块140接收电视端发出的声音数据,同时实现电视端发出的声音数据的本地存储,并通过预设的dsp算法滤除电视端发出的声音数据,第一5.8ghz射频模块140和第二5.8ghz射频模块210同时实现多信道语音指令或者电视端发出的声音数据的调制解调,并且同时完成和dsp处理模块130以及电视端soc系统220的数据通信,第二5.8ghz射频模块210将处理后的语音指令发送至电视端200,第一5.8ghz射频模块140和第二5.8ghz射频模块210之间采用专用协议栈,其中包含多次错误校正、丢包复传等功能,进而实现语音数据的点对点、多信道、低延迟、强抗干扰传输。

电视端soc系统220接收到用户发出的语音指令后,将用户发出的语音指令与云端语音数据库300进行数据对比处理,识别语音指令,进而控制电视端的app完成语音对应的指令操作。本发明采用5.8ghz频段载波的无线技术传输语音数据,相比2.4ghz频段载波的无线技术拥有更宽的传输带宽,并且,5.8ghz系统采用直接序列扩频技术,信道更多,频率更高,抗干扰能力更强,能够很好的满足电视远程语音识别及数据传输的需求。

对应的,本发明还提出一种基于5.8ghz无线传输电视远场语音识别方法如图5所示,图5为本发明还提出一种基于5.8ghz无线传输电视远场语音识别方法一实施例的流程示意图,本实施例中,基于5.8ghz无线传输电视远场语音识别方法包括:

步骤s100、采集混场语音数据并对所述混场语音数据进行模数转换,所述混场语音数据包括用户发出的语音指令及电视端发出的声音数据。

需要说明的是,本实施例中,通过麦克风阵列模块110采集混场语音数据,混场语音数据经过adc模块120模数转换后输出至dsp处理模块130,该混场语音数据包括电视端发出的声音数据以及来自用户发出的语音指令。

步骤s200、获取所述模数转换后的混场语音数据以及所述电视端发出的声音数据,并根据预设算法滤除电视端发出的声音数据,以获得用户发出的语音指令。

需要说明的是,dsp处理模块130通过第一5.8ghz射频模块140获取电视端200输出的电视端发出的声音数据,电视端发出的声音数据存储在dsp处理模块130集成的flash中,dsp处理模块130通过dsp算法滤除混场语音中的电视端发出的声音数据,进而得到单一的用户发出的语音指令,语音指令再通过dsp算法进行信号预加重、加窗等预处理,并通过i2c数据总线输出至第一5.8ghz射频模块140。

步骤s300、将语音指令调制为频段为5.8ghz的语音指令并输出。

需要说明的是,工作时,第一5.8ghz射频模块140接收由dsp处理模块130输出的多信道语音信号并进行调制,调制后的语音载波信号频段为5.8ghz,语音载波信号通过天线发送至第二5.8ghz射频模块210,同时第一5.8ghz射频模块140获取电视端200输出的声音数据并发送至dsp处理模块130进行数据处理。

步骤s400、接收所述频段为5.8ghz的语音指令且对接收到的所述频段为5.8ghz的语音指令进行解调处理。

需要说明的是,第二5.8ghz射频模块210通过天线接收频段为5.8ghz的语音载波信号,第二5.8ghz射频模块210完成5.8ghz语音载波信号的接收解调并通过数据总线将信号发送给电视端soc系统220处理。

并且在第一5.8ghz射频模块及第二5.8ghz射频模块中采用专用协议栈,其中包含多次错误校正、丢包复传等功能,进而实现语音数据的点对点、多信道、低延迟、强抗干扰传输。

步骤s500、语音指令与后台语音数据库进行数据对比,生成操作指令,进而控制电视端的app完成对应的语音操作。

电视端soc系统220通过i2s数据总线接收第二5.8ghz射频模块210解调后的语音数据,电视端soc系统220接收到dsp处理模块130处理后的语音数据,通过连接云端语音数据库300进行数据对比,生成操作指令,进而控制电视端的app完成对应的语音操作,例如翻页、换台等。

此外,电视端soc系统220还将电视本体发出的音频数据通过i2s总线传输给第二5.8ghz射频模块210,然后调制发送至移动语音端100进行混场语音滤噪处理。

如图6所示,图6为本发明基于5.8ghz无线传输电视远场语音识别方法第二实施例的流程示意图,步骤s200包括:

s210、获取模数转换后的混场语音数据以及电视端发出的声音数据,并进行语音数据的缓存。

需要说明的是,混场语音数据通过adc芯片模数转换后输出至dsp处理模块130,dsp处理模块130采用xmosxuf216语音处理芯片,xmosxuf216语音处理芯片通过5.8ghz射频模块接收单纯的电视端发出的声音数据并存储自身集成的flash中,以用于后续的滤除电视端发出的声音数据的操作。

s220、根据预设算法滤除电视端发出的声音数据以获得用户发出的语音指令。

需要说明的是,xmosxuf216语音处理芯片内部集成了16个实时逻辑处理核,每个dsp核可以独立并行处理不同通道音频数据,xmosxuf216语音处理芯片通过dsp算法滤除混场语音中的电视喇叭声音数据,进而得到单一的客户发出的语音指令。

s230、对语音指令经过信号预加重以及加窗预处理后输出。

需要说明的是,为了保证语音指令完整计时的传送至电视端200,在发送之前需要对语音指令进行信号预加重以及加窗处理,预加重指的是在语音指令引入之前采用预加重网络,加重第一5.8ghz射频模块140输入信号的高频分量,有效地提高了输出信噪比,在信号处理中,因为5.8ghz射频模块只能处理有限长度的信号,因此原始信号要以t(采样时间)截断,即有限化,成为xt(t)后再进一步处理,这个过程序就是加窗处理。

如图7所示,图7为本发明基于5.8ghz无线传输电视远场语音识别方法第三实施例的流程示意图,步骤s300包括:

步骤s310、接收所述预加重以及加窗预处理后的语音指令并对接收到的所述预加重以及加窗预处理后的语音指令变频为中频信号;步骤s320、对所述中频信号进行低通滤波、并变频为频段为5.8ghz的高频载波信号;步骤s330、对所述频段为5.8ghz的高频载波信号进行信号放大并通过天线发射。

本实施例中,第一调制解调单元141和第二调制解调单元211结构相同,第一调制解调单元141包括中频处理单元u1、射频处理单元u2、频率合成器h1、多个滤波器及多个放大器,中频处理单元u1与射频处理单元u2主要由if和rf收发器组成,当第一调制解调单元141作为发射电路时,dsp处理模块130输出的语音指令输出的声音数据输出至txi端或者txq端,语音信号经过中频处理单元u1变频为380mhz的固定中频信号,固定中频信号经过低通滤波器c1滤波、射频处理单元u2变频输出所需的5.8ghz的高频信号,高频信号经过滤波、功率放大后,由天线发送至电视端。

如图8所示,图8为本发明基于5.8ghz无线传输电视远场语音识别方法第四实施例的流程示意图,步骤s400包括:

步骤s410、接收所述频段为5.8ghz的高频载波信号并对接收到的所述频段为5.8ghz的高频载波信号进行低噪声放大处理;步骤s420、对低噪声放大处理后的高频载波信号进行混频以获得中频信号;步骤s430、对所述中频信号进行滤波、变频以获得所述用户发出的语音指令并输出。

需要说明的是,当第二调制解调单元211作为接收电路时,天线频段为5.8ghz的高频载波信号时,高频载波信号经过低噪声放大后,通过射频处理单元u2进行混频,将接收到的语音信号变频为380mhz的固定中频信号,固定中频信号经过低通滤波器c1滤波、中频处理单元u1进行变频,输出语音信号至电视端soc系统220。

如图9所示,图9为本发明基于5.8ghz无线传输电视远场语音识别方法第五实施例的流程示意图,步骤s500具体包括:

步骤s510、接收所述用户发出的语音指令,并对接收到的所述用户发出的语音指令进行语音分析以及测度分析。

可以理解的是,语音信号是冗余度很高的随机信号,在进行语音信号处理(语音识别、语音合成、语音压缩)的时候,必须经过特征提取才能有效地降低信号的冗余度,而语音特征的提取又是通过对语音信号的分析来获得表征语音信号的参数,所以在接收到语音指令后,需要对语音信号进行语音分析,测度估计是语音识别的核心,即模式匹配及模型训练技术。其中模型训练旨在按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则旨在根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配,用来表征参数与模板之间的测度。

步骤s520、对语音分析以及测度分析后的语音指令与云端语音数据库进行数据搜索及对比,进而作出识别判决。

需要说明的是,云端语音数据库300存储了与语音指令对应的控制指令,云端语音数据库300当进行测度分析后的语音指令与云端语音数据库300中的控制指令进行数据对比,并根据语音指令的特征进行识别匹配,并且随着电视的升级,还可对云端语音数据库300进行数据升级,以满足用户的需求。

步骤s530、控制电视端的app执行对应的语音指令操作。

当语音指令与云端语音数据库300中的控制指令匹配成功后,电视端soc系统220输出对应的控制信号至电视端的app以执行对应的操作,比如翻页、换台等。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1