过滤掉所述音频信号中的无声段以及噪声背景。
[0048]处理模块302b主要用于对过滤后的音频信号进行语音信号的预加重、语音分帧以及端点检测处理,以从过滤后的音频信号中提取语音特征参数。
[0049]具体的,当音频信号接收单元301接收到所述音频信号发射单元201发射的超低音频信号或者超高的音频信号后,特征提取单元302对所述音频信号进行处理,首先特征提取单元302中的过滤模块302a过滤掉所述音频信号中的无声段以及噪声背景,然后特征提取单元302中的处理模块302b对过滤后的音频信号进行语音信号的预加重、语音分帧以及端点检测处理,进而提取出所述音频信号的语音特征参数。
[0050]语音识别单元303主要用于利用预定判别规则对所述语音特征参数进行语音识另IJ,获得语音识别结果。
[0051]比较匹配单元304主要用于将所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终识别结果。
[0052]具体的,语音识别单元303利用预定判别规则对所述语音特征参数进行语音识另IJ,获得语音识别结果,具体包括利用离散傅立叶变换算法识别语音特征参数中的声学信息以及利用语言知识识别语音特征参数中的语音信息,进而获得语音识别结果,其中,所述语言知识具体包括构词、句法、语义、对话背景等方面的知识;然后比较匹配单元304将语音识别单元303获得的所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得本地模版库中与语音特征参数最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终的识别结果。
[0053]解析单元305主要用于从所述最终识别结果中解析出控制端有效的IP地址。
[0054]具体的,解析单元305从比较匹配单元304得到的作为最终识别结果的最佳匹配的测试模版中解析出控制端有效的IP地址,具体包括利用算法过滤出IP地址类型的数据。
[0055]定位连接单元306主要用于根据所述控制端有效的IP地址定位连接所述控制端。
[0056]数据传输单元307主要用于在接收端根据所述控制端有效的IP地址定位连接所述控制端之后,与所述控制端进行数据传输。
[0057]具体的,定位连接单元306根据解析单元305得到的所述控制端有效的IP地址定位所述控制端20的位置,并连接至所述控制端20。
[0058]另外,在接收端30连接到所述控制端20之后,数据传输单元307可向所述控制端20传输数据。
[0059]本发明提供的一种利用声控进行多屏互动设备定位连接的方法及系统,接收端接收控制端发射的音频信号,提取出所述音频信号的语音特征参数,然后利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果,再将所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终识别结果,最后从所述最终识别结果中解析出控制端有效的IP地址,并根据所述控制端有效的IP地址定位连接所述控制端。本发明利用音频信号实现多屏互动设备定位连接,避免了过度依赖网络信号造成的不便,减少设备间的通讯依赖,控制端与接收端主动进行匹配连接,连接之后还可进行数据传输,为用户使用提供了方便,使用户享受高质量的用户体验服务。
[0060]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种利用声控进行多屏互动设备定位连接的方法,其特征在于,所述方法包括: 5101、控制端发射音频信号; 5102、接收端接收所述控制端发出的音频信号,并对所述音频信号进行处理,提取出所述音频信号的语音特征参数; 5103、接收端利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果,然后将所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终识别结果; 5104、接收端从所述最终识别结果中解析出控制端有效的IP地址; 5105、接收端根据所述控制端有效的IP地址定位连接所述控制端。2.如权利要求1所述的一种利用声控进行多屏互动设备定位连接的方法,其特征在于,所述SlOl中所述音频信号具体包括超低音频信号或者超高音频信号。3.如权利要求1所述的一种利用声控进行多屏互动设备定位连接的方法,其特征在于,所述S102中对所述音频信号进行处理,提取出所述音频信号的语音特征参数具体包括: 过滤掉所述音频信号中的无声段以及噪声背景; 对过滤后的音频信号进行语音信号的预加重、语音分帧以及端点检测处理,以从过滤后的音频信号中提取语音特征参数。4.如权利要求1所述的一种利用声控进行多屏互动设备定位连接的方法,其特征在于,所述S103中所述接收端利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果具体包括: 利用离散傅立叶变换算法识别语音特征参数中的声学信息以及利用语言知识识别语音特征参数中的语音信息,进而获得语音识别结果。5.如权利要求1所述的一种利用声控进行多屏互动设备定位连接的方法,其特征在于,还包括: 接收端根据所述控制端有效的IP地址定位连接所述控制端之后,与所述控制端进行数据传输。6.一种利用声控进行多屏互动设备定位连接的系统,其特征在于,所述系统包括控制端和接收端; 所述控制端包括: 音频信号发射单元,用于发射音频信号; 所述接收端包括: 音频信号接收单元,用于接收所述控制端发出的音频信号; 特征提取单元,用于对所述音频信号进行处理,提取出所述音频信号的语音特征参数; 语音识别单元,用于利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果; 比较匹配单元,用于将所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终识别结果; 解析单元,用于从所述最终识别结果中解析出控制端有效的ip地址; 定位连接单元,用于根据所述控制端有效的IP地址定位连接所述控制端。7.如权利要求6所述的一种利用声控进行多屏互动设备定位连接的系统,其特征在于,所述音频信号具体包括超低音频信号或者超高的音频信号。8.如权利要求6所述的一种利用声控进行多屏互动设备定位连接的系统,其特征在于,所述接收端中的特征提取单元进一步包括: 过滤模块,用于过滤掉所述音频信号中的无声段以及噪声背景; 处理模块,用于对过滤后的音频信号进行语音信号的预加重、语音分帧以及端点检测处理,以从过滤后的音频信号中提取语音特征参数。9.如权利要求6所述的一种利用声控进行多屏互动设备定位连接的系统,其特征在于,所述语音识别单元用于利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果具体包括: 利用离散傅立叶变换算法识别语音特征参数中的声学信息以及利用语言知识识别语音特征参数中的语音信息,进而获得语音识别结果。10.如权利要求6所述的一种利用声控进行多屏互动设备定位连接的系统,其特征在于,所述接收端还包括: 数据传输单元,用于在根据所述控制端有效的IP地址定位连接所述控制端之后,与所述控制端进行数据传输。
【专利摘要】本发明公开了一种利用声控进行多屏互动设备定位连接的方法及系统,其中,利用声控进行多屏互动设备定位连接的方法包括:接收端接收控制端发出的音频信号,并提取出所述音频信号的语音特征参数;然后利用预定判别规则对所述语音特征参数进行语音识别,获得语音识别结果,再将所述语音识别结果与本地模版库中的测试模版进行相似性度量比较,获得最佳匹配的测试模版,并将所述最佳匹配的测试模版作为最终识别结果;接收端从所述最终识别结果中解析出控制端有效的IP地址,并根据所述控制端有效的IP地址定位连接所述控制端。本发明利用音频信号实现多屏互动设备定位连接,减少设备间的通讯依赖,为用户使用提供了方便。
【IPC分类】H04N21/436, H04N21/422, G10L15/26
【公开号】CN105225663
【申请号】CN201510528600
【发明人】陈朱尧, 周强
【申请人】成都视达科信息技术有限公司
【公开日】2016年1月6日
【申请日】2015年8月26日