一种结合语音识别的室内定位导航方法与流程

文档序号:22841169发布日期:2020-11-06 16:41阅读:198来源:国知局
一种结合语音识别的室内定位导航方法与流程

本发明涉及室内定位技术领域,尤其一种结合语音识别的室内定位导航方法。



背景技术:

随着网络技术的进步和发展,基于室内空间信号的定位技术也越来受到重视。室内空间信号通常包括,例如,wifi、蓝牙、ble、地磁、气压计等。室内定位的原理,是基于以上信号在全空间的分布规律,生成空间指纹,匹配用户当前位置的空间信号,找出最大相似度的位置,实现定位能力。但是在实际过程中,随着环境的变化,空间信号会改变。局部定位精度会下降。重新采集空间的信号的成本比较大,难以快速低成本的解决局部精度下降的问题。

因此,为解决上述技术问题,需要提出一种新的技术方案来解决这个问题。尤其是提供一种结合语音识别的室内定位导航方法。



技术实现要素:

本发明为解决市场上现有的室内定位技术定位效果可能存在异常情况且若定位的离线数据不及时更新将出现定位异常的技术问题,提供了一种可以修正基础定位且能够对离线数据进行修正和标记的结合语音识别的室内定位导航方法。

为实现上述目的提供了如下技术方案:一种结合语音识别的室内定位导航方法,采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:

第一步从声音信号中提取位置信号

(1.1)声音信号的采集

在产品终端增加声音采集模块,支持声音的录入,将声音信号采集为数字数据;

(1.2)声音信号的筛选

从采集到的声音信号中去除无关信号,去除环境音、噪音、爆破音和用户无用的语音,留下人声;

(1.3)声音信号的识别

对去除无关信号的纯净声音信号通过云端语音识别算法,将声音数据转换成文本数据;

(1.4)利用文本数据得到位置信号

通过文本数据与云端数据库中的poi数据库进行匹配,识别出包含现场poi信息的内容,并通过贝叶斯分析器转换成位置信号;

第二步判断声音信号中位置信号数据的有效性

(2.1)将声音信号中的位置信号上传至云端服务器

将第一步中从声音信号中提取到的位置信号转换成定位指令并将定位指令送达至云端服务器;

(2.2)定位结果对比

云端服务器将声音信号中的定位指令与前一段时间内基础定位的结果进行对比,当声音定位的精准度高于基础定位结果的精准度时,判断为定位指令有效;当声音定位的精准度低于基础定位结果的精准度时,判断为定位指令无效;

第三步对基础定位结果进行修正和标记

(3.1)对基础定位的结果进行修正

利用有效的定位指令对基础定位的结果进行修正,定义有效的定位指令对应的坐标作为初始位置,重新启动室内定位算法进行修正;

(3.2)对基础定位结果进行标记

利用有效的定位指令对基础定位的结果进行标记;

第四步利用深度学习算法对基础定位进行训练,修正基础定位

(4.1)数据回传至深度学习训练模块

在云端服务器中对数据进行修正,将修正后的数据送入深度学习训练模块;

(4.2)通过深度学习算法训练模块对基础定位进行训练、修正

通过修正后的数据对空间信号打标签,进行深度训练后,修正定位算法模型。

优选地,所述云端语音识别算法包括卷积神经网络cnn算法。

优选地,所述深度学习算法为卷积神经网络cnn算法。

优选地,所述设备终端包括:智能手机、平板电脑、智能信息采集设备。

优选地,所述采集模块包括麦克风。

优选地,所述基础定位包括:wifi定位、地磁定位、蓝牙定位、角向量定位,超声波定位,rfid定位,红外线定位。

本发明的优点:本发明结合语音识别技术可以及时发现用户使用定位导航功能时的定位错误,并修正。这种方法打破了传统的通用模型定位的方式,可以实时收集用户的定位反馈,在定位过程中就能修正问题。

本方法有效的修正可以反馈到定位模型的训练过程,减少了重新去现场采集信号的成本。用户在使用过程中可以和应用交互,我们也可以在产品全流程支持语音识别和语音控制功能,增加产品的智能化程度。

附图说明

图1是本发明的步骤流程示意框图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述。

如图1所示,本发明的方法流程如下:(1)从声音信号中提取出位置信号;(2)对位置信号的有效性进行判断;(3)利用位置信号对基础定位结果进行修正和标记;(4)利用深度学习算法对基础定位的离线数据进行训练,并应用于后期的基础定位。

具体包括:一种结合语音识别的室内定位导航方法,采用将设备终端采集到的声音信号转换成位置信号,并同时对基础定位的结果进行修正和标记的方法,并运用深度学习算法辅助训练基础定位,修正异常定位区域,具体包括如下步骤:

第一步从声音信号中提取位置信号

(1.1)声音信号的采集

在产品终端增加声音采集模块,支持声音的录入,将声音信号采集为数字数据;该采集模块用于对声音的采集作用,可以是最简单的麦克风设备;

(1.2)声音信号的筛选

从采集到的声音信号中去除无关信号,去除环境音、噪音、爆破音和用户无用的语音,留下人声,去除其他的杂声留下人声。

人声识别分为训练和预测两个部分。训练指的是生成预测模型,预测是利用模型产生预测结果。

训练的过程,分为以下三个部分:

(1.2.1)基于梅尔倒频谱算法,提取声音特征,并将其转换成频谱图片;

(1.2.2)将人声频谱作为正样本,动物声音和杂音等非人声作为负样本,交由神经网络模型训练;

(1.2.3)基于训练产生的文件,生成端上可运行的预测模型。

人声识别训练的流程分为三个部分,提取声音特征,模型训练和生成端上模型。最后,是人声识别的部分:先提取声音特征,然后加载训练模型即可获得预测结果。识别出人声后去除人声以外的其他无用语音。

(1.3)声音信号的识别

对去除无关信号的纯净声音信号通过云端语音识别算法,将声音数据转换成文本数据;

(1.4)利用文本数据得到位置信号

通过文本数据与云端数据库中的poi数据库进行匹配,识别出包含现场poi信息的内容,并通过贝叶斯分析器转换成位置信号。

第二步判断声音信号中位置信号数据的有效性

(2.1)将声音信号中的位置信号上传至云端服务器

将第一步中从声音信号中提取到的位置信号转换成定位指令并将定位指令送达至云端服务器;

(2.2)定位结果对比

云端服务器将声音信号中的定位指令与前一段时间内(具体时间为1分钟内)基础定位的结果进行对比,当声音定位的精准度高于基础定位结果的精准度时,判断为定位指令有效;当声音定位的精准度低于基础定位结果的精准度时,判断为定位指令无效。

定位结果有accuracy参数,用于衡量定位精度。声音定位使用贝叶斯分类器计算结果的精准度。基础定位结果使用空间信号与指纹地图的匹配误差判断的精准度。两个取值都是[0-1],直接比大小。

第三步对基础定位结果进行修正和标记

(3.1)对基础定位的结果进行修正

利用有效的定位指令对基础定位的结果进行修正,定义有效的定位指令对应的坐标作为初始位置,重新启动室内定位算法进行修正;

(3.2)对基础定位结果进行标记

利用有效的定位指令对基础定位的结果进行标记。具体的标记方法为如果语音定位结果修正到2楼,并对这组空间信号打个2楼的标签。

第四步利用深度学习算法对基础定位进行训练,修正基础定位

(4.1)数据回传至云端服务器

将修正数据信息回传至云端服务器,送入深度学习训练模块;

(4.2)通过深度学习算法训练模块对基础定位进行训练、修正

通过修正后的数据对空间信号打标签,进行深度训练后,修正定位算法模型。

如果没有声音信号,定位结果是错误的位置,有声音信号帮助训练算法模型后,定位结果就更加准确。

本发明的云端语音识别算法包括卷积神经网络cnn算法。深度学习算法为卷积神经网络cnn算法。设备终端包括:智能手机、平板电脑、智能信息采集设备,其他智能穿戴件也可以。采集模块包括麦克风。基础定位采用现有的定位方式包括:wifi定位、地磁定位、蓝牙定位、角向量定位,超声波定位,rfid定位和红外线定位。

本发明通过室内定位过程中大量的音频片段,作为云端通过深度学习算法的隐藏层,对空间信号做更好的线性划分,缩小定位范围,提升定位精度。这种做法的好处是,当环境改变,比如距离采集时间有一年了,wifi/beacon信号都换了,定位的时候空间信号就会变少,那么定位精度也会降低。如果有音频信号的话,我们就可以给这段已经变少的信号打个标签,这样之后再有人走到这里定位,就会变准。

在声音采集阶段通过麦克风采集声音。对于手机的录音过程,简单地讲,需要经过三个阶段,两个环节。三个环节是:“声音——模拟电信号——数字电信号”。两个环节是:“麦克风”和“adc(analogdigitalconverter/数字模拟转换器)”。麦克风负责把“声音”转化为“模拟电信号”,adc负责把“模拟电信号”转化为“数字电信号”。所以说,麦克风和adc的品质直接决定录音功能的品质。如果产品端没有adc模块,需要在云端进行降噪处理。在低频(<80hz)和高频段(>1.4hz)做相应的降噪处理,只保留和人声频段。

在声音信号的筛选阶段需要筛选掉环境音、用户的无效语音。需要结合该室内场景的基本信息,如地址,楼层,店铺名称,店铺分布情况,生成搜索文本库。系统解决方案,使用搜索引擎elasticsearch,对上述数据做倒排索引,实现快速的搜索。

对声音信息进行判断其有效性是因为采集到的声音信号并非一定准确,要结合之前一段时间的使用情况来做辅助判断。例如:如果这个人定位一直在3楼,而且在3楼的定位精确度(定位精确度是室内定位算法计算结果的基础参数)高达99%。但采集到的语音语义为我在2楼,这样我们认为这段语音表义不准确。再例如,如果一个人在3楼的置信度只有60%,或者在2楼和3楼来回切换,那我们会相信语音的表义。讲定位结果修正到2楼,并对这组空间信号打个2楼的标签。

以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1