一种听觉代替视觉的导盲方法

文档序号：36161238发布日期：2023-11-23 09:25阅读：112来源：国知局

本发明涉及电子信息领域，涉及到一种新型的导盲方法，基于听觉代替视觉，利用图像转化声音(音乐)技术将前方拍摄的景物转化成为声音(音乐)信号，由盲人听取转化后的声音(音乐)进行障碍物判决，为盲人提供便捷、低成本的导盲服务。

背景技术：

1、盲人由于先天性疾病或后天意外事故而失去视力，从此他们只能依赖触觉和听觉来感知世界。对于盲人来说，大量的图像信息对他们来说是无用的。尤其是户外行走，盲人往往难以适应，需要不断地依靠他人帮助或使用辅助工具。

2、因此，一些科技工作者开始在电子辅助行走领域进行研究。这一研究分为两部分：一部分关注定位和导航，通过卫星信号等技术来确定自身位置和目的地并提供导航服务。然而，这些设备无法处理突发情况。另一部分研究专注于处理紧急情况。尽管这些设备可以处理一些意想不到的情况，但它们往往价格昂贵，无法普及到所有盲人。值得注意的是，导盲犬也是为盲人服务的。但由于数量有限，并且需要经过层层筛选和预约才能获得，所以申请难度很大。总之，目前采用的电子辅助导盲的方法成本高，操作复杂，不适合盲人。

3、尽管盲人失去了视觉感知能力，但他们的听觉相对更加敏锐。本发明提出了通过听觉代替视觉的信息转化的新思想，即将前方的图像转化为声音(音乐)，由盲人听取转化声音来判断，以帮助盲人判断正前方的情况。这样做，不仅能够发挥盲人的听觉潜力，还能降低实现成本，易于推广。

4、本发明提出了一种图像转声音(音乐)的新方法，将前方的景象转化为声音(音乐)信号，盲人可以通过听觉来听取转化的声音判断前方是否存在障碍物。实验结果表明，这种方法实现简单，并且具有广泛的应用推广价值。

5、此外，我们还设计了一种新的低成本的听觉代替视觉导盲验证装置。这种导盲装置的设计简单实用，可以提供基本的导航功能，使得盲人能够更好地在日常生活中移动和感知周围环境。这种低成本装置的研发有助于满足低收入盲人的需求，并提供他们更多独立和自主的生活机会。

6、通过这些创新的方法和设计，我们希望能够为盲人提供价廉、有效的辅助技术，帮助他们在日常生活中克服视觉上的障碍，并提高他们的生活质量。这些成果具有重要的社会意义和实际应用价值。

技术实现思路

1、为了解决上述技术问题，本研究提出了一种创新的图像转化声音(音乐)方法，通过将前方的图像转化为声音信号，盲人可以依靠听觉来判断前方情况，从而解决户外出行时前方出现障碍物可能带来的潜在危险。同时还设计了一种专门针对低收入盲人群体的低成本导盲验证装置。所述方法如下：

2、一种图像转化声音方法，这里的声音信号是音乐的midi格式，midi格式是电子乐器数字接口文件格式，目前广泛应用在电子乐器中。具体思路：

3、①将图像的rgb颜色空间通过公式转化成hsv颜色空间，转化公式如下：

4、cmax＝max(r',g',b')

5、cmin＝min(r',g',b')

6、△＝cmax-cmin

7、

8、

9、

10、v＝cmax

11、其中：h、s、v对应图像的色调、饱和度和亮度值；r'、g'、b'是归一化后的rgb值，cmax和cmin分别表示归一化后r、g、b的最大值和最小值，h'、△作为中间量；h'表示h分量的预先计算量。δ：表示归一化后r、g、b三个颜色通道中最大值与最小值之差。

12、②图像信息到音乐信息的midi格式参数的转化

13、将h、s、v三个图像特征映射到音乐的midi文件的三个参数：delta-time值、音高和音量中，进而将像素点转换成了midi文件中的音符；h取值范围为0～360，s取值范围为0～1，v的取值范围为0～1；音高、音量值的取值范围均为0～127，delta-time参数可以是任意正数值，这里我们采用一个字节的存储量即0～127，来表示delta-time参数取值范围。

14、图像三个分量信息向声音(音乐)三个参数信息进行映射，根据不同的映射方法，最终得到6种不同的映射声音，分别为：

15、1)h值映射到midi文件的delta-time值，s值映射到midi文件的音高，v值映射到midi文件的音量；

16、2)h值映射到midi文件的delta-time值，s值映射到midi文件的音量，v值映射到midi文件的音高；

17、3)h值映射到midi文件的音高，s值映射到midi文件的delta-time值，v值映射到midi文件的音量；

18、4)h值映射到midi文件的音高，s值映射到midi文件的音量，v值映射到midi文件的delta-time值；

19、5)h值映射到midi文件的音量，s值映射到midi文件的音高，v值映射到midi文件的delta-time值；

20、6)h值映射到midi文件的音量，s值映射到midi文件的delta-time值，v值映射到midi文件的音高；

21、具体映射方法为：将h、s、v值与音量、音高、delta-time参数进行匹配映射；其中p，t，d分别代表转化的音乐的音高、音量和delta-time值。

22、1)h、s、v与转化的音乐的delta-time、音高、音量值进行映射：

23、d＝(127/360)╳h，p＝127╳s，t＝127╳v；

24、2)h、s、v与转化的音乐的delta-time、音量、音高值进行映射：

25、d＝(127/360)╳h，t＝127╳s，p＝127╳v；

26、3)h、s、v与转化的音乐的音高、delta-time、音量值进行映射：

27、p＝(127/360)╳h，d＝127╳s，t＝127╳v；

28、4)h、s、v与转化的音乐的音高、音量、delta-time值进行映射：

29、p＝(127/360)╳h，t＝127╳s，d＝127╳v；

30、5)h、s、v与转化的音乐的音量、音高、delta-time值进行映射：

31、t＝(127/360)╳h，p＝127╳s，d＝127╳v；

32、6)h、s、v与转化的音乐的音量、delta-time、音高值进行映射：

33、t＝(127/360)╳h，d＝127╳s，p＝127╳v；

34、③图像到声音的转化

35、将图像像素点值转化成的midi文件音符进行合并，通过将相同的音高和音量的音符合并，以减少midi文件的长度并增强其可用性。在音符的音高和音量相同时，选择保留时间较长的音符，而覆盖时间较短的音符，这样做可以避免音符过于密集，减少冗余音符。将得到的音符数据生成midi格式事件代码，再加上midi格式化的文件头和音轨头生成midi文件。

36、2.转化的关键参数为：

37、图像信息中是h、s、v颜色分量，midi格式音乐文件中是delta-time值、音高和音量值。

38、3.设计了一种低成本的听觉代替视觉的导盲验证装置，具体工作流程如下：

39、①首先给导盲验证装置通电，其次通过镜头采集距离正前方3米远的图像，每1次/5秒进行采集并送到导盲验证装置的图像转音乐软件模块进行转化；

40、②图像转音乐模块将采集图像转化为一段midi格式的音乐文件输出；

41、③将生成的音乐片段通过耳机播放，人耳根据听转化音乐来判断前方有无障碍物；

42、④当导盲验证装置完成相应的任务后，关闭电源。

43、该验证装置通过摄像头捕捉距离前方约3米的景物，并将采集的图像用于图像到音乐的转换。转换后的声音片段通过耳机传送到人耳中，通过听取这些声音片段来判断正前方是否存在障碍物。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王波涛苗嘉琦王相焜
技术所有人：北京工业大学
我是此专利的发明人

上一篇：一种基于相位反馈的电磁流量计频率跟踪方法
上一篇：陶瓷元件巴块烘烤及筛选一体化装置及方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。