一种目标语音的隐私保护方法及其系统的制作方法

文档序号：2832927阅读：445来源：国知局

专利名称：一种目标语音的隐私保护方法及其系统的制作方法
技术领域：
本发明涉及语音信息安全的技术领域，特别涉及一种目标语音的隐私保护方法及其系统，利用目标语音产生干扰语音信号，结合干扰存储库的干扰信号合成复合干扰信号，来保护目标语音隐私。
背景技术：
在很多场合，语音信息安全十分重要，如何保护会议、交谈等活动过程中的语音信息安全显得相当关键。目前消费类电子产品大多具有录音的功能，而在某些会议中，手机、录音笔可能会以某种方式携带进会场，这些具有录音功能的设备可以录制会议过程中的声音，可以后续重放得到会议相关内容。因此，急需一种干扰手机、录音笔等录音设备的技术，在声音拾取阶段开始干扰，通过引入干扰声音，干扰录音设备拾取目标语音信号，使录取的目标语音信号内容的可懂度降低，后续重放后难于获取会议内容，同时，尽可能的减少对会议参与者的干扰，使会议能够正常进行。噪声干扰信号简单方便，目前已经被用于一些开放式办公室、医疗机构，改善声环境，保护语音隐私，但是噪声信号频谱特性过于简单，而且通常随时间稳态变化，可以通过后续处理恢复出原始目标语音内容，如果要求噪声干扰效果很大，则需要很低的信噪比，意味着此时会造成室内噪声声压级过高，使会议参与者过度烦恼。

发明内容
本发明的目的在于，基于目前很多电子产品都具有录音功能，如何保护会议内容不被录音，急需一种能够干扰电子产品录音功能的技术，从而提出一种新型的目标语音的隐私保护方法及其系统，利用目标声源信号产生干扰语音信号，结合其他一些干扰信号，合成复合干扰信号，提高掩蔽能力，干扰录音设备和声探测设备拾取目标声源信号，同时，利用心理声学的空间去掩蔽效应，由目标声音和干扰声音的空间位置不同，会议参与者对目标声音的理解不受干扰声音的影响，既保证了会议正常进行，同时干扰录音设备工作。如果干扰信号由目标声源信号产生，两者具有一定的相关性，可以提高掩蔽能力，在较高的信噪比下就能达到一定的干扰效果，此外，干扰信号由目标语音产生，随着目标语音变化而变化，不容易被后续处理恢复出内容，这种非稳态时变的干扰语音信号更适合语音隐私的保护。目标声音和干扰声音由位于不同位置的扬声器进行播放，根据心理声学的空间去掩蔽效应，人耳能够分辨出来自不同空间方位的声音，降低干扰声音对目标声音的掩蔽效果，所以会议参与者能够清晰的听到目标语音，不受干扰声音的较大干扰。同时，在室内正在工作的录音设备，或者其他探测设备，由于无法区分目标声音和干扰声音的空间位置，目标声音和干扰声音的叠加直接导致目标声音的可懂度下降，其次，房间的混响也能起到提高干扰能力的作用。为达到上述目的，本发明提供一种目标语音的隐私保护方法，该方法基于目标语音信号产生干扰语音信号，并结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。作为上述技术方案的一种改进，所述的方法包括步骤步骤1)将待播放目标语音信号拷贝成两份目标语音信号，一路直接用于目标声音播放，一路用于产生干扰语音信号；步骤2)根据待播放目标语音信号产生干扰语音信号；步骤幻根据所述的步骤幻的干扰语音信号，选择干扰存储库内干扰信号中的一个或者若干个，合成得到复合干扰声音；步骤4)分别将步骤1)的一路目标语音信号和步骤幻得到的复合干扰声音通过各自的扬声器系统进行播放。作为上述技术方案的一种改进，所述的干扰语音信号的产生，是通过分帧处理，然后每帧进行时间反转、随机化短时相位谱操作后，把每帧信号进行重叠相加得到。作为上述技术方案的一种改进，所述的干扰存储库内的干扰信号包括鸟叫声、噪声或流水声。作为上述技术方案的一种改进，所述的复合干扰信号合成过程中，还包括调节干扰语音信号所占比重的步骤。为达到上述的另一目的，本发明还提供一种目标语音的隐私保护系统，该系统基于目标语音信号产生干扰语音信号，结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。作为上述技术方案的一种改进，所述的系统包括目标语音信号的输入模块，用于将待播放目标语音信号拷贝生成两份目标语音信号，一路直接输出用于目标声音播放，一路输出至信号处理模块用于产生干扰语音信号；信号处理模块，用于根据待播放目标语音信号产生干扰语音信号；信号合成模块，用于合成信号处理模块得到的干扰语音信号和选择的干扰存储库内干扰信号中的一个或者若干个，得到复合干扰声音；扬声器模块，包括目标语音信号的扬声器系统和复合干扰声音的扬声器系统，用于分别播放目标语音信号和复合干扰声音。作为上述技术方案的一种改进，所述的信号处理模块，通过分帧处理，然后每帧进行时间反转、随机化短时相位谱操作后，把每帧信号进行重叠相加得到干扰语音信号。作为上述技术方案的一种改进，所述的目标语音信号的扬声器系统和复合干扰声音的扬声器系统，根据扬声器系统的空间布局和房间结构，按照心理声学效应设计，调整两个扬声器系统的输出信号强度和扬声器系统的空间位置。作为上述技术方案的一种改进，所述的复合干扰声音的扬声器系统采用指向性扬声器，布置在声音容易泄漏的区域。本发明的优点在于，本发明的一种目标语音的隐私保护方法及其系统，利用的干扰声音是一种复合干扰信号，包括和目标语音信号无关部分和相关部分，相关部分由处理目标语音信号产生，具有类似语音信号的特性，无关部分由一些常见干扰信号组成，复合干扰信号具有干扰效率高、烦恼度低的优点；其次，干扰声音和目标声音由位于不同空间位置的扬声器系统进行播放，既达到干扰录音设备拾取声音信号，同时基本不影响会议正常进行。本发明提出使用干扰声音信号干扰录音设备拾取目标声音，该干扰声音信号由目标声音处理得到，并加入其他一些干扰信号使干扰声音信号本身更加复杂和更加舒适。干扰声音和目标声音由位于不同位置的扬声器播放，根据心理声学的空间去掩蔽效应，会议参与者能够正确的接收会议内容，而室内正在工作的录音设备以及其他探测设备，拾取的是干扰声音和目标声音的叠加信号，降低目标声音的可懂度，保护会议语音信息安全。

图1是本发明的目标声音和干扰声音产生方法流程图；图2是本发明的目标声音和干扰声音由位于房间内不同位置的扬声器播放的示意图；图3是实施例中目标声音的时域波形图；图4是实施例中干扰语音信号的时域波形图；图5是实施例中干扰声音的时域波形图。
具体实施例方式下面结合附图对本发明进行进一步说明。本发明基于目标语音信号产生干扰语音信号的方法，进而合成复合干扰信号，并且目标声音和干扰声音由位于房间中不同位置的扬声器播放，该方法具体步骤包括步骤1)待播放目标语音信号拷贝成两份，一份直接用于目标声音播放，一份用来产生干扰语音信号；步骤2~)根据所述的步骤1)的待播放目标语音信号，产生干扰语音信号，该干扰语音信号和待播放目标语音信号具有一定的相关性，干扰语音信号本身没有可懂度；步骤幻根据所述的步骤幻的干扰语音信号，综合选择存储库中的噪声、流水声、鸟叫声等干扰信号，从中选择一个或者若干个，与干扰语音信号合成复合干扰信号，得到干扰声音；步骤4)把步骤1)得到的目标声音，和步骤幻得到的干扰声音，分别给不同的扬声器系统进行播放，根据扬声器系统的空间布局和房间结构，调整两个扬声器系统的输出信号强度，扬声器系统的空间位置按照心理声学效应设计。本发明方法能够在不影响会议正常进行的同时，干扰一些录音设备、探测设备和房间外窃听人员获取会议有关内容。本发明通过对目标声音进行干扰达到相应目的，目标声音和干扰声音由位于不同空间位置的扬声器系统分别播放，干扰声音是一种复合干扰信号，一部分是与目标语音相关的干扰语音信号，一部分是随机从库中选择的常见干扰信号，根据心理声学的空间去掩蔽效应，会议参与者几乎不受干扰声音的影响，能够正常的接受会议内容，而携带入会场的录音设备以及会场周边的探测设备和窃听者只能听到被人为干扰后的语音，语音可懂度和语音质量大大降低，后续重放难以获得清晰的目标语音内容，而且由于本发明的干扰声音是一种非稳态时变干扰信号，加大了后续信号处理获取清晰目标语音信号的难度，达到保护目标语音隐私的作用。具体目标声音和干扰声音产生方法，如图1所示。下面对本发明的每个步骤进行详细说明所述步骤1)中，待播放目标语音信号和干扰语音的处理可以通过硬件或者软件实现，硬件可以是DSP、FPGA等，也可以是个人计算机的软件，待播放目标语音信号可以由 mp3，⑶，DVD等各种输入设备输入。所述步骤2)中，利用待播放目标语音信号产生干扰语音，模块P4具体步骤如下参照语音信号处理常用方法，先把待播放目标语音信号分帧后，使用时间反转、随机化短时相位谱等方法，处理每帧信号，重叠相加处理后的每帧信号，产生无意义的干扰语音信号，该信号和待播放目标语音具有类似的语音特性，人感知上是无意义不可懂的信号，烦恼度低，和目标语音一样是非稳态时变信号。所述步骤幻中，如图1所示，P8是干扰信号的声音库，库中包括流水声、噪声、音乐声等各种生活中常见干扰信号，人对这些干扰信号的接受度比较高，会议参与者较能适应在这些干扰信号下工作。在模块P9部分，根据会议内容和会议要求，适当选择其中一种或者若干种固定的干扰信号作为复合干扰信号的一部分。在P6合成模块，综合结合干扰语音生成复合干扰声音，适当选择干扰语音所占的比重。所述步骤4)中，如图2所示，目标声音和干扰声音由不同的扬声器系统进行播放，这两个扬声器系统在空间位置上有一些差异。播放目标声音的扬声器系统可以放在会议参与者的前方，靠近视频播放设备，如图中R3，而播放干扰声音的扬声器系统可以位于相对会议参与者的其他方向，比如天花板上、侧方等，如图中R4，建议两者在水平方向有一定的角度差异。由心理声学可知，过小的空间角度差异，不能达到较高的空间去掩蔽能力，人耳对水平方向的空间分辨能力强于垂直方向，布放扬声器系统时要结合房间结构和心理声学效应综合考虑。适当把播放干扰声音的扬声器系统靠近窗户和门等地方，图中Rl和R7。播放干扰声音的扬声器系统可以由几个位于不同空间位置的几组扬声器组成，综合考虑靠近窗户、门、通风管道等声音容易泄露区域。如此设计之后，图中会议参与者区域R6能够同时接收到目标声音和干扰声音，参与者双耳的空间去掩蔽效应，帮助参与者可以正确的识别前面的目标声音，去除干扰声音，正常进行会议；而在此区域内的录音设备同时拾取了目标声音和干扰声音，录音质量大大下降，干扰声音对目标声音的干扰使录音文件内目标声音的可懂度大大降低，信息内容丧失或者部分丧失。而在会议参与者之外的其他普通区域R5，录音设备同样会同时拾取目标声音和干扰声音，录音质量大大下降。房间内的窗户、门等薄弱环节，在此区域Rl和R7，可以适当加入专门一组指向性扬声器，对此区域进行干扰，信号和干扰声音一样。目标声音的时域波形图如图3所示，通过处理目标声音得到干扰语音信号如图4 所示，本实施例的干扰语音信号由目标声音分帧后，分别通过时反和随机化相位谱，得到时反干扰信号和语谱信号，叠加两者得到干扰语音信号。图4干扰语音信号具体由，帧长为 200ms的时反干扰信号和帧长为500ms的语谱噪声信号，两者等能量相加得到。干扰语音信号具有目标声音的一些特征，比如长时幅度谱一样，包络类似等，是一种类似语音信号，通过如上设计，干扰语音信号没有可懂度。接着，从干扰存储库中选择空调噪声，叠加空调噪声和干扰语音信号合成干扰声音，两者等能量相加，干扰声音如图5所示。目标声音由位于会议参与者正前方的扬声器播放，干扰声音由位于会议参与者右后方的扬声器播放，水平空间角度大概为130度，调节目标声音和干扰声音在会议参与者区域的能量比在OdB左右，在会议参与者区域内的测试人员可以清楚的分辨目标声音的方向，正确接收目标声音的内容，而在此区域内的手机录音效果很差。这样，本发明的方法在基本不影响会议参与者正常接收信息的前提下，干扰录音设备的工作，达到保护语音隐私的目的。最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。
权利要求
1.一种目标语音的隐私保护方法，该方法基于目标语音信号产生干扰语音信号，并结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。
2.根据权利要求1所述的目标语音的隐私保护方法，其特征在于，所述的方法包括步骤步骤1)将待播放目标语音信号拷贝成两份目标语音信号，一路直接用于目标声音播放，一路用于产生干扰语音信号；步骤幻根据待播放目标语音信号产生干扰语音信号；步骤幻根据所述的步骤幻的干扰语音信号，选择干扰存储库内干扰信号中的一个或者若干个，合成得到复合干扰声音；步骤4)分别将步骤1)的一路目标语音信号和步骤幻得到的复合干扰声音通过各自的扬声器系统进行播放。
3.根据权利要求1或2所述的目标语音的隐私保护方法，其特征在于，所述的干扰语音信号的产生，是通过分帧处理，然后每帧进行时间反转、随机化短时相位谱操作后，把每帧信号进行重叠相加得到。
4.根据权利要求1或2所述的目标语音的隐私保护方法，其特征在于，所述的干扰存储库内的干扰信号包括鸟叫声、噪声或流水声。
5.根据权利要求1或2所述的目标语音的隐私保护方法，其特征在于，所述的复合干扰信号合成过程中，还包括调节干扰语音信号所占比重的步骤。
6.一种目标语音的隐私保护系统，该系统基于目标语音信号产生干扰语音信号，结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。
7.根据权利要求6所述的目标语音的隐私保护系统，其特征在于，所述的系统包括目标语音信号的输入模块，用于将待播放目标语音信号拷贝生成两份目标语音信号，一路直接输出用于目标声音播放，一路输出至信号处理模块用于产生干扰语音信号；信号处理模块，用于根据待播放目标语音信号产生干扰语音信号；信号合成模块，用于合成信号处理模块得到的干扰语音信号和选择的干扰存储库内干扰信号中的一个或者若干个，得到复合干扰声音；扬声器模块，包括目标语音信号的扬声器系统和复合干扰声音的扬声器系统，用于分别播放目标语音信号和复合干扰声音。
8.根据权利要求7所述的目标语音的隐私保护系统，其特征在于，所述的信号处理模块，通过分帧处理，然后每帧进行时间反转、随机化短时相位谱操作后，把每帧信号进行重叠相加得到干扰语音信号。
9.根据权利要求6或7所述的目标语音的隐私保护系统，其特征在于，所述的目标语音信号的扬声器系统和复合干扰声音的扬声器系统，根据扬声器系统的空间布局和房间结构，按照心理声学效应设计，调整两个扬声器系统的输出信号强度和扬声器系统的空间位置。
10.根据权利要求6或7所述的目标语音的隐私保护系统，其特征在于，所述的复合干扰声音的扬声器系统采用指向性扬声器，布置在声音容易泄漏的区域。
全文摘要
本发明涉及一种目标语音的隐私保护方法及其系统，该方法基于目标语音信号产生干扰语音信号，并结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。该系统基于目标语音信号产生干扰语音信号，结合已有干扰存储库内干扰信号合成复合干扰声音，所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。干扰声音是一种复合干扰信号，包括和目标语音信号相关部分，相关部分由处理目标语音信号产生，具有干扰效率高、烦恼度低的优点；其次，干扰声音和目标声音由位于不同空间位置的扬声器系统进行播放，既达到干扰录音设备拾取声音信号，同时基本不影响会议正常进行。
文档编号G10K11/175GK102543066SQ201210006800
公开日2012年7月4日申请日期2012年1月11日优先权日2011年11月18日
发明者杨军, 蒋斌申请人:中国科学院声学研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蒋斌;杨军
技术所有人：中国科学院声学研究所
我是此专利的发明人

上一篇：一种音频文件音质识别方法及其系统的制作方法
上一篇：声音信号处理设备、声音信号处理方法和程序的制作方法