一种用于录音笔的语音特征提取控制方法
【技术领域】
[0001]本发明涉及一种用于录音笔的语音特征提取控制方法,属于录音笔控制的技术领域。
【背景技术】
[0002]数码录音笔,也称为数码录音棒或数码录音机,数字录音器的一种,为了便于操作和提升录音质量造型并非以单纯的笔型为主,携带方便,同时拥有多种功能,如激光笔功能、FM调频、MP3播放等。与传统录音机相比,数码录音笔是通过数字存储的方式来记录音频的。
[0003]其过程原理是,数码录音笔通过对模拟信号的采样、编码将模拟信号通过数模转换器转换为数字信号,并进行一定的压缩后进行存储。而数字信号即使经过多次复制,声音信息也不会受到损失,保持原样不变。
[0004]因为是录音设备,录音时间的长短自然是数码录音笔最重要的技术指标。根据不同产品之间闪存容量、压缩算法的不同,录音时间的长短也有很大的差异。内存为IG的数码录音笔的录音存储时间在都在20-272小时,电池连续工作时间一般在2-26小时左右,可以满足大多数人的需要。不过需注意的是,如果很长的录音时间是由于其通过使用了高压缩率获得的话,往往会影响录音的质量。
[0005]因此,使得录音笔录音方式压缩率十分低,音质非常好,但容量比较大,一般适合要求较高的场合使用,例如为重要讲话作存档式的记录等。
[0006]虽然现有的录音笔在录音过程中,实现其功能,但是其仍然存在问题。如申请号:201310710630.3申请日:2013-12-20的文件中,公开了“一种具有温湿度计的录音笔,它包括录音笔本体,其特征在于:录音笔本体的前表面有显示屏及功能按键,录音笔本体的后表面有温湿度计,温湿度计与录音笔本体内部电源的输出电路相连”。该录音笔由于将温湿度计集成到了录音笔本体上,增加了录音笔的户外实用性,户外旅行时不仅能够通过录音笔录制语音游记,还能随时了解空气中的温湿度信息,更具温湿度信息能够正确携带相应的装备。
[0007]而在另外一篇申请号:201520029314.4申请日:2015-01-15的文件中,公开了“一种双存储的录音笔,所述录音笔包括麦克风、音频编解码模块、存储控制电路和第一存储介质,其中:所述麦克风用于将接收的语音信号转化为模拟音频信号;所述音频编解码模块与所述麦克风连接,对接收到的模拟音频信号进行采样并且编码为数字音频信号;所述存储控制电路与所述音频编解码模块相连接,基于编码的数字音频信号生成录音文件,并且将所述录音文件写入到所述第一存储介质和第二存储介质;所述第一存储介质,与所述存储控制电路相连接,用于存储所述录音文件”,该实用新型的实施例双存储的录音笔能够在两个存储介质中同时保存录音文件,提高了录音文件的安全性。
[0008]虽然上述文献对录音笔做出改进,使得功能更加完善。但是其在实际运用过程中,仍然存在缺陷。现有的录音笔在使用中,只能执行语音录入功能,而无法对语音进行关键字提取,用户需要听取录音才能获知其内容,而录音笔无法自动提取频率出现多次的语音特征,由此不具备自动检测识别功能,降低使用效率。
【发明内容】
[0009]本发明所要解决的技术问题在于克服现有技术的不足,提供一种用于录音笔的语音特征提取控制方法,解决现有的录音笔不具备自动检测识别功能、无法自动提取频率出现多次的语音特征的问题。
[0010]本发明具体采用以下技术方案解决上述技术问题:
一种用于录音笔的语音特征提取控制方法,包括以下步骤:
步骤1、输入语音信号;
步骤2、对所输入的语音信号进行检测和识别,获得语音特征并进行寄存;
步骤3、连续对输入的语音信号进行识别,当语音信号中再次出现已寄存的语音特征时,对该语音特征进行频率累计;
步骤4、判断检测的语音信号是否结束,当语音信号检测未结束时返回步骤2 ;当语音信号检测结束时,执行步骤5;
步骤5、在语音信号检测结束后,提取出频率累计最高的语音特征;
步骤6、将步骤5所提取的语音特征作为语音信号的关键字输出。
[0011]进一步地,作为本发明的一种优选技术方案:所述步骤2中获得至少两个语音特征。
[0012]进一步地,作为本发明的一种优选技术方案:所述步骤3还包括将语音特征的频率累计进行对比,获得频率累计最高的语音特征。
[0013]进一步地,作为本发明的一种优选技术方案:所述步骤5将所提取的语音特征生成文本后作为语音信号的关键字输出。
[0014]进一步地,作为本发明的一种优选技术方案:所述步骤5还包括将所提取的语音特征生成语音信号的文件名,及将语音信号以该文件名进行输出。
[0015]本发明采用上述技术方案,能产生如下技术效果:
(I)本发明所提供的用于录音笔的语音特征提取控制方法,通过对输入的语音信号进行检测和识别,获得语音特征并进行累计,在检测的语音信号结束时,提取出频率累计最高的语音特征,并将其作为语音信号的关键字输出,由此使得语音信号不仅可以录入,还能自动检测和识别,自动提取关键字,使得用户在查看音频文件时,无需逐个打开文件,即可获知语音信号的关键字,使得语音信号处理过程更加智能化,方便用户对音频文件的分辨;有效解决现有的录音笔不具备自动检测识别功能、无法自动提取频率出现多次的语音特征的问题。
【附图说明】
[0016]图1为本发明用于录音笔的语音特征提取控制方法的流程示意图。
【具体实施方式】
[0017]下面结合说明书附图,对本发明的实施方式进行描述。
[0018]如图1所示,本发明提供了一种用于录音笔的语音特征提取控制方法,该方法具体包括以下步骤:
步骤1、输入语音信号;
步骤2、对所输入的语音信号进行检测和识别,获得语音特征并进行寄存;
步骤3、连续对输入的语音信号进行识别,当语音信号中再次出现已寄存的语音特征时,对该语音特征进行频率累计;
步骤4、判断检测的语音信号是否结束,当语音信号检测未结束时返回步骤2 ;当语音信号检测结束时,执行步骤5;
步骤5、在语音信号检测结束后,提取出频率累计最高的语音特征;
步骤6、将步骤5所提取的语音特征作为语音信号的关键字输出。
[0019]由此,在检测的语音信号结束时,提取出频率累计最高的语音特征,并将其作为语音信号的关键字输出,由此使得语音信号不仅可以录入,还能自动检测和识别,自动提取关键字。
[0020]进一步地,本发明的方法在实施时,步骤2中获得的语音特征至少两个,即当识别出一个语音特征时进行寄存,在获得另外一个或多个语音特征时分别寄存;而至少为两个可以使得识别过程更加灵敏。多个语音特征方式下,分别逐个识别后对应其频率值,出现I次则记录为1,出现4次则为4,出现N次则为N。
[0021]并且,所述步骤3在进行频率累计的过程还可以包括将语音特征的频率累计进行对比,如将语音特征A获得的频率累计数3和语音特征B获得的频率累计数7进行对比,获得语音特征B获得的频率累计数7为最高;实现对比过程,使得提取过程更加精准,
在此基础上,本发明的控制方法中还可以在所述步骤5中进一步改进,将所提取的语音特征生成文本后作为语音信号的关键字输出。即系统每生成一个音频文件,则自动生成对应文本,文本内容即关键字内容,关键字即所提取的语音特征,文本可以与音频文件设定成绑定模式,使得用户在选择音频文件时,自动将文本弹出,便于用户查看该段音频的主要内容。
[0022]更进一步地,在上述过程中,所述步骤5还可以包括将所提取的语音特征生成语音信号的文件名,及将语音信号以该文件名进行输出;即直接将语音特征作为该音频文件的文件名,使得用户可以快速解读获知该音频的主要内容。
[0023]综上,本发明所提供的用于录音笔的语音特征提取控制方法,使得语音信号不仅可以录入,还能自动检测和识别,自动提取关键字,使得用户在查看音频文件时,无需逐个打开文件,即可获知语音信号的关键字,使得语音信号处理过程更加智能化,方便用户对音频文件的分辨;有效解决现有的录音笔不具备自动检测识别功能、无法自动提取频率出现多次的语音特征的问题。
[0024]上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
【主权项】
1.一种用于录音笔的语音特征提取控制方法,其特征在于,包括以下步骤: 步骤1、输入语音信号; 步骤2、对所输入的语音信号进行检测和识别,获得语音特征并进行寄存; 步骤3、连续对输入的语音信号进行识别,当语音信号中再次出现已寄存的语音特征时,对该语音特征进行频率累计; 步骤4、判断检测的语音信号是否结束,当语音信号检测未结束时返回步骤2 ;当语音信号检测结束时,执行步骤5; 步骤5、在语音信号检测结束后,提取出频率累计最高的语音特征; 步骤6、将步骤5所提取的语音特征作为语音信号的关键字输出。2.根据权利要求1所述用于录音笔的语音特征提取控制方法,其特征在于:所述步骤2中获得至少两个语音特征。3.根据权利要求1所述用于录音笔的语音特征提取控制方法,其特征在于:所述步骤3还包括将语音特征的频率累计进行对比,获得频率累计最高的语音特征。4.根据权利要求1所述用于录音笔的语音特征提取控制方法,其特征在于:所述步骤5将所提取的语音特征生成文本后作为语音信号的关键字输出。5.根据权利要求1所述用于录音笔的语音特征提取控制方法,其特征在于:所述步骤5还包括将所提取的语音特征生成语音信号的文件名,及将语音信号以该文件名进行输出。
【专利摘要】本发明公开了一种用于录音笔的语音特征提取控制方法,包括:输入语言信号;对所输入的语音信号进行检测和识别,获得语音特征并进行寄存;连续对输入的语音信号进行识别,当再次出现已寄存的语音特征时,对该语音特征进行频率累计;判断检测的语音信号是否结束,当语音信号检测未结束时返回识别步骤;当语音信号检测结束时,执行提取步骤;在语音信号检测结束后,提取出频率累计最高的语音特征;将所提取的语音特征作为语言信号的关键字输出。本发明不仅可以录入,还能自动检测和识别,自动提取关键字,使得用户在查看音频文件时,无需逐个打开文件,即可获知语音信号的关键字,使得语音信号处理过程更加智能化,方便用户对音频文件的分辨。
【IPC分类】G10L15/02
【公开号】CN105023571
【申请号】CN201510447252
【发明人】冯方敏
【申请人】苏州宏展信息科技有限公司
【公开日】2015年11月4日
【申请日】2015年7月28日