音频识别方法及装置的制造方法

文档序号：9709464阅读：548来源：国知局

音频识别方法及装置的制造方法
【技术领域】
[0001]本发明涉及智能电视技术领域，尤其涉及一种音频识别方法及装置。
【背景技术】
[0002]随着智能电视语音识别技术的高速发展，用户在家由传统的到处找遥控器发展到现在不用遥控器，直接用嘴告诉电视，用户喜欢看的影视、连续剧综艺节目等。虽然该种方式比较方便，然而该方式在语音识别环节的语音传送过程中，可能出现PCM(Pulse CodeModulat1n，脉冲编码调制)码流数据的丢失，从而造成语音识别的准确度差。例如，小敏拿着自己的无线网的手机对电视说“想看刘德华电影”，在无线网手机麦克风将PCM码流数据传送到TV端，TV端因为传送过程受到无线网多辐射干扰，集成电路片间总线干扰等因素，造成传送的PCM码流数据出现丢失，将丢失“影(0X1100,0X1000，丢失数据)”的码流数据上传到云端，识别出想看刘德华电字串，在TV上显示出刘德华电，此时，就造成小敏的困惑，因为刘德华有电影，刘德华有电视剧等等。

【发明内容】

[0003]本发明的主要目的在于提供一种音频识别方法及装置，旨在解决语音传送过程中，出现PCM码流数据的丢失，从而造成语音识别的准确度差的问题。
[0004]为实现上述目的，本发明提供的一种音频识别方法，所述音频识别方法包括:
[0005]获取音频缓存区中存储的音频数据，其中，终端在接收到音频数据时，将接收到的音频数据存储至所述音频缓存区中；
[0006]获取所述音频数据的第一特征信息以及终端当前显示界面中各个字符的第二特征信息；
[0007]确定当前显示界面的各个字符中所述第二特征信息与所述第一特征信息匹配的字符；
[0008]将确定的所述字符作为与所述音频数据匹配的字符。
[0009]可选地，所述获取所述音频数据的第一特征信息的步骤包括:
[0010]确定所述音频数据的码流中的最大码值以及最小码值；
[0011]获取所述音频数据的码流中出现最大码值的数据时刻以及出现最小码值的数据时刻之间的码值；
[0012]根据获取到的所述码值计算所述音频数据的第一特征信息。
[0013]可选地，所述根据获取到的所述码值计算所述音频数据的第一特征信息的步骤包括:
[0014]对所获取到的所述码值进行求和得到所述音频数据的校验值；
[0015]按照预设的左移算法对所述校验值进行左移处理，以得到所述音频数据的第一特征信息。
[0016]可选地，获取终端当前显示界面中各个字符的第二特征信息的步骤包括:
[0017]获取终端当前显示界面中所述各个字符在预设的字符文件中重复出现的比例；
[0018]判断所述各个字符重复出现的比例是否大于第一预设比例；
[0019]若是，则按照各个字符重复出现的比例依次从云端获取各个字符对应的第二特征
?目息。
[0020]可选地，所述获取音频缓存区中存储的音频数据的步骤之前，所述音频识别方法还包括:
[0021]确定所述音频缓存区中存储的音频数据中码值大于1的音频数据的个数以及所述音频数据的第二预设比例所对应的音频数据的个数；
[0022]判断音频数据中码值大于1的音频数据的个数是否大于所述音频数据的第二预设比例所对应的音频数据的个数；
[0023]若是，则执行获取音频缓存区中存储的音频数据的步骤。
[0024]此外，为实现上述目的，本发明还提供一种音频识别装置，所述音频识别装置包括:
[0025]第一获取模块，用于获取音频缓存区中存储的音频数据，其中，终端在接收到音频数据时，将接收到的音频数据存储至所述音频缓存区中；
[0026]第二获取模块，用于获取所述音频数据的第一特征信息以及终端当前显示界面中各个字符的第二特征信息；
[0027]确定模块，用于确定当前显示界面的各个字符中所述第二特征信息与所述第一特征信息匹配的字符。
[0028]匹配模块，用于将确定的所述字符作为与所述音频数据匹配的字符。
[0029]可选地，所述第二获取模块包括:
[0030]确定单元，用于确定所述音频数据的码流中的最大码值以及最小码值；
[0031]获取单元，用于获取所述音频数据的码流中出现最大码值的数据时刻以及出现最小码值的数据时刻之间的码值；
[0032]计算单元，用于根据获取到的所述码值计算所述音频数据的第一特征信息。
[0033]可选地，所述计算单元包括:
[0034]求和子单元，用于对所获取到的所述码值进行求和得到所述音频数据的校验值；
[0035]处理子单元，用于按照预设的左移算法对所述校验值进行左移处理，以得到所述音频数据的第一特征信息。
[0036]可选地，所述第二获取模块还包括:
[0037]所述获取单元，还用于获取终端当前显示界面中所述各个字符在预设的字符文件中重复出现的比例；
[0038]判断单元，用于判断所述各个字符重复出现的比例是否大于第一预设比例；
[0039]所述获取单元，还用于若所述各个字符重复出现的比例大于第一预设比例，则按照各个字符重复出现的比例依次从云端获取各个字符对应的第二特征信息。
[0040]可选地，所述音频识别装置还包括:
[0041]所述确定模块，还用于确定所述音频缓存区中存储的音频数据中码值大于1的音频数据的个数以及所述音频数据的第二预设比例所对应的音频数据的个数；
[0042]判断模块，用于判断音频数据中码值大于1的音频数据的个数是否大于所述音频数据的第二预设比例所对应的音频数据的个数；
[0043]所述第一获取模块，还用于若音频数据中码值大于1的音频数据的个数大于所述音频数据的第二预设比例所对应的音频数据的个数，则获取音频缓存区中存储的音频数据。
[0044]本发明通过获取音频数据的特征信息，并将所述音频数据的特征信息与从云端获取的终端当前显示界面的各个字符数据对应的特征信息进行匹配，使得即使音频数据存在丢失的情况，也能根据所述音频数据的特征信息与所述各个字符数据对应的特征信息进行匹配，从而识别出所述音频数据对应的字符，提高了语音识别准确度。
【附图说明】
[0045]图1为本发明音频识别方法的第一实施例的流程示意图；
[0046]图2为图1中所述获取所述音频数据的第一特征信息的细化流程示意图；
[0047]图3为图2中根据获取到的所述码值计算所述音频数据的第一特征信息的细化流程不意图；
[0048]图4为图1中获取终端当前显示界面中各个字符的第二特征信息的细化流程示意图；
[0049]图5为本发明音频识别方法的第二实施例的流程示意图；
[0050]图6为本发明音频识别装置的第一实施例的功能模块示意图；
[0051 ]图7为图6中第二获取模块的细化功能模块示意图；
[0052]图8为本发明音频识别装置的第二实施例的功能模块示意图。
[0053]本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
【具体实施方式】
[0054]应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0055]基于上述问题，本发明提供一种音频识别方法。
[0056]参照图1，图1为本发明音频识别方法的第一实施例的流程示意图。
[0057]在本实施例中，所述音频识别方法包括:
[0058]步骤S10，获取音频缓存区中存储的音频数据，其中，终端在接收到音频数据时，将接收到的音频数据存储至所述音频缓存区中；
[0059]在本实施例中，所述终端可为智能电视，以下以智能电视为例进行说明。智能电视侦测到语音PCM码流输入时，将接收到的语音PCM码流(音频数据)存储至音频缓存区中，然后实时或定时检测所述音频缓存区是否存在音频数据，并在检测到所述音频缓存区存在音频数据后，获取所述音频缓存区中的音频数据。例如，获取到所述音频缓存区的第一存储单元存储的数据为0x50，S卩APCM_Data(xl) =0x50;获取到所述音频缓存区的第二存储单元存储的数据为0x40，即 APCM_Data(x2) =0x40。
[0060]步骤S20，获取所述音频数据的第一特征信息以及终端当前显示界面中各个字符的第二特征信息；
[0061]当智能电视获取到音频缓存区中存储的音频数据后，对所述音频数据进行求和及移位处理，从而得到所述音频数据的第一特征信息，例如，经过对所述音频数据求和及移位处理后，得到所述音频数据的第一的特征信息为OxOAOO。在本实施例中，所述音频数据为智能电视的控制指令对应的语音PCM码流数据，包括人名、一些特定的名词对应的语音PCM码流数据等。所述第一特征信息为所述音频数据的校验数据，该检验数据是唯一的，即每个音频数据的校验数据唯一代表一个音频数据。
[0062]在获取到所述音频数据的第一特征信息后，获取终端当前显示界

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王云华;
技术所有人：深圳TCL数字技术有限公司;
我是此专利的发明人

上一篇：概率线性鉴别分析模型生成方法和说话人聚类方法及系统的制作方法
上一篇：一种粉末冶金管扩散消声器的制造方法