专利名称:一种云数据中心语音识别方法
技术领域:
本发明涉及计算机应用领域,具体地说是一种云数据中心语音识别方法。
背景技术:
随着信息科技的发展,云计算逐步成为业界的发展热点,国内外各大厂商的云计算服务平台也开始纷纷投入到科学、教育、文化、卫生、政府、高性能计算、电子商务、物联网等多个领域进行使用。为了保障云数据中心的安全,大多数云数据中心的机房中安装了密码身份识别系统。但是由于传统的文本密码具有易复制、易失窃、易遗忘等缺点,导致密码身份识别系统存在很多安全漏洞。语音作为一种生物特征,具有人体所固有的不可复制的唯一性。将语音识别系统与云数据中心相连,可以将不同用户的不同声音信息作为密钥,识别用户的身份,并决定用户的使用权限。这样,相对于传统的文本密码,更加难以破译,具有更高的安全性。除此之外,针对市场上语音识别系统一般为单特定人识别和非特定人识别的局限,本系统提出多特定人语音识别方案,解决了云数据中心多用户使用权限的分配问题。
发明内容
本发明的目的是提供一种云数据中心语音识别方法。本发明的目的是按以下方式实现的,利用HBRllO芯片,通过动态时间规整算法进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括1)整体架构设计, 2)硬件设计和3)软件设计,其中,
1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBRl 10芯片,结合8031单片机、 音频放大电路、SPI FLASH存储器以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能;
2)硬件设计,硬件设计工作,包括系统原理图设计、PCB设计;
3)软件设计,软件的设计工作,使用汇编语言对8031单片机进行编程,实现对硬件系统的控制;控制HBRllO芯片完成如下操作
Sl预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响,并涉及到语音识别基元的选取和端点检测问题;
S2特征提取用于提取语音中反映本质特征的声学参数,包括平均能量、平均跨零率、 共振峰;
S3训练在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息, 保留关键数据,再按照一定规则对数据加以聚类,形成模式库;
S4模式匹配是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。
本发明的有益效果是
a)多特定人语音识别技术突破了目前市场上一般为单特定人识别或非特定人识别的语音识别系统局限;
b)权限分配提高安全性本系统能够针对不同用户分配不同的使用权限,从而提高了系统的安全性能;
c)独特口音的处理技术用户不须使用标准发音,即可顺畅使用该系统;
d)多样化语音模型样本机器训练时输入的语音模型可由用户需求而定,不必使用系统提供的特定样本。经过实验验证,本系统具有较高的准确性和实用性,语音匹配正确率达90%以上。
图1是语音识别流程图; 图2是语音识别硬件架构图。
具体实施例方式
参照说明书附图对本发明的方法作以下详细地说明。本发明的一种云数据中心语音识别方法,其结构是由
本系统的实现流程如附图1所示。正如发明内容中所描述的,本发明的体系结构主要包括整体架构设计,硬件设计,软件设计。其中,整体架构设计是系统的首要设计工作,通过广泛调研,选择采用如附图2的硬件架构。协处理器HBRllO负责完成对声音的输入、识别、处理、输出工作由,主控芯片 8031负责完成相应的控制操作,后者通过程序控制整个系统的工作,是系统的核心。硬件设计是系统设计的第二步。通过综合分析各电子元件的元件特性、散热要求、 工作环境等,分别设计主处理器8031单片机、协处理器HBRllO芯片的外围电路及音频放大电路和SPI FLASH存储设备电路,完成系统原理图和PCB图。软件设计是系统设计的最后一步。使用汇编语言对8031单片机进行编程,控制 HBRllO芯片完成如下操作
Sl预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等,并涉及到语音识别基元的选取和端点检测问题;
S2特征提取用于提取语音中反映本质特征的声学参数,如平均能量、平均跨零率、共振峰等;
S3训练在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息, 保留关键数据,再按照一定规则对数据加以聚类,形成模式库;
S4模式匹配是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。除说明书所述的技术特征外,均为本专业技术人员的已知技术。
权利要求
1. 一种云数据中心语音识别方法,其特征在于利用HBRllO芯片,通过动态时间规整算法进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括1)整体架构设计,2 )硬件设计和3 )软件设计,其中,1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBRl 10芯片,结合8031单片机、 音频放大电路、SPI FLASH存储器以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能;2)硬件设计,硬件设计工作,包括系统原理图设计、PCB设计;3)软件设计,软件的设计工作,使用汇编语言对8031单片机进行编程,实现对硬件系统的控制;控制HBRllO芯片完成如下操作Sl预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响,并涉及到语音识别基元的选取和端点检测问题;S2特征提取用于提取语音中反映本质特征的声学参数,包括平均能量、平均跨零率、 共振峰;S3训练在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息, 保留关键数据,再按照一定规则对数据加以聚类,形成模式库;S4模式匹配是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。
全文摘要
本发明提供一种云数据中心语音识别方法,利用HBR110芯片,通过动态时间规整算法进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括1)整体架构设计,2)硬件设计和3)软件设计,其中,1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBR110芯片,结合8031单片机、音频放大电路、SPIFLASH存储器以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能。
文档编号H04L29/08GK102402983SQ20111038016
公开日2012年4月4日 申请日期2011年11月25日 优先权日2011年11月25日
发明者吕广杰, 朱波, 朱锦雷 申请人:浪潮电子信息产业股份有限公司