具有发音质量评价的嵌入式语言教学机的制作方法

文档序号:2613070阅读:149来源:国知局
专利名称:具有发音质量评价的嵌入式语言教学机的制作方法
技术领域
本发明属于语音技术和嵌入式系统领域,尤其涉及具有发音质量评价 的嵌入式语言教学机。
背景技术
机器辅助语言学习在上世纪九十年代开始研究和应用。目前市场上已经有多种嵌入式的英语学习机产品,如好记星和E百分等。它们都釆用数 字信号处理(Digital Signal Processing,以下简称DSP)技术。硬件系统一 般包括微控制器(Micro Control Unit,以下简称MCU) DSP芯片、多媒 体数字信号编解码器(Coder-Decoder,以下简称CODEC)快闪存储器(Flash Memory)通用串行总线(Universal Serial Bus,以下简称USB) 键盘和液晶显示器(Liquid Crystal Display,简称LCD)等;其中MCU作 为主控芯片,执行设备驱动和程序调度等操作系统程序,DSP执行应用算 法程序。功能上具有内容检索査询,复读,跟读,跟读对比,文字同步显 示,语速可调节的放音等,有些产品还具有MP3功能。这些语言学习产 品大都可以通过互联网下载和更新学习材料。总结目前语言学习机产品的主要问题在于学习过程基本是学习者阅 读或收听学习内容,机器对学习者的发音质量不能进行评价,缺乏互动的 学习过程枯燥乏味。因此,实现具有互动性学习功能、能够对学习者的发 音质量进行评价的新一代学习机是非常重要和必然的。发明内容本发明的目的是为了突破现有学习机的缺陷,提供一种除了实现现有 学习机的单词和语句学习、语言阅读、语言练习和测试等功能外,还融入
对学习者发音质量进行评价的功能和互动式的语言教学思想,对学习者的 单词和语句跟读,能给出发音质量的分数或等级,让学习者自我了解发音是否规范正确;此外还引入互动式教学思想,模拟现实的课堂教学,讲解、 提问、评价等学习环节交错进行,对学习者的语音或按键回答做出评判, 同时可以根据回答结果选择后继教学内容的教学机。本发明提供的具有发音质量评价的嵌入式教学机,包括硬件平台和软 件系统;其特点是其硬件平台包括电池和电源模块、语音处理芯片、闪烁存储器、 CODEC、液晶显示屏、键盘、麦克、语音功率放大芯片、喇叭和耳机插 座、USB接口芯片;其中上述电池和电源模块为上述的硬件平台提供电源;上述语音处理芯片与上述麦克相连,学习者的语音信号通过上述麦克传送 给上述语音处理芯片,上述语音处理芯片对上述语音信号至少进行压缩、 评价处理;上述语音处理芯片与上述闪烁存储器相连,完成程序的加载和数据的存储;上述语音处理芯片与上述键盘相连,接受上述键盘的按键消 息;上述语音处理芯片与上述液晶显示屏相连,控制显示屏的刷新显示;上述语音处理芯片与上述CODEC相连,上述CODEC输出模拟音频信号, 上述音频信号经上述语音功率放大芯片放大通过上述喇叭输出声音,上述音频信号也可通过上述耳机插座直接外接耳机输出声音;上述语音处理芯 片与上述USB接口芯片相连,实现与计算机的通讯;其软件系统包括系统程序、箅法程序和应用程序,在上述的语音处理芯片上运行;其中系统程序是准实时的操作系统,配置和驱动上述其他器 件,实现上述的语音处理芯片与外围器件的通信,调用箅法程序和应用程 序,控制系统的流程;上述算法程序完成语音的编译码、学习者发音质量 评价的算法;上述应用程序是开放式软件平台,解释具体的学习课件。具有发音质量评价的嵌入式教学机硬件平台的具体电路连接与功能 说明如下(1)上述语音处理芯片为MCU和DSP,上述MCU控制外围器件, 上述DSP运行语音的编解码程序和发音质量评价算法程序;(2) 上述语音处理芯片与上述闪烁存储器之间有双向数据、地址和 控制信号线的连接,上述语音处理芯片向上述闪烁存储器读写程序与数据 内容,完成程序的加载和数据的存储;(3) 上述语音处理芯片与上述键盘有控制信号和数据线连接;(4) 上述语音处理芯片与上述液晶显示屏有双向数据、地址和控制 信号线的连接,上述语音处理芯片从上述液晶显示屏读出当前显示的数 据,上述语音处理芯片向液晶显示屏写入需在上述液晶显示屏重新显示的 数据;(5) 上述语音处理芯片与上述CODEC有控制信号线和数据线的连 接;语音处理芯片输出音频数据到所述的CODEC;(6) 语音处理芯片与USB接口芯片有控制信号线和双向数据的连接。上述算法程序的具体程序模块包括学习内容音频数据的播放、录音、 录音回放、语速调节以及发音质量评价;其中(1) 学习内容音频数据的播放模块中,釆用低码率和高音质的音频 编码方法压缩编码后的压缩语音先解码成数字语音,再经过D/A变换得到 可供播放的模拟语音;(2) 录音模块中,模拟语音信号经过A/D变换,得到数字语音并进 行分帧,进行实时的端点检测和音量检测,对上述分帧语音进行低码率压 縮编码得到压縮语音,并提取用于发音质量评价的语音特征;(3) 录音回放模块中,对(2)所述的压缩编码后的压缩语音进行解 码得到数字语音,上述数字语音经过D/A变换,得到可供播放的模拟语音;(4) 语速调节模块中,对(1)和(3)所述的解码后的数字语音进 行时域压扩,得到语速改变后的数字语音,语速改变后的数字语音经过 D/A变换,得到可供播放的模拟语音;(5) 发音质量评价模块中,利用(2)中所述的用于发音质量评价的 语音特征、预先训练好的标准发音模型和预先生成的标准发音网络进行发 音质量评价,得到发音质量的评分结果。
上述应用程序是一个解释具体学习课件的开放式软件平台,学习内容 先在计算机上组织并编译成一个课件文件,课件需要组织的内容包括学习 文本、标准发音、标准发音的字幕、为进行发音质量评价所需的标准发音的网络和预先训练好的标准发音模型;通过课件设计后的课件文件通过 USB接口下载到嵌入式设备,上述应用程序解释上述i果件文件,控制学习流程,至少实现单词学习、语句学习、课堂学习、语言练习、口语测试和 发音质量评价。
上述课件设计包括课件编排和课件保存两个方面,上述课件编排是指 按照数据结构实现学习的流程框架和学习功能,上述课件保存是指上述学 习内容通过上述课件编排形成的数据包的保存和索引查询。
上述课件文件内容釆取菜单和脚本的方式编排,每一级菜单或脚本编 制成一个独立的数据包并被分别独立编号,多个菜单和脚本形成一个分叉 树结构,脚本必须处于分叉树结构的末端;学习文本通过处于所述分叉树 结构中不同层次的菜单显示,单个菜单中包含多个菜单项,菜单项又包括 需显示的内容和对该菜单项的操作两部分;对于每一个菜单,可以上翻选 择并显示菜单的上一个菜单项,下翻选择并显示菜单的下一个菜单项,后 退到上一级菜单和进入到下一级操作,下一级的操作是菜单或者脚本。
上述脚本由操作命令顺序构成,上述操作命令由命令关键字和命令参 数构成,上述命令关键字标识操作类型;上述操作命令的长度固定为某字 节数或其倍数;上述操作类型至少包括放音、录音、简单评分、复杂评分、 暂停、延时;评分机制分为简单评分和复杂评分,上述简单评分仅仅给出 发音质量的评价,上述复杂评分根据上一次的发音质量评价结果给出不同 的反馈,进入不同的后续流程;上述发音质量评价用脚本实现,该脚本结 构包括三个操作命令,第一步播放标准音并显示字幕,第二步学习者跟读 标准音并录音,第三步给出跟读的评价;上述互动式课堂学习也用脚本实 现,至少由放音、录音、暂停、延时、简单评分、复杂评分操作命令组合 实现;在放音和录音操作时,液晶屏幕会有同步的字幕显示;上述菜单实 现学习内容的层次结构,上述脚本实现学习的顺序过程。上述课件按菜单和脚本的方式编排后,需要保存的数据内容包括菜 单、脚本、标准发音、标准发音的字幕、标准发音的网络,预先训练好的标准发音模型共六类数据;上述数据类中的每一项都是一个数据包,将数 据类的数据包分别独立从零开始顺序编号,相同编号的数据包再合成一个 数据项;上述课件保存分为索引头和具体的数据项两部分,索引头的每一 条索引项长度固定,索引项对应编号相同的数据项,依次记录数据项中数 据包的相对偏移地址和数据包的长度;数据项按编号从小到大顺序保存。本发明提供了一种具有词汇和语句学习、互动式课堂教学、语言练习 和测试等功能,能对学习者发音质量评价的嵌入式教学机。该发明具有以 下优点1.对学习者的发音质量进行分数或等级评价;2.模拟现实的课 堂教学方式,提供互动式的学习过程;3.实现个人口语能力和发音质量 的测试,记录各次测试成绩,方便査询;4. 一个开放式的软件平台,学 习者可以网上下载丰富的课件,也可以自己编制学习i果件内容;5.利用 USB通讯接口方便快捷更新学习内容;6.单一语音处理芯片实现控制和 算法,具有体积小、重量轻、耗电省、成本低的突出特点;7.对语音进 行压縮处理,占用存储空间小。下面结合附图,对本发明的具体实施作进一步的详细说明。对于所属 技术领域的技术人员而言,从对本发明的详细说明中,本发明的上述和其 他目的、特征和优点将显而易见。


图1为本发明一较佳实施例的总体结构框图。图2为本发明一较佳实施例的系统软件的结构方框图。图3为本发明一较佳实施例的课件实例的结构图。图4为本发明一较佳实施例的课堂教学实例的脚本结构图。图5为本发明一较佳实施例的课件索引头结构图。
具体实施例方式
本发明设计的具有发音质量评价的嵌入式教学机的实施例,结合附图详细说明如下请参照图1,该图是本发明一较佳实施例的总体结构框图。可以看出 本发明的具有发音质量评价的嵌入式教学机的硬件平台组成为U0电池 模块(本实施例釆用带电源管理的锂电池模块);Ul语音处理芯片(本实 施例釆用Infineon公司生产的UniSpeech芯片);U2闪烁存储器(本实施 例采用三星公司生产的K9F2808U0B芯片);U3键盘;U4液晶显示屏; U5麦克;U6多媒体数字信号编解码芯片(CODEC)(本实施例釆用 TLV3MAIC23芯片);U7音频输出插座;U8音频功率放大芯片(本实施 例釆用LM4871芯片);U9喇叭;U10 USB接口芯片(本实施例釆用 PDIUSBD12芯片)。本实施例的电路连接与功能说明如下1、 U0电池模块为本实施例的硬件平台提供电源。2、 Ul语音处理芯片为MCU和DSP双核结构,MCU控制外围器件, DSP运行语音编解码和学习者发音质量评价算法程序。3、 Ul与U2之间有双向数据、地址和控制信号线的连接,Ul语音处 理芯片向U2闪烁存储器读写程序与数据内容。4、 Ul与U3有控制信号和数据线连接,Ul语音处理芯片接收U3键 盘的按键消息。5、 U1与U4有双向数据、地址和控制信号线的连接,Ul语音处理芯 片控制U4液晶显示屏的更新显示,Ul从U4读出当前显示的数据,Ul 向U4写入需在U4重新显示的数据。6、 学习者的语音信号通过U5麦克传送给U1, Ul对所述的语音信号 进行压缩、评价等处理。7、 Ul与U6有控制信号线和数据线的连接,Ul输出的音频数据传送 给U6进行解码形成音频信号,所述的音频信号可以选择通过插到U7的 耳机输出或经U8功率放大后由U9喇叭输出。 8、 Ul与U10有控制信号线和双向数据的连接,Ul语音处理芯片通 过U10 USB通讯接口芯片实现与计算机的通讯。本发明的软件系统包括系统程序、算法程序和应用程序,在所述的语 音处理芯片上运行。其中,系统程序是准实时的操作系统,内核小,占用 资源少。系统程序配置和驱动所述的其它器件,实现所述的语音处理芯片与所述的外围器件的通信;系统程序调用所述的算法程序和所述的应用程序,控制系统的流程。下面请参照图2,该图是本发明一较佳实施例的系统软件的结构方框图。本发明一较佳实施例的软件系统分为系统程序、算法程序和应用程序,在U1语音处理芯片上运行。系统程序是整个软件系统的核心,为准实时操作系统,包括硬件驱动和系统调度两部分。硬件驱动是指控制外围器件,读写U2闪烁存储器的数据,处理U3键盘的按键消息,控制U4液晶显示 屏的显示,向U6传送数字语音数据以及控制U10实现与计算机的USB 通讯。系统调度是指系统程序调用所述的算法程序和所述的应用程序,控 制系统的运行流程,实现机器的教学功能。所述的算法程序包括语音编解码程序和发音评价程序,其程序的特点 是需处理的数据量大、运算量大。具体的程序模块包括学习内容音频数据 的播放、录音、录音回放、语速调节以及发音质量评价,每个模块的实施 例详细说明如下模块l、学习内容音频数据的播放(a) 根据学习内容预先准备好的学习内容音频数据的数字语音,采 样率为16kHz,量化位数为16bit,本实施例采用基于多链路骨干技术(MultiLink Tmnking简称MLT)的音频编码方法对所述的学习内容音频 数据的数字语音进行压縮编码,编码后的码流为24kbit/s;(b) 对压缩编码后的数字语音进行解码,得到解码后的数字语音;(c) 所述的解码后的数字语音经过D/A变换,得到可供播放的模拟语音。模块2、录音(a) 麦克输入的模拟语音信号首先进行低通滤波,然后通过16bit线 性A/D进行釆样和量化,成为数字语音,釆样频率为8kHz;(b) 对所述的数字语音进行分帧处理,得到具有准平稳性的分帧语 音;对所述的分帧语音进行实时的端点检测,得到当前帧的语音激活标识(如果当前帧被判断为语音则语音激活标识为1,否则为O);(c) 对所有语音激活标识为1的分帧语音进行音量检测,得到音量 是否适中的标识对最大能量区间的语音帧检查是否大于预先设定的阈 值,大于则判定音量过大;对最小能量区间的语音帧检査是否小于预先设定的阈值,小于则判定音量过小;(d) 对所有语音激活标识为1的分帧语音进行低码率压縮编码,得 到压縮编码后的数字语音,本实施例的语音编码釆用代数码激励线性预测(Algebraic-Code-Excited Linear-Prediction,简称ACELP)的方法,编码 后的码流为5.3 kbit/s,该编码方法根据线性预测分析-合成编码的原理编 码并试图极小化感知加权误差信号。编码器在每240个釆样点的帧上操作, 相当于8kHz釆样速率下的30ms;(e) 对所有语音激活标识为1的分帧语音提取用于发音质量评价的 语音特征。本实施例采用美尔频标倒谱系数(Mel-Frequency Ceptml Coefficients以下简称MFCC)作为语音特征;整个语音特征由MFCC参 数、MFCC —阶、二阶差分系数、归一化能量系数及其一阶、二阶差分系 数构成,每帧共包含39维特征。模块3、录音回放(a) 对模块2 (d)中所述的压缩编码后的数字语音进行解码,得到 解码后的数字语音;(b) 所述的解码后的数字语音经过D/A变换,得到可供播放的模拟语音。模块4、语速调节 (a)对模块1 (b)和模块3 (a)所述的解码后的数字语音进行时域
压扩,得到语速改变后的数字语音,本实施例采用基于同步交迭相加法(简称SOLA)的时域压扩方法;(b)所述的语速改变后的数字语音经过D/A变换,得到可供播放的 模拟语音。模块5、发音质量评价利用模块2 (e)中所述的用于发音质量评价的语音特征、预先训练好 的标准发音模型和预先生成的标准发音网络进行发音质量评价,得到发音 质量的评分结果。具体算法说明如下(a) 利用预先建立的包含大量朗读语音的训练数据库,训练得到基 于音素的标准发音模型,本实施例釆用基于音素的隐含马尔可夫模型(Hidden Markov Model以下简称HMM)作为标准发音模型,HMM是目前被广泛釆用的统计语音识别模型;(b) 对给定的跟读发音文本进行单词切分,查找发音字典得到音素 标注,最后利用所述的基于音素的标准发音模型得到以状态为节点的线性 标准发音网络;(c) 将模块2 (e)中所述的用于发音质量评价的语音特征与所述的 标准发音网络进行强制匹配(帧同步维特比(Viterbi)束搜索),得到网络 中所有可能的路径信息;利用所述的路径信息,从网络允许的终止节点回溯出最优路径;利用所述的最优路径信息计算得到每帧语音特征的置信分 数;进而计算得到每个状态的帧平均的置信分数;对最优路径上所有状态 的置信分数取平均得到整句的置信分数;最后利用映射函数将所述的整句 置信分数映射到主观评价分数区间,得到发音质量分数。本实施例的应用程序是一个开放式软件平台,用于课件解释。课件需 要组织的内容有学习文本、标准发音、标准发音的字幕、为了进行发音质 量评价所需的标准发音的网络和预先训练好的标准发音模型。i果件的设计 包括课件的编排和课件的保存两个方面,课件的编排采取菜单和脚本结合 的方式,本发明一较佳实施例的课件实例的结构图如图3所示。所述的课 件是各级层次结构,处于不同层次的多个菜单和脚本形成一个分叉树结
构,脚本必须处于分叉树结构的末端,每一级菜单或脚本编制成一个独立 的数据包并被分别独立编号。所述的菜单数据包完全采用文本字符写成(支持中文),本实施例的某具体菜单如图3中的菜单OOOl所示所述的菜单可以包括多个菜单项, 菜单项的数据格式固定为 H菜单项的内容 M对该菜单项的操作 T。所述的菜单项分为两部分,第一部分为需要在液晶屏幕中显示的内容, 第二部分是对该菜单项的操作。所述的菜单项的显示内容为文本形式,如 要显示 字符,使用~ 。所述的菜单项的内容可以在液晶屏山多行显示, 但是在反白选择所述的菜单项内容时只反白选择所述的菜单项内容的第 一行。对该菜单项的操作是指所述的菜单项对不同的按键的响应和所述的 菜单项在液晶屏幕显示时的格式控制。所述的菜单项的操作的数据格式 是B + KMCabcd + KSCabcd,每一个字母代表一个字符数据。所述的数 据格式的第一位B默认为反白控制,B为字符'0',表示所述的菜单项不用反白,B为字符'r,表示所述的菜单项第一行反白。所述的数据格式的第二项KMCabcd,表示当按相应操作键时进入下一级菜单的操作。字 符K表示操作键的编号,只有对应键才能激活所述的操作,abcd是十进制数字,为进入的下一级菜单的数据包的编号。所述的数据格式的第三项 KSCabcd,表示当按相应操作键时进入下一级脚本的操作。字符K表示操 作键的编号,只有对应键才能激活所述的操作,abcd是十进制数字,为进 入的下一级脚本的数据包的编号,C是脚本操作控制选项,当C为字符'0',不启动下一级脚本的字幕显示;当c为字符'r,启动下一级脚本的字幕显示。所述的数据格式的第二项和第三项可以根据按键有多项或没有。对 于所述的每一个菜单,可以上翻选中并显示所述菜单的上一个菜单项,下 翻选中并显示所述菜单的下一个菜单项,后退到上一级菜单和进入到下一 级操作,所述的下一级的操作可以是菜单或者脚本。所述的脚本是一系列的操作命令,本实施例的操作命令的结构如图3 中的脚本0001所示所述的操作命令由命令关键字(含标记字和控制字) 和命令参数构成,所述的命令关键字标识所述的操作的类型。所述的操作 的类型包括放音、录音、简单评分、复杂评分、暂停、延时等。评分机制
分为简单评分和复杂评分,所述的简单评分仅仅给出发音质量的评价,所 述的复杂评分可以根据上一次的发音质量评价结果给出不同的反馈,进入不同的后续流程。所述的操作命令采取固定长度结构,长度是固定长度16 字节或者其倍数,所述的命令关键字的控制字占一个字节,标识操作的类 型。所述的标记字有两个控制功能l.标记包括所述标记字以下的16个字 节是一项新的操作命令或者是上一项操作命令的延续;2.标记操作命令是 否是快进点,快进点指在解释脚本并运行操作命令对应的操作时按快进键 或快退键时可以调用解释的操作命令的起点。标志字只能取三种值,标记 字为0X00,表示以下16字节是上一脚本命令的延续,标记字为0XF0表 示新的脚本命令开始,但不是快进点,标记字为0XFF表示新的脚本命令 开始,也是快进点。命令参数与操作类型相关,例如标准发音的数据包的 编号,字幕的编号等信息。本实施例中对学习者发音评价用脚本实现,脚本结构包括三个操作命 令,第一步播放标准音并显示字幕,第二步学习者跟读所述的标准音并录 音,第三步给出所述的跟读的评价。本实施例的互动式课堂学习用脚本实 现,本发明一较佳实施例的课堂教学实例的脚本结构图如图4所示,由所述的放音、录音、暂停、延时、简单评分、复杂评分等操作命令按一定方 式组合实现。本实施例的课件按所述的菜单和脚本的方式编排后,需要保存的数据 内容包括菜单、脚本、标准发音、标准发音的字幕、标准发音的网络,预 先训练好的标准发音模型共六类数据。课件保存的数据分为索引头和具体 的数据项两部分。所述的数据类中的每一项都是一个数据包(例如所述的 课件结构中处于不同层次的菜单),将所述的数据类的数据包分别独立从 零开始顺序编号,相同编号的数据包再合成一个数据项,所述的数据包的 前后排列顺序是固定的,所述的数据项按编号从小到大顺序保存形成所述 课件的数据内容。本发明一较佳实施例的课件索引头结构图如图5所示。 本实施例的索引头的每一条索引项长度固定,所述的索引项对应编号相同 的数据项,依次记录了所述的数据项中数据包的相对偏移地址和所述数据 包的长度。
当然,本发明还可有其他实施例,在不背离本发明精神及其实质的情 况下,所属技术领域的技术人员当可根据本发明作出各种相应的改变和变 形,但这些相应的改变和变形都应属于本发明的权利要求的保护范围。
权利要求
1. 一种具有发音质量评价的嵌入式语言教学机,包括硬件平台和软件 系统;其特征在于其硬件平台包括电池和电源模块、语音处理芯片、闪烁存储器、多媒 体数字信号编解码芯片、液晶显示屏、键盘、麦克、语音功率放大芯片、喇叭和耳机插座、通用串行总线接口芯片;其中上述电池和电源模块为上 述的硬件平台提供电源;上述语音处理芯片与上述麦克相连,学习者的语 音信号通过上述麦克传送给上述语音处理芯片,上述语音处理芯片对上述 语音信号至少进行压缩、评价处理;上述语音处理芯片与上述闪烁存储器 相连,完成程序的加载和数据的存储;上述语音处理芯片与上述键盘相连, 接受上述键盘的按键消息;上述语音处理芯片与上述液晶显示屏相连,控 制显示屏的刷新显示;上述语音处理芯片与上述多媒体数字信号编解码芯 片相连,上述语音处理芯片传输数字音频信号到上述多媒体数字信号编解 码芯片,上述多媒体数字信号编解码芯片输出模拟音频信号,上述模拟音 频信号经上述语音功率放大芯片放大通过上述喇叭输出声音,上述模拟音 频信号也可通过上述耳机插座直接外接耳机输出声音;上述语音处理芯片 与上述通用串行总线接口芯片相连,实现与计算机的通讯;其软件系统包括系统程序、算法程序和应用程序,在上述的语音处理 芯片上运行;其中系统程序是准实时的操作系统,配置和驱动上述其他器 件,实现上述的语音处理芯片与外围器件的通信,调用算法程序和应用程 序,控制系统的流程;上述算法程序完成语音的编译解码、学习者发音质 量评价的算法;上述应用程序是开放式软件平台,解释具体的学习课件。
2. 根据权利要求1所述的具有发音质量评价的嵌入式教学机,其特征 在于(1)上述语音处理芯片为微控制器和数字信号处理,上述微控制器 控制外围器件,上述数字信号处理运行语音的编解码程序和发音质量评价 算法程序;(2) 上述语音处理芯片与上述闪烁存储器之间有双向数据、地址和 控制信号线的连接,上述语音处理芯片向上述闪烁存储器读写程序与数据 内容,完成程序的加载和数据的存储;(3) 上述语音处理芯片与上述键盘有控制信号和数据线连接;(4) 上述语音处理芯片与上述液晶显示屏有双向数据、地址和控制 信号线的连接,上述语音处理芯片从上述液晶显示屏读出当前显示的数 据,上述语音处理芯片向液晶显示屏写入需在上述液晶显示屏重新显示的 数据;(5) 上述语音处理芯片与上述多媒体数字信号编解码芯片有控制信 号线和数据线的连接;上述语音处理芯片输出数字音频数据到所述的多媒 体数字信号编解码芯片;(6) 上述语音处理芯片与上述通用串行总线接口芯片有控制信号线 和双向数据的连接。
3.根据权利要求1或2所述的具有发音质量评价的嵌入式教学机,其特征在于上述算法程序的具体程序模块包括学习内容音频数据的播放、录音、录音回放、语速调节以及发音质量评价;其中(1) 学习内容音频数据的播放模块中,釆用低码率和高音质的音频编码方法压缩编码后的压缩语音先解码成数字语音,再经过D/A变换得到 可供播放的模拟语音;(2) 录音模块中,模拟语音信号经过A/D变换,得到数字语音并进 行分帧,进行实时的端点检测和音量检测,对上述分帧语音进行低码率压 缩编码得到压缩语音,并提取用于发音质量评价的语音特征;(3) 录音回放模块中,对(2)所述的压缩编码后的压缩语音进行解 码得到数字语音,上述数字语音经过D/A变换,得到可供播放的模拟语音;(4) 语速调节模块中,对(1)和(3)所述的解码后的数字语音进 行时域压扩,得到语速改变后的数字语音,语速改变后的数字语音经过D/A变换,得到可供播放的模拟语音;(5)发音质量评价模块中,利用(2)中所述的用于发音质量评价的 语音特征、预先训练好的标准发音模型和预先生成的标准发音网络进行发 音质量评价,得到发音质量的评分结果。
4. 根据权利要求3所述的具有发音质量评价的嵌入式教学机,其特征 在于上述应用程序是一个解释具体学习i果件的开放式软件平台,学习内 容先在个人计算机上组织并编译成一个课件文件,课件需要组织的内容包 括学习文本、标准发音、标准发音的字幕、为进行发音质量评价所需的标 准发音的网络和预先训练好的标准发音模型;通过课件设计后的课件文件 通过通用串行总线接口下载到嵌入式设备,上述应用程序解释上述课件文 件,控制学习流程,至少实现单词学习、语句学习、课堂学习、语言练习、 口语测试和发音质量评价。
5. 根据权利要求4所述的具有发音质量评价的嵌入式教学机,其特征 在于,上述i果件设计包括i果件编排和课件保存两个方面,上述课件编排是 指按照数据结构实现学习的流程框架和学习功能,上述课件保存是指上述 学习内容通过上述课件编排形成的数据包的保存和索引査询。
6. 根据权利要求5所述的具有发音质量评价的嵌入式教学机,其特征 在于,上述i果件文件内容釆取菜单和脚本的方式编排,每一级菜单或脚本 编制成一个独立的数据包并被分别独立编号,多个菜单和脚本形成一个分叉树结构,脚本必须处于分叉树结构的末端;学习文本通过处于所述分叉树结构中不同层次的菜单显示,单个菜单中包含多个菜单项,菜单项又包括需显示的内容和对该菜单项的操作两部分;对于每一个菜单,可以上翻 选择并显示菜单的上一个菜单项,下翻选择并显示菜单的下一个菜单项, 后退到上一级菜单和进入到下一级操作,下一级的操作是菜单或者脚本。
7. 根据权利要求6所述的具有发音质量评价的嵌入式教学机,其特征 在于,上述脚本由操作命令顺序构成,上述操作命令由命令关键字和命令 参数构成,上述命令关键字标识操作类型;上述操作命令的长度固定为某 字节数或其倍数;上述操作类型至少包括放音、录音、简单评分、复杂评分、暂停、延时;评分机制分为简单评分和复杂评分,上述简单评分仅仅 给出发音质量的评价,上述复杂评分根据上一次的发音质量评价结果给出 不同的反馈,进入不同的后续流程;上述发音质量i平^^用脚本实现,该脚 本结构包括三个操作命令,第一步播放标准音并显示字幕,第二步学习者 跟读标准音并录音,第三步给出跟读的评价;上述互动式课堂学习也用脚 本实现,至少由放音、录音、暂停、延时、简单评分、复杂评分操作命令 组合实现;在放音和录音操作时,液晶屏幕会有同步的字幕显示;上述菜 单实现学习内容的层次结构,上述脚本实现学习的顺序过程。
8.根据权利要求7所述的具有发音质量评价的嵌入式教学机,其特征 在于,上述课件按菜单和脚本的方式编排后,需要保存的数据内容包括菜 单、脚本、标准发音、标准发音的字幕、标准发音的网络,预先训练好的 标准发音模型共六类数据;上述数据类中的每一项都是一个数据包,将数 据类的数据包分别独立从零开始顺序编号,相同编号的数据包再合成一个 数据项;上述课件保存分为索引头和具体的数据项两部分,索引头的每一 条索引项长度固定,索引项对应编号相同的数据项,依次记录数据项中数 据包的相对偏移地址和数据包的长度;数据项按编号从小到大顺序保存。
全文摘要
具有发音质量评价的嵌入式语言教学机,其包括硬件平台和软件系统。软件系统包括系统程序、算法程序和应用程序,在所述硬件平台的语音处理芯片上运行。所述算法程序包括语音的编解码程序和发音质量评价算法程序,具体的程序模块包括学习内容音频数据的播放、录音、录音回放、语速调节以及发音质量评价。本发明的有发音质量评价的嵌入式语言教学机,解决了现有学习机的缺陷,不但可以实现现有学习机的单词和语句学习、阅读、练习和测试等功能,而且融入了对学习者发音质量进行评价的功能和互动式的教学思想。
文档编号G09B5/00GK101145283SQ20061012721
公开日2008年3月19日 申请日期2006年9月12日 优先权日2006年9月12日
发明者丁玉国, 刘润生, 梁维谦, 明 董 申请人:董 明;梁维谦;丁玉国;刘润生
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1