专利名称:影音编码方法与多媒体储存装置的制作方法
技术领域:
本发明是有关于一种影音处理技术,且特别是有关于一种影音档案的编 码技术。
背景技术:
随着多媒体技术的发展,目前已有多种的影音格式,例如asf、 mpg、 wmv 或声视频信号交错格式(以下简称AVI)等等。并且,在计算机中观赏电影与节 目也变为非常的普遍。以计算机的Window操作系统而言,本身具备有各种 的编译码(codec)程序,可以对不同格式的影音档案进行译码,因而能够播放 各种格式的影音档案。
在一般资源有限的嵌入式系统(embedded system)中,无法具备有各种的 codec,因而无法如一般计算机一样对影音档案进行译码。但是,为了能够播 放不同格式的影音档案,嵌入式系统是预先利用软件的工具,将不同格式的 影音档案转换为AVI格式的档案后,再对转换格式后的影音档案进行译码并 播放。然而,在上述嵌入式系统的做法中,由于嵌入式系统必须要储存转文 件后的AVI影音档案,而此时的AVI影音档案需要大量的存储器来储存,因 而需要在硬件的配置上,花费庞大的存储器。
另外,由于转档后的AVI影音档案包含有多个影像(video)大块(chimk)与 音频信号(audio)大块,而此影像大块内包含有多个帧(fmme)的影像数据,并且, 嵌入式系统必须要对整个影像大块与音频大块进行处理后才能够播放。因此, 在硬件条件有限的情况下,嵌入式系统的处理速度未必能够快速地处理整个 影像大块与音频大块,因而造成播放影音档案出现延迟的状况。
发明内容
本发明提供一种影音编码方法,将影音档案内的影像大块与音频大块切 割为较小的区块,以减少存储器使用量。
本发明提供一种多媒体储存装置,用以储存影音档案,并可增加视频信 号处理的速度。
本发明提出一种影音编码方法,此方法包括提供一影音档案;读取影
音档案的影像大块以及其对应的音频信号大块;将影像大块分割为多个影像 区块;将音频大块分割为多个音频信号区块;读取影音档案的一声音取样频 率以及一帧速率;计算一音频配置参数,其中,音频配置参数为声音取样频 率除以帧速率;根据音频区块的一额定值以及音频配置参数,决定每两个影 像区块之间所配置的音频区块的一特定数目;以及依照播放顺序,在每两个 影像区块之间配置特定数目的所述的音频信号区块。
本发明提出一种多媒体储存装置,用以储存一影音档案,影音档案包括 有多个影像区块、多个音频信号区块、 一标头与多个索引。其中,影音档案 中的标头记录其内的影像区块与音频区块的设定数据,而多个索引分别指向 其内的影像区块与音频区块的地址。另外,每两个影像区块之间包括上述音 频信号区块其中之一,每一所述的影像区块所包含的帧数目相同,每个音频 信号区块所储存的音频信号实质上等效于其储存在前的影像区块所对应的音 频数据。
本发明因采用影音编码方法,使得影音档案内的影像大块与音频大块被 分割为多个小区块,以让后端电路能够减少存储器使用量,并增加视频信号 处理的速度。
图1绘示为本发明实施例的影音编码方法的步骤流程图。 图2(a)绘示为原本的影音档案的结构示意图。图。
图3绘示为本发明实施例的影音编码模块的方块图。 图4绘示为步骤S150的各子步骤流程图。 附图标号-
S110 S150:本发明实施例的影音编码方法的各步骤 V1 V3:影像区块 A1 A3:音频信号区块
300:影音编码模块310:分离器
315:影像解压縮单元320:音频解压縮单元
325:影像呈现单元330:音频呈现单元
335:影像调整单元340:音频调整单元
345:影像压縮单元350:音频压縮单元
355:影音混合单元360:写入单元
365:后级处理S410' S495:步骤S150
具体实施例方式
为让本发明的上述特征和优点能更明显易懂,下文特举较佳实施例,并 配合附图,作详细说明如下。
为了方便说明本实施例,在说明本实施例之前,先进行几项假设,首先,
假设影音编码方法应用于一多媒体装置,并假设多媒体装置能够播放AVI格 式的影音档案。图1绘示为本发明实施例的影音编码方法的步骤流程图。
请参考图l,首先,提供一影音档案(步骤S110),此影音档案可以是多媒 体装置接收的档案,也可以是经过转档后的影音档案。而此影音档案在本实 施例中例如为一个AVI影音档案。接着,多媒体装置读取影音档案的影像大 块以及其对应的音频信号大块(步骤S120)。以目前的AVI档案为例,其为一 种将影像与音频切割成多大块(chunk),且交错(interleave)传输影像大块与音频 大块的文件格式,在此上述的影音档案可以泛称交错传输的数据块为多任务媒体数据(multiplexed media data)。
接下来,多媒体装置将影像大块分割为多个影像区块(步骤S130),其中, 每个所分割的影像区块的大小至少为一单位帧大小。为了方便说明本实施例, 假设以每个帧作为上述影像区块,换句话说,步骤S130例如以每个帧的数据 大小来分割影像大块。在分割完影像大块之后,接着,多媒体装置将音频大 块分割为多个音频信号区块(步骤S140)。最后,依照播放顺序,在每两个影 像区块之间配置特定数目的音频区块(步骤S150)。在本实施例中,影像区块 例如为一帧,而两个影像区块之间所配置的特定数目的音频信号区块例如为 对应该影像区块配的声音数据大小。
由上述的编码方法的步骤可知,原本的AVI格式的影音档案中的影像大 块与音频大块被分割为多个较小的区块。以图2(a)与图2(b)分别绘示原本的影 音档案与分割后的影音档案。请参考图2(a),原本的AVI格式的影音档案的 结构包括标头(header)、影像大块、音频大块与索引。其中,标头中已记录影 像大块与音频大块的设定数据,例如影像大块内的帧数、帧速率(framerate)、 影像的比特率(bitrate)、音频信号的声音取样率以及声音为立体声(stereo)或单 音(mono)等等。而影像大块内包含多个帧数据,音频大块内为对应影像大块 的声音信号。图2(a)中的索引用以指向影像大块与音频大块在多媒体装置中的 地址。
请继续参考图2(b),经过上述实施例的编码方法处理后的影音档案结构 包括标头、多个影像区块V1 V3、多个音频信号区块A1 A3与索引。其中, 标头如图2(a)例如为记录影像区块Vl V3与音频信号区块Al A3的设定数 据。而多个影像区块V1 V3例如为影像大块以一帧大小所分割出的多个小 区块。多个音频区块A1 A3为音频信号大块所分割出的多个小区块,而每 个音频信号区块A1 A3的数据例如为对应前面影像区块V1 V3的音频数 据。例如音频区块A1为对应影像区块V1的音频数据。而图2(b)中的索引例 如用以指向影像区块V1 V3与音频信号区块A1 A3在多媒体装置中的地址。
由上述的图2(b)可知,上述的影音档案的结构主要是将原本的影像大块 与音频大块分割为多个小区块,并没有改变原本影音档案的格式。也就是说,
经过上述实施例的影音编码的影音档案仍然可以符合AVI格式。因此,本实
施例并不会增加多的硬件来对经过影音编码的影音档案进行多余的处理。并
且,在多媒体装置播放图2(b)的影音档案时,可使用较小的存储器来储存部 分的影像区块与音频区块,在对所储存的影像区块与音频区块进行视频信号 处理后就可以直接播放。举例来说,多媒体装置可以先储存影像区块V1与音 频信号区块A1,再对影像区块V1与音频信号区块A1进行处理。接着,储 存影像区块V2与音频信号区块A2,再对影像区块V2与音频信号区块A2进 行处理。因此,本实施例的影音编码方法能够使得多媒体装置不在需要储存 整个影像大块与音频大块,因而能够减少存储器的需求量。另外,由于每次 多媒体装置只需处理少量的影像区块与音频区块,又可以使得处理速度较慢 的多媒体装置也能够平顺的播放影音档案。
由于目前的多媒体装置都被要求能够播放各种格式的影音档案,因此, 为了让本领域具通常知识者能够通过本实施例,具体实施本发明,以下提出 另一装置实施例。图3绘示为本发明实施例的影音编码模块的方块图。请参 考图3,首先,影音编码模块300接收一个影音档案S,此影音档案S的格式 可以是asf、 mpg、 wmv或AVI等等。而分离器(splitter)310接收影音档案S, 将影音档案S的影像数据Sv与音频数据Sa分寓,并皆分别输出至影像解压 縮单元315与音频解压縮单元320。接着,影像数据Sv将依序被影像解压縮 单元315解压縮为原始影像数据,再经由影像呈现单元(video render)325重新 利用视频信号技术处理原始影像数据之后,影像调整单元335将再对影像呈 现单元325所输出的数据进行调整,其中,调整的手段可以是抽取出每秒钟 内的数张帧、利用放大或縮小尺寸来调整影像数据的大小以及调整影像数据 的编码质量。影像调整单元335调整影像数据后,影像压縮单元345将对影像进行编码后输出至影音混合单元355。
音频数据SA的处理方式类似于影像数据Sv,故在此不再详加赘述。音频
数据Sa与影像数据Sv的处理方式不同的地方在于,音频调整单元340可以调 整音频数据的取样率以及音频数据为立体声或单音。接下来,影音混合单元 355将接收经过影像压縮单元345与音频压縮单元350编码的影像与音频数 据,并将影像与音频数据混合后输出至写入单元360。而写入单元360将影音 混合单元355所输出的数据写入一影音格式。本实施例影音编码模块300主 要是将不同格式的影音档案转变为多媒体装置可以播放的档案。而在本实施 例中,假设多媒体装置可以播放的影音文件格式为AVI2.0格式。因此,上述 的影像压縮单元345与音频压縮单元350例如是将数据压縮为符合AVI 2.0格 式的数据,而写入单元360例如是将数据写入AVI 2.0的档案结构。
写入单元360输出的影音档案例如为AVI 2.0的影音档案。而此影音档案 例如包括一影像大块与一音频大块,如上述图2(a)所示。而本实施例中的后级 处理单元365可利用上述图1实施例所提出的影音编码方法,将写入单元360 输出的影音档案重新编码后,输出一个符合AVI格式的影音档案,在此后级 处理的方式相同于上述图1的实施例,故不再详加赘述。
由上述实施例可知,多媒体装置可以利用已开发的应用软件(例如DirectX 9.0),先将不同格式的影音档案转为AVI格式的影音档案后,再利用本实施 例所提出的影音编码方法(也就是图3中的后级处理单元365),将AVI格式 的影音档案重新编码后再输出给后端的电路,因而能够降低存储器的使用量 又能加快处理速度。
以下将说明上述实施例中,音频区块如何配置于影像区块之间,使得影 像与声音能够平顺地播放,如图4的步骤流程所示。图4绘示为步骤S150的 各子步骤流程图。请参考图4,首先,读取影音档案中的标头所记录的声音取 样率与帧速率(步骤S410),在此为了方便说明本实施例,以下将帧速率表示 为fr。接下来,计算一音频配置参数(步骤S420),表示为L,以及计算一音频信号余数(步骤S425),此音频信号余数表示为r,其中,音频配置参数L为声音取样率除以帧速率的商数,而音频信号余数r为声音取样率除以帧速率的余数。在本实施例中,假设音频信号区块的取样率为llkHz,也就是11025取样/秒(sample/second)。帧速率fr假设为10张/秒。而音频配置参数L=l 1025/10=1102,并产生音频信号余数F5。而此音频配置参数L表示每一张帧数据应配置的音频取样个数,但是,若每1秒钟内的11025个音频信号取样个数搭配10个帧,仍将剩余F5个音频信号取样个数。以下为了方面说明本实施例,以n表示时间(秒)索弓l(index),其中,n=0,l,2,...。以下假设此时处理第1秒钟的音频信号取样,也就是说,此时,n=0。
接下来,计算音频信号区块的额定值(步骤S430),此额定值表示为一音频信号区块内所包含的取样数,并表示为K。在本实施例中,为了符合微软所制定的AVI格式,此音频信号区块的额定值有固定的计算方式。在微软的规范下,每个音频区块包含的字节数(以下表示为B)可为256或512等等。若音频信号为立体声,贝lJ额定值K气B/2-4"+l。若音频信号为单音,则额定值K=(B-4)*2+l。以下假设音频为单音,每个音频区块包含的字节数B:256,则依据上述的计算方式,额定值K:505。
接下来,计算音频配置参数L除以额定值K,以得到一商数(表示为M)与一第一余数(表示为N)(步骤S440)。经由以上的假设可知,L/K=1102/505可得M=2, N=92。此商数M=2,表示每个影像区块需要搭配M=2个音频信号区块,但是还剩余N:92个音频信号的取样值。接着,将R、 A与O的初始值设为O(步骤S445),在此参数R、 A与O将会在本实施例以下的内容中定义与描述其物理意义。
在步骤S445之后,已计算出L、 K、 M与N,接着,便可以开始在影像区块后插入音频信号区块。由上述的参数M可知,在第i影像区块以及第i+l影像区块之间插入M=2个音频信号区块(步骤S450)。其中,i为一正整数,且i的初始值为1。换句话说,此时i=l,而在第1影像区块与第2影像区块之间,已插入2个音频信号区块。
但是,步骤S450中并未处理上述的音频信号余数r与第一余数N,因此,以下的步骤S455 S475,将用以处理余数。以下先考虑音频信号余数r。在步骤S450之后,判断i是否等于f产n+l(步骤S455)。此时,由于1=1, n=0,因此,步骤S450将断出i等于10*0+1,也就是说,步骤S455的判断为是,接着,便将音频信号余数r累加至一总余数(步骤S460),总余数表示为R。换句话说,步骤S460以数学式可表示为R=R+r。由于在上述步骤S445已将R设为O,因此,在执行完步骤S460之后,总余数11=5,并进入步骤S465。
在此由于帧速率&=10,也就是说,当每10个帧后,时间将经过一秒钟,使n值加1。若不忽略每一秒钟的音频信号余数的状况下,当时间经过一秒时,也就是,i=l,ll,21,31,...,fr*n+l时,将会产生一音频信号余数r。因此,当步骤S455的判断为是,将音频信号余数r加入总余数R,以让本实施例之后的步骤来处理总余数R。反之,若步骤S455中判断为否时,将直接进入步骤S465。
接着,步骤S465:将判断0+(i-A^N+R是否大于或等于额定值K。此时,由于此时0=0, i=l, A=0, N=92, R=5,因此,步骤S465的判断为否,将直接进入步骤S480,使i^+l,回到步骤S450,此时,i=2,也就是在第2影像区块与第3影像区块之间,插入M-2个音频信号区块。接着,由于步骤S455与S465皆判断为否,因此,将进入步骤S480,使i^+l。由于—3,4,5时,步骤皆与1=2时相同,故不再详加赘述。
然而,当i=l,2,3,4,5时,上述并未处理第一余数N,因此,在每个影像区块之间配置M个音频区块之后,会产生第一余数N=92。换句话说,若考虑第一余数N与总余数R时,在第i个影像区块与第i+l影像区块之间,产生的累积余数为PN+R。因此,接下来便开始处理累积余数i*N+R,当1=6时,步骤S465将判断出O+(i-A)*N+R=0+(6-0)*92+5=557大于额定值K=505,也就是当步骤S465判断为是,并且,累积余数已大于一个音频信号区块的大小,因此,将在第i影像区块与第i+l影像区块之间插入M+l个音频信号区块(步骤S470),以补偿部份的余数。也就是说,此时,第6影像区块与第7影像区 块之间插入3个音频信号区块。
然而,在经过步骤S470所进行的余数补偿后,仍有剩余的余数。因此, 接着,记录一余数补偿位置A=i,并且,记录一第二余数O(也就是补偿后剩 余的余数),而0=0+(i-A)*N+R-K,同时,将总余数R设为0(步骤S475)。接 下来,将进入步骤S480:使i-i+l。以此类推,由上述的步骤S410 S480可 以得到所有影像区块之间所配置的音频区块。
综上所述,本发明因采用影音编码方法,使得影音档案内的影像大块与 音频大块被分割为多个小区块,并能够兼容于目前的视频信号格式,还可以 让后端电路使用较少量的存储器,并增加视频信号处理的速度。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何 所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作 些许的更动与润饰,因此本发明的保护范围当视权利要求所界定者为准。
权利要求
1. 一种影音编码方法,其特征在于,此方法包括提供一影音档案;读取所述的影音档案的一影像大块以及其对应的一音频信号大块;将所述的影像大块分割为多个影像区块,每一所述的影像区块的大小至少为一单位帧大小;将所述的音频大块分割为多个音频信号区块;读取所述的影音档案的一声音取样频率;读取所述的影音档案的一帧速率;计算一音频配置参数,其中,所述的音频配置参数为所述的声音取样频率除以所述的帧速率;根据所述的音频信号区块的一额定值以及所述的音频配置参数,决定每两个影像区块之间所配置的所述的音频区块的一特定数目;以及依照播放顺序,在每两个影像区块之间配置所述的特定数目的所述的音频信号区块。
2. 如权利要求1所述的影音编码方法,其特征在于,将所述的影音大块分 割为多个影音区块,包括将所述的影像大块中,以每一个帧作为上述影像区块。
3. 如权利要求2所述的影音编码方法,其特征在于,根据所述的音频信 号区块的所述的额定值以及所述的音频配置参数,决定每两个影像区块之间 所配置的所述的音频区块的所述的特定数目,包括a. 定义所述的额定值为K,所述的音频配置参数L;b. 计算L除以K,以得到一商数M以及一第一余数N;C.将一余数补偿位置与一第二余数设定为0;d.在第i影音区块以及第i+l影音区块插入M个音频信号区块,并计算i*N;e. 判断0+(i-A^N是否大于等于K,若判断为是,在第i影音区块以及第 i+l影音区块插入M+l个音频区块,记录所述的第二余数0=0+(i-A)*N-K, 并记录所述的余数补偿位置A—,进入步骤f.,若判断为否,进入步骤f.;以 及f. 累加l至i,回到步骤d.。
4. 如权利要求1所述的影音编码方法,其中所述的影音档案的格式为微软 AVI 2.0格式或AVI 1.1格式。
5. —种多媒体储存装置,用以储存一影音档案,该影音档案包括有多个影 像区块以及多个音频区块,其特征在于,该多媒体储存装置包括每两个影像区块之间包括上述音频信号区块其中之一,每一所述的影像 区块所包含的帧数目相同,每一所述的音频信号区块所储存的音频信号实质 上等效于其储存在前的影像区块所对应的音频数据,其中,所述的影音档案还包括一标头,用以记录所述的影像区块与所述的音频区块的设定数据;以及 多个索引,分别用以指向所述的影像区块与所述的音频信号区块。
6. 如权利要求5所述的多媒体储存装置,其特征在于,以每一个帧作为上 述影像区块。
7. 如权利要求5所述的多媒体储存装置,其特征在于,所述的影音档案的 格式为微软AVI 2.0格式或AVI 1.1格式。
全文摘要
本发明关于一种影音编码方法与多媒体储存装置。此影音编码方法先读取一影音档案的影像大块以及其对应的音频信号大块。再将影像大块分割为多个影像区块,而每个影像区块的大小至少为一单位帧大小。接着,将音频大块分割为多个音频信号区块。最后,依照播放顺序,在每两个影像区块之间配置至少一个音频区块。
文档编号G11B20/10GK101483052SQ20081000206
公开日2009年7月15日 申请日期2008年1月9日 优先权日2008年1月9日
发明者刘曙辉 申请人:华邦电子股份有限公司