一种根据图像生成音频文件的方法及装置制造方法

文档序号：6764641阅读：718来源：国知局

一种根据图像生成音频文件的方法及装置制造方法
【专利摘要】本发明公开了一种根据图像生成音频文件的方法，涉及电子【技术领域】，可以通过音频表现图像，使得用户体验更多元化。本发明的方法包括：获取亮度色度图像；其中所述图像包含每个像素的三个因子值；根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长；记录所述图像中每个所述像素所对应的音调和音长，生成音频文件。本发明的实施例主要用于根据图像生成音频文件的过程中。
【专利说明】一种根据图像生成音频文件的方法及装置
【技术领域】
[0001 ] 本发明涉及电子【技术领域】，尤其涉及一种根据图像生成音频文件的方法及装置。【背景技术】
[0002]多媒体电子产品给人们的生活和工作带来了许多不同体验，例如可以通过电子产品欣赏照片、视频和音频。
[0003]照片和视频等图像数据是通过每个像素的因子值进行表示的，例如可以是红色绿色黑色(Red Green Black，RGB)图像，也可以是亮度色度(YUV)图像。以YUV格式的图像为例，对于图像中的每个一个像素都用Y值、U值和V值表示。其中，Y代表像素的亮度，U和V代表像素的色度。显示设备可以将每个像素的Y值、U值和V值将图像显示。
[0004]但是，即使将图像显示，用户也仅能通过视觉欣赏图像，带来的用户体验较为单一。

【发明内容】

[0005]本发明的实施例提供一种根据图像生成音频文件的方法及装置，可以通过音频表现图像，使得用户体验更多元化。
[0006]为达到上述目的，本发明的实施例采用如下技术方案:
[0007]本发明的一方面，提供一种根据图像生成音频文件的方法，包括:
[0008]获取亮度色度图像；其中所述图像包含每个像素的三个因子值；
[0009]根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长;
[0010]记录所述图像中每个所述像素所对应的音调和音长，生成音频文件。
[0011]结合本发明的第一方面，在一种可能的实现方式中，所述图像为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。
[0012]结合本发明的第一方面，在一种可能的实现方式中，所述图像为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。
[0013]结合本发明的第一方面，在一种可能的实现方式中，所述获取图像，包括:
[0014]获取一个图片文件作为所述图像；
[0015]或，从视频文件中获取一帧图像作为所述图像。
[0016]结合本发明的第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长，包括:
[0017]根据所述像素的第一因子值确定所述像素所对应的音调；
[0018]根据所述像素的第二因子值确定所述像素所对应的音长。
[0019]结合本发明的第一方面和上述可能的实现方式，在另一种可能的实现方式中，在根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长之后，所述方法还包括:
[0020]根据所述图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
[0021]结合本发明的第一方面和上述可能的实现方式，在另一种可能的实现方式中，在获取图像之后，所述方法还包括:
[0022]将所述图像中的所述像素按照三个因子值的取值区间进行分类；
[0023]其中，所述根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长，具体包括:分别对每个分类计算所述分类中各像素所对应的音调和音长；
[0024]所述记录所述图像中每个所述像素所对应的音调和音长，具体包括:以每个分类作为一个声部，记录每个分类中各像素所对应的音调和音长，生成音频文件。
[0025]本发明的第二方面，提供一种根据图像生成音频文件的装置，包括:
[0026]获取单元，用于获取图像；其中所述图像包含每个像素的三个因子值；
[0027]计算单元，用于根据所述获取单元获取的图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长；
[0028]生成单元，用于记录所述计算单元计算的所述图像中每个所述像素所对应的音调和音长，生成音频文件。
[0029]结合本发明的第二方面，在一种可能的实现方式中，所述图像为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。
[0030]结合本发明的第二方面，在一种可能的实现方式中，所述图像为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。
[0031]结合本发明的第二方面，在一种可能的实现方式中，所述获取单元，还用于:
[0032]获取一个图片文件作为所述图像；
[0033]或，从视频文件中获取一帧图像作为所述图像。
[0034]结合本发明的第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述计算单元，包括:
[0035]音调子单元，用于根据所述获取单元获取的像素的第一因子值确定所述像素所对应的音调；
[0036]音长子单元，用于根据所述获取单元获取的像素的第二因子值确定所述像素所对应的音长。
[0037]结合本发明的第二方面和上述可能的实现方式，在另一种可能的实现方式中，该装置还包括:
[0038]速度单元，用于在所述计算单元根据所述图像中所述像素的任意两个因子值，确定所述像素所对应的音调和音长之后，根据所述获取单元获取的图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
[0039]结合本发明的第二方面和上述可能的实现方式，在另一种可能的实现方式中，该装置还包括:
[0040]分类单元，用于将所述图像中的所述像素按照三个因子值的取值区间进行分类；
[0041]其中，所述计算单元具体用于:分别对每个分类计算所述分类中各像素所对应的音调和音长；
[0042]所述记录单元具体用于:以每个分类作为一个声部，记录每个分类中各像素所对应的音调和音长，生成音频文件。
[0043]本发明实施例提供的根据图像生成音频文件的方法及装置，获取图像，根据所述图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
【专利附图】

【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0045]图1为本发明实施例1中的一种根据图像生成音频文件的方法流程图；
[0046]图2为本发明实施例2中的一种根据YUV图像生成音频文件的方法流程图；
[0047]图3为本发明实施例3中的一种根据YUV图像生成音频文件的方法流程图；
[0048]图4为本发明实施例4中的一种根据RGB图像生成音频文件的方法流程图；
[0049]图5为本发明实施例5中的一种根据图像生成音频文件的装置组成示意图。
【具体实施方式】
[0050]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0051]实施例1
[0052]本发明实施例提供一种根据图像生成音频文件的方法，如图1所示，该方法可以包括:
[0053]101、获取图像；其中所述图像包含每个像素的三个因子值。
[0054]其中，所述图像可以为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。或者，所述图像还可以为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。所述获取图像，包括:获取一个图片文件作为所述图像；或，从视频文件中获取一帧图像作为所述图像。通过本发明实施例的方法可以将单一的图片转换成音频文件，也可以将由多帧图像组成的视频转换成音频文件。
[0055]102、根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长。
[0056]其中，所述根据所述图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，包括:根据所述像素的第一因子值确定所述像素所对应的音调；根据所述像素的第二因子值确定所述像素所对应的音长。
[0057]进一步的，在计算得到每个像素所对应的音调和音长之后，还可以根据所述图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
[0058]103、记录所述图像中每个所述像素所对应的音调和音长，生成音频文件。[0059]进一步的，为了提高音频效果，还可以在计算音调和音长之前，先对像素进行分类，从而生成多声部的音频文件。具体的，可以将所述图像中的各像素按照三个因子值的取值区间进行分类；其中，所述根据所述图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，具体包括:根据所述像素的任意两个因子值，对每一个分类分别该分类中的各像素所对应的音调和音长；所述记录所述图像中每个所述像素所对应的音调和音长，具体包括:以每个分类作为一个声部，记录每个分类中每个所述像素所对应的音调和音长,生成音频文件。
[0060]本发明实施例提供的根据图像生成音频文件的方法，获取图像，根据所述图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
[0061]需要指出的是，使用YUV的方式，采样频率要求较低，因此将YUV图像转换成音频文件的效率较高，用户体验较好。使用RGB的方式，在现有的采样频率要求较高，生成的音频在用户的体验性上较差，因此，本发明不局限于此。
[0062]实施例2
[0063]本发明实施例提供一种根据图像生成音频文件的方法，如图2所示，该方法可以包括:
[0064]201、获取亮度色度YUV图像。
[0065]其中，所述获取亮度色度YUV图像，包括:获取一个图片文件作为所述YUV图像；或，从视频文件中获取一帧图像作为所述YUV图像。通过本发明实施例的方法可以将单一的图片转换成音频文件，也可以将由多帧图像组成的视频转换成音频文件。所述YUV图像包含每个像素的三个因子值，分别为第一因子值、第二因子值和第三因子值。例如，第一因子值可以为代表亮度的Y值，第二因子值可以为U值，第三因子值可以为V值，其中U值和V值是两个色度分量。
[0066]值得说明的是，在获取YUV图像的过程中，可以在确定Y通道的因子值后采样U和V两个因子值，对采样的密度要求较低，采样得到的YUV图像数据较少，这样对YUV图像中每个像素所对应的音调和音长等的计算量也较少，因此可以提高将图像转换成音频文件的效率。尤其是当将视频文件中的连续多帧图像转换成音频文件时，可以达到较高的转换效率，提闻将图像转换成首频的效率，从而提闻用户体验。
[0067]202、根据所述像素的第一因子值确定所述像素所对应的音调。
[0068]其中，按照音调的高低通常将音调分为高音区、中音区和低音区三个音区，每个音区各包含有三个八度音符空间，其中每个音符又包含该音符的升半音、中音和降半音，因此总共可以有:3音区X 3八度X 7音符X 3音调=189个音调。
[0069]在本实施例中，可以采用动态的音调映射方式，将YUV图像中所有像素中最大的第一因子值和最小的第一因子值分别对应到189个音调的最高音调和最低音调，按照YUV图像中第一因子值的分布情况将其余像素的第一因子值也成比例的映射到最高音调和最低音调之间的音调，从而得到各个像素所对应的音调。例如，YUV图像的所有像素中亮度最高的像素的Y值为200，亮度最低的像素的Y值为20，那么便可以将20对应为最低音调，将200对应为最高音调，从而将YUV图像中的所有像素的Y值均归一化到189个音调上，得到YUV图像中各个像素所对应的音调。
[0070]可选的，也可以预设固定的映射表，预先设定第一因子值取值范围内所有取值对应的音调，从而根据YUV图像中各像素的第一因子值查询映射表得到每个像素对应的音调。例如Y的取值范围是0-255，将O对应为最低音调，将255对应为最高音调，从而将Y的取值归一化到189个音符上，实现映射关系。
[0071]203、根据所述像素的第二因子值确定所述像素所对应的音长。
[0072]其中，音频文件不仅受音调的影响，还有一个重要的影响因素就是每个音符的音长。音频演奏过程中分为11中音长，例如可以为2/4拍和3/4拍等。每个像素对应的音长不同，便体现了音频的节奏。具体的，可以将像素的第二因子值归一化到11中音长上。例如，预设固定的音长映射表，将色度U值的取值范围均匀的划分为11个取值区间，按照U值从小到大的顺序将11个取值区间分别按照最短音长到最长音长对应为11种音长。
[0073]204、根据所述YUV图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
[0074]其中，确定了每个像素对应的音调和音长后，音频的表现形式还因演奏速度不同而带来不同的演奏效果。在本实施例中可以将第三因子值对应为演奏速度。优选的，为了音频趋于一定的稳定性以适应人们的听觉习惯，可以采用变化幅度较小的V值作为第三因子值。由于整个音频文件可以仅确定一个演奏速度，因此可以去所有像素的第三因子值，取平均值得到演奏速度值。例如，演奏的速度范围设定在15到200之间，可以采用表示亮度的Y值或标识色度的V值，作为演奏速度的决定因素。计算YUV图像中所有像素的V值的平均值，将该平均值作为演奏速度。可选的，也可以将所有像素中最大的V值与最小的V值之间的差作为演奏速度。
[0075]205、记录所述YUV图像中每个所述像素所对应的音调和音长以及音频演奏速度，生成音频文件。
[0076]本发明实施例提供的根据图像生成音频文件的方法，获取YUV图像，根据所述YUV图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该YUV图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
[0077]并且，由于YUV图像要求的采样率较低，可以简化进行音调和音长等计算的计算量，从而提高将图像转换成音频文件的效率，提高转换的实时性，从而进一步提高用户体验。
[0078]实施例3
[0079]本发明实施例提供一种根据图像生成音频文件的方法，如图3所示，该方法可以包括:
[0080]301、获取亮度色度YUV图像。
[0081]其中，所述获取亮度色度饱和度YUV图像，包括:获取一幅图片作为所述YUV图像；或，从视频图像中获取一帧图像作为所述YUV图像。通过本发明实施例的方法可以将单一的图片转换成音频文件，也可以将由多帧图像组成的视频转换成音频文件。
[0082]302、将所述YUV图像中的所有像素按照三个因子值的取值区间分类。
[0083]其中，分类的方法可以为按照三个因子值的取值范围不同划分为不同分类，具体的，可以根据V值和V值确定的颜色区间，将YUV图像中的所有像素划分为黑色和白色两种分类，将黑色分类和白色分类分别作为一个声部，例如男生和女生，对两个声部分别进行音调、音长和演奏速度的计算。最后，将两个声部分别确定得到的音频合成为一个和声效果的音频文件。或者，还可以将YUV图像中的所有像素划分为红色、绿色和蓝色三个颜色空间，作为三个声部。需要说明的是，以上仅为对像素进行分类的几种举例，实际应用中还可以有其他分类方式，本发明实施例对此不做限定。
[0084]303、分别对每个分类计算所述分类中各像素所对应的音调和音长。
[0085]其中，以每一个分类作为对象，生成每个分类对应的音频其中，所述根据所述YUV图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，包括:根据所述像素的第一因子值确定所述像素所对应的音调；根据所述像素的第二因子值确定所述像素所对应的音长。
[0086]例如，在本实施例中，可以采用动态的音调映射方式，将任一分类中所有像素中最大的第一因子值和最小的第一因子值分别对应到189个音调的最高音调和最低音调，按照该分类中第一因子值的分布情况将其余像素的第一因子值也成比例的映射到最高音调和最低音调之间的音调，从而得到各个像素所对应的音调。具体的分别对每一个分类中的像素转换成音频的实现方式可以参考上述步骤202-204，本发明实施例这里不再详细赘述。
[0087]304、以每个分类作为一个声部，记录每个分类中每个所述像素所对应的音调和音长,生成音频文件。
[0088]其中，对分类得到的每一个声部，分别执行类似与步骤202-204的音频生成流程，得到多个声部的音频，最后将多个声部按照像素在YUV图像中的排列顺序合成为一个音频文件，得到多声部的音频文件。
[0089]本发明实施例提供的根据图像生成音频文件的方法，通过获取YUV图像，根据所述YUV图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该YUV图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
[0090]并且，通过将图像中的全部像素划分为多个分类，将每个分类对应一个声部，得到多声部的音频文件，使得转的得到的音频具有和声效果，从而提高用户对图像的听觉体验。
[0091]实施例4
[0092]本发明实施例提供一种根据图像生成音频文件的方法，如图4所示，该方法可以包括:
[0093]401、获取红绿黑RGB图像。
[0094]其中，所述获取RGB图像，包括:获取一个图片文件作为所述RGB图像；或，从视频文件中获取一帧图像作为所述RGB图像。所述获取亮度色度饱和度RGB图像，包括:获取一个图片文件作为所述RGB图像；或，从视频文件中获取一帧图像作为所述RGB图像。通过本发明实施例的方法可以将单一的图片转换成音频文件，也可以将由多帧图像组成的视频转换成音频文件。
[0095]402、将所述RGB图像中的所有像素按照三个因子值的取值区间进行分类。
[0096]例如，可以将图像中的所有像素划分为红色系、绿色系和黑色系三大类，从而在最后生成三个声部的和声效果的音频文件。或者，可以按照区域进行划分，图像的上半部分作为一个声部，下半部分作为一个声部等等，本发明实施例对于像素的划分规则不做限定。
[0097]403、分别对每个分类计算所述分类中各像素所对应的音调和音长。
[0098]404、以每个分类作为一个声部，记录每个分类中每个所述像素所对应的音调和音长,生成音频文件。
[0099]其中，与图3的实施例中YUV图像的处理方式类似，对于RGB图像也可以对分类得到的每一个声部，分别执行类似于步骤202-204的音频生成流程，得到多个声部的音频，不同的是这里的三个因子值分别是R因子、G因子和B因子。最后，可以将多个声部按照像素在RGB图像中的排列顺序合成为一个音频文件，得到多声部的音频文件。
[0100]本发明实施例提供的根据图像生成音频文件的方法，通过获取RGB图像，根据所述RGB图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该RGB图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
[0101]并且，通过将图像中的全部像素划分为多个分类，将每个分类对应一个声部，得到多声部的音频文件，使得转的得到的音频具有和声效果，从而提高用户对图像的听觉体验。
[0102]实施例5
[0103]本发明实施例提供一种根据图像生成音频文件的装置，如图5所示，该装置可以包括:获取单元51、计算单元52、生成单元53。
[0104]获取单元51，用于获取图像；其中所述图像包含每个像素的三个因子值；
[0105]计算单元52，用于根据所述获取单元51获取的图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长；
[0106]生成单元53，用于记录所述计算单元52计算的所述图像中每个所述像素所对应的音调和音长，生成音频文件。
[0107]进一步可选的，所述图像可以为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。可选的，所述图像为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。
[0108]进一步的，所述获取单元51，还用于:获取一个图片文件作为所述图像；或，从视频文件中获取一帧图像作为所述图像。
[0109]进一步的，所述计算单元52，包括:音调子单元521、音长子单元522。
[0110]音调子单元521，用于根据所述获取单元51获取的像素的第一因子值确定所述像素所对应的音调；
[0111]音长子单元522，用于根据所述获取单元51获取的像素的第二因子值确定所述像素所对应的音长。
[0112]进一步的，该装置还包括:速度单元54。
[0113]速度单元54，用于在所述计算单元52根据所述图像中每个像素的任意两个因子值，确定所述像素所对应的音调和音长之后，根据所述获取单元51获取的图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
[0114]进一步的,该装置还包括:分类单元55。
[0115]分类单元55，用于将所述图像中的所有像素按照三个因子值的取值区间进行分类；[0116]其中，所述计算单元52具体用于:分别对每个分类计算所述分类中各像素所对应的音调和音长；
[0117]所述记录单元53具体用于:以每个分类作为一个声部，记录每个分类中各像素所对应的音调和音长，生成音频文件。
[0118]本发明实施例提供的根据图像生成音频文件的装置，通过获取图像，根据所述图像中每个像素的任意两个因子值，计算所述像素所对应的音调和音长，从而生成该图像对应的音频文件，可以将图像的内容通过音频表现出来，让用户能够通过听觉感受图像内容，使得用户体验更多元化。
[0119]并且，通过将图像中的全部像素划分为多个分类，将每个分类对应一个声部，得到多声部的音频文件，使得转的得到的音频具有和声效果，从而提高用户对图像的听觉体验。
[0120]通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。
[0121]以上所述，仅为本发明的【具体实施方式】，但本发明的保护范围并不局限于此，任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。
【权利要求】
1.一种根据图像生成音频文件的方法，其特征在于，包括: 获取图像；其中所述图像包含每个像素的三个因子值；根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长；记录所述图像中每个所述像素所对应的音调和音长，生成音频文件。
2.根据权利要求1所述的根据图像生成音频文件的方法，其特征在于，所述图像为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。
3.根据权利要求1所述的根据图像生成音频文件的方法，其特征在于，所述图像为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。
4.根据权利要求3所述的根据图像生成音频文件的方法，其特征在于，所述获取图像，包括: 获取一个图片文件作为所述图像；或，从视频文件中获取一帧图像作为所述图像。
5.根据权利要求1所述的根据图像生成音频文件的方法，其特征在于，所述根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长，包括: 根据所述像素的第一因子值确定所述像素所对应的音调；根据所述像素的第二因子值确定所述像素所对应的音长。
6.根据权利要求5所述的根据图像生成音频文件的方法，其特征在于，在根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长之后，所述方法还包括: 根据所述图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
7.根据权利要求1-6中任一项所述的根据图像生成音频文件的方法，其特征在于，在获取图像之后，所述方法还包括: 将所述图像中的所有像素按照三个因子值的取值区间进行分类；其中，所述根据所述图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长，具体包括:分别对每个分类计算所述分类中各像素所对应的音调和音长；所述记录所述图像中每个所述像素所对应的音调和音长，具体包括:以每个分类作为一个声部，记录每个分类中各像素所对应的音调和音长，生成音频文件。
8.一种根据图像生成音频文件的装置，其特征在于，包括: 获取单元，用于获取图像；其中所述图像包含每个像素的三个因子值；计算单元，用于根据所述获取单元获取的图像中所述像素的任意两个因子值，计算所述像素所对应的音调和音长；生成单元，用于记录所述计算单元计算的所述图像中每个所述像素所对应的音调和音长,生成音频文件。
9.根据权利要求8所述的根据图像生成音频文件的装置，其特征在于，所述图像为红绿黑RGB图像，所述图像的三个因子值分别为:红色通道R、绿色通道G和黑色通道B。
10.根据权利要求8所述的根据图像生成音频文件的装置，其特征在于，所述图像为亮度色度YUV图像，所述图像的三个因子值分别为:亮度Y以及色度U和V。
11.根据权利要求10所述的根据图像生成音频文件的装置，其特征在于，所述获取单元，还用于: 获取一个图片文件作为所述图像；或，从视频文件中获取一帧图像作为所述图像。
12.根据权利要求11所述的根据图像生成音频文件的装置，其特征在于，所述计算单元，包括: 音调子单元，用于根据所述获取单元获取的像素的第一因子值确定所述像素所对应的首调; 音长子单元，用于根据所述获取单元获取的像素的第二因子值确定所述像素所对应的音长。
13.根据权利要求12所述的根据图像生成音频文件的装置，其特征在于，还包括: 速度单元，用于根据所述获取单元获取的所述图像中的每个所述像素的第三因子值确定所述音频文件的演奏速度。
14.根据权利要求8-13中任一项所述的根据图像生成音频文件的装置，其特征在于，还包括: 分类单元，用于将所述图像中的所有像素按照三个因子值的取值区间进行分类；其中，所述计算单元具体用于:分别对每个分类计算所述分类中各像素所对应的音调和音长；所述记录单元具体用于:以每个分类作为一个声部，记录每个分类中各像素所对应的音调和音长，生成音频文件。
【文档编号】G11B20/00GK103928036SQ201310013003
【公开日】2014年7月16日申请日期:2013年1月14日优先权日:2013年1月14日
【发明者】谢巍申请人:联想(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢巍
技术所有人：联想（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。