交互式音效产生方法及系统的制作方法

文档序号:2829466阅读:415来源:国知局
专利名称:交互式音效产生方法及系统的制作方法
技术领域
本发明涉及声音处理领域,具体地说,涉及一种交互式音效产生方法及系统。
背景技术
随着多媒体技术的发展,越来越多的用户开始使用音效以使许多应用更加生动有趣。例如,用户从配乐列表中选择喜欢的音乐加入电子贺卡中;在某些电子邮件软件中,用户可以从预定义的背景音乐列表中选择背景音乐。而随着语音技术在多媒体通信中的广泛应用,用户也希望能够自己对预先录制的或合成的声音/语音制作音效以获得个性化的声音效果。例如,在在线游戏中,用户希望可以根据不同的角色改变声音;在多媒体短消息通信中,用户希望能够使短消息具有各种声音效果,从而使其更具吸引力;在实时聊天中,用户希望可以创造特别的聊天环境,诸如在海边或在山洞里。
在现有技术中,大多数多媒体应用程序仅提供简单的预定义的音效选择,这些音效被插入文本信息中,该文本信息在进行文本语音转换的同时,根据插入的音效调用相应的声音文件,然后以音频形式播放给用户。例如,美国专利申请US2002/0193996A1“Audio-form Presentation of TextMessages(文本消息的音频形式表示)”和美国专利US6,963,839B1“Systemand Method of Controlling Sound in a Multi-media CommunicationApplication(在多媒体通信应用中控制声音的系统和方法)”都提供了这样的技术方案。但是,在这些技术方案中,没有将音效动作和音效动作的对象(声音文件)分开,因此无法对音效进行进一步的编辑,经过这样音效处理后的声音效果是固定的。
此外,专业的音频编辑软件可以提供强大的音效编辑功能,但这些软件对于普通用户来说很复杂,并且这些音频编辑软件通常是单独的离线系统,用户无法在实时系统中使用。

发明内容
本发明正是基于上述技术问题而提出的,其目的在于提供一种交互式音效产生方法及系统,其可以提供灵活的音效标识,并可以对音效标识进行各种组合,生成音效表达式,方便用户的音效编辑,并且可以方便地与诸如在线游戏、实时聊天等多媒体实时系统相结合,具有广泛的应用场景。
根据本发明的一个方面,提供一种交互式音效产生方法,包括以下步骤为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;针对整个源声音或者至少一段源声音,用户选择至少一个所述音效标识;利用所选择的音效标识对源声音进行编辑,形成音效表达式;解释上述音效表达式,以确定上述音效表达式中每个音效标识所对应的操作和该操作的执行顺序;以及按照上述顺序执行上述操作以输出具有音效的声音。
优选地,所述音效标识包括系统预定义的音效标识。
优选地,所述音效标识还包括用户自定义的音效标识。
优选地,所述音效标识是以文字标记和/或图标的形式提供给用户的,并且上述图标具有对应的文字标记。
优选地,所述音效标识是按照类型进行分类的或者按照使用频率进行排序的。
优选地,所述音效动作包括插入操作、混音操作、回声操作和声音转换操作;其中,所述插入操作是将一段声音插入另一段声音的操作;所述混音操作是将一段声音与另一段声音混合在一起的操作;所述回声操作是使一段声音产生回声效果的操作;以及所述声音转换操作是将一段声音变声的操作。
优选地,所述源声音是预先录制的声音或者实时的声音或者通过文本语音转换合成的声音中的任意一种。
优选地,所述音效表达式采用XML格式。
优选地,所述音效表达式采用文本形式。
优选地,所述音效表达式采用文本和图标相结合的形式。
优选地,采用XML解释器解释所述音效表达式。
优选地,通过标准的堆栈式的规则解释方法解释所述音效表达式。
优选地,解释所述音效表达式的步骤包括将所述音效表达式中的图标翻译成对应的文字标记;以及通过标准的堆栈式的规则解释方法解释上述音效表达式。
优选地,确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
根据本发明的另一个方面,提供一种交互式音效产生系统,包括音效标识提供装置,用于为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;音效标识选择装置,用于由用户针对整个源声音或者至少一段源声音选择至少一个音效标识;音效编辑装置,用于利用所选择的音效标识编辑源声音,以获得音效表达式;音效解释装置,用于解释音效表达式,以确定与音效表达式中的每个音效标识相关的操作和该操作的执行顺序;以及音效引擎,用于按照上述顺序执行上述操作以输出具有音效的声音。
优选地,所述的交互式音效产生系统,进一步还包括音效标识产生装置,用于在特定标识与特定音效对象之间建立链接,生成音效标识。
优选地,所述音效标识产生装置还包括音效标识设置界面,用于由用户自定义音效标识。
优选地,所述音效标识提供装置还包括音效标识库,用于存储系统预定义的音效标识和/或用户自定义的音效标识。
优选地,所述音效引擎包括插入处理模块,用于执行所述插入操作;混音处理模块,用于执行所述混音操作;回声处理模块,用于执行所述回声操作;以及声音转换处理模块,用于执行所述声音转换操作。


图1是根据本发明的一个实施例的交互式音效产生方法的流程图;图2是根据本发明的一个实施例的交互式音效产生系统的示意性框图。
具体实施例方式
相信通过以下结合附图对本发明的具体实施例的详细描述,本发明的上述和其它目的、特征和优点会更加明显。
图1是根据本发明的一个实施例的交互式音效产生方法的流程图。如图1所示,在步骤101,为用户提供多个音效标识。在本发明中,每个音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作。通常,是通过在特定的音效对象和特定的标识之间建立链接来生成这些音效标识的。这些音效标识可以是系统预定义的,也可以是用户自定义的。在本实施例中,我们建议在让用户自行定义音效标识之前,提供一个包含常用的音效标识的系统预定义音效标识库。这样用户可以增加或者修改这个音效标识库,而不是完全重建。
下面具体说明音效标识中的音效对象。
如上所述,音效对象包括种子声音和音效动作。
种子声音是指预先定义的声音文件,其可以是各种各样的声音文件,如音乐、风声、动物声音、鼓掌声、笑声等等。也就是说,种子声音是在用户进行音效编辑前预先准备好的声音。
音效动作是指对声音的各种操作,包括插入操作、混音操作、回声操作和声音转换操作等。插入操作是指将一段声音插入另一段声音中,例如在一段演说中插入鼓掌声和笑声,以达到活跃气氛的效果。混音操作是指将一段声音与另一段声音混合在一起,例如将朗诵文本的声音与一段音乐相混合,以达到抒情的效果。回声操作是指使一段声音产生回声效果,例如模拟在山谷中或在空屋中说话。声音转换操作是指将一段声音进行变声,以获得特殊的表现力,例如将一段男声转换为女声,将某人的声音修改以使听起来象卡通人物。对于本领域一般技术人员来说很明显,除了以上的插入操作、混音操作、回声操作和声音转换操作之外,音效动作还可以包括其他操作。
于是,音效标识通常可包括声音标识和动作标识。在根据本发明的优选实施例中,这些音效标识可以文字标记和/或图标的形式提供给用户,并且图标具有对应的文字标记。例如,用动物的图标表示作为该动物的声音的种子声音,并且该图标对应的文字标记是动物的名称,或者用文字标记“MIX”表示混音操作。通常,音效标识与音效对象之间具有明显的关联性,以方便用户使用。
进一步地,音效标识可存储在音效标识库中。在该数据库中,特定的标识可以采用标识列表的形式存储,种子声音可以采用声音文件的形式,而音效动作则以应用程序的形式体现。并且,在各个标识与各自的音效对象之间建有链接。
虽然在本实施例中仅给出了上述的音效标识在音效标识库中的存储方式,但是对于本领域普通技术人员来说,很容易知道也可以采用其它方式存储音效标识。
在音效标识库中,为了方便用户使用,可以分别组织声音标识和动作标识。下面以举例的方式说明声音标识和动作标识的组织方式。
1.声音标识在本实施例中,提供两种声音标识的组织方式。
1)按照类型进行分类。例如,声音标识可以划分为音乐类、自然类、人声类和其它类,其中音乐类又进一步划分为古典音乐、现代音乐、摇滚音乐、流行音乐和恐怖音乐,自然类进一步划分为诸如风声、雨声、海浪声等的自然声音和诸如鸟鸣、青蛙叫声等的动物声音,人声类可进一步划分为祝福语和经典台词,其它类可进一步划分为笑声、哭声和恐怖怪叫声。
在此虽然仅给出了一种类型分类方法,但本领域的普通技术人员很容易知道,也可以采用其它的类型分类方法。
2)按照使用频率进行排序。这种组织方式就是根据对使用频率的统计,按照使用频率的高低顺序排列声音标识。通常,声音标识首先按照预设置的使用频率进行排序,随着用户的使用,各个声音标识的使用频率改变,再根据新的使用频率改变声音标识的顺序,从而可以动态地调整声音标识的排序。
虽然上面给出了两种组织声音标识的方式,但应当知道,也可以采用其它的组织方式对声音标识进行组织。
2.动作标识在本实施例中,对于动作标识也提供了类似声音标识的组织方式的两种组织方式。
1)按照类型进行分类。该组织方式根据音效动作的类型对动作标识进行分类。由此,动作标识可以划分为插入操作类、混音操作类、回声操作类和声音转换操作类,例如,混音操作类可进一步划分为强背景音操作类和弱背景音操作类,回声操作类可进一步划分为空屋回声操作类、山谷回声操作类、岩洞回声操作类等,声音转换操作类可进一步划分为男声转女声操作类、女声转男声操作类、年老转年轻操作类、年轻转年老操作类、人声转机器人声操作类、人声转鬼魂效果操作类、人声转魔法师效果操作类等。
2)按照使用频率进行排序。这种方式就是根据对使用频率的统计,按照使用频率的高低顺序排列动作标识。通常,动作标识首先按照预设置的使用频率进行排序,随着用户的使用,各个动作标识的使用频率改变,再根据新的使用频率改变动作标识的顺序,从而可以动态地调整动作标识的排序。
虽然上面给出了两种组织动作标识的方式,但应当知道,也可以采用其它的组织方式对动作标识进行组织。
需要说明的是,如前所述,以上这些音效标识(包括种子声音标识和音效动作标识)可以是系统预定义的,也可以是用户自定义的。
接下来,在步骤105,对于整个源声音或者源声音的一段或多段,用户选择一个或多个音效标识。源声音是指用户想要进行音效编辑的声音。源声音可以是用户输入的预先录制的声音或者实时的声音。另外,用户也可以输入文本,通过文本语音转换操作将该文本转换为声音,作为源声音。
例如,用户想要对文本“你会有报应的”进行音效编辑,首先需要调用文本语音转换操作将该文本转换为声音以作为源声音,然后对于这段源声音,用户依次选择了“空屋回声”动作标识、“风声”声音标识以及“混音”动作标识。
然后,在步骤110,利用所选择的音效标识对源声音进行编辑,形成源声音的音效表达式。具体地,对于整个源声音或者源声音的一段或多段,将用户所选择的一个或多个音效标识与对应的源声音相结合,从而形成源声音的音效表达式。在上面的例子中,对源声音进行编辑就是将“空屋回声”动作标识与合成声音“你会有报应的”相结合,然后与“风声”声音标识通过“混音”动作标识相结合,从而得到音效表达式。
音效表达式可以具有多种形式,在本实施例中,提供以下几种音效表达式。
首先,音效表达式可以采用XML格式,在这种情况下,利用XML语言描述上述音效编辑过程,其中音效标识由其所对应的特定文字标识来表示。即使所选择的音效标识是以图标形式提供给用户的,在形成音效表达式时也应将图标换成其对应的文字标识。在上面的例子中,源声音的音效表达式如下所示<Operation-mix>
<seed>wind<\seed>
<Operation-echo_room>
<TTS>
你会有报应的<\TTS>
<\Operation>
<\Operation>
该XML语言描述了用户所要求的音效编辑过程,即首先,对文本“你会有报应”进行文本语音转换(TTS)得到源声音,然后对转换后得到的源声音执行“空屋回声”操作(Operation-echo_room),再与“风声”(种子声音wind)“混音”(Operation-mix)。
音效表达式也可以采用文本形式,在这种情况下,音效标识也由其所对应的特定文字标识来表示。即使所选择的音效标识是以图标形式提供给用户的,在形成音效表达式时也应将图标换成其对应的文字标识。在上面的例子中,源声音的音效表达式如下所示MIX(WIND,ECHOROOM(TTS(你会有报应的)))同样,该文本形式的音效表达式也描述了用户所要求的音效编辑过程,即首先,对文本“你会有报应”进行文本语音转换(TTS)得到源声音,然后对转换后得到的源声音执行“空屋回声”操作(ECHOROOM),再与“风声”(种子声音WIND)“混音”(MIX)。上述各个音效动作的执行顺序是通过上述文本形式的音效表达式中的括号来限定的,这类似于通常的数学表达式。
此外,音效表达式还可以采用文本和图标相结合的形式。在上面的例子中,源声音的音效表达式如下所示 其中,音效标识都以图标表示。
在以上音效表达式中通过各个图标描述了用户所要求的音效编辑过程,即首先,对文本“你会有报应”进行文本语音转换得到源声音 然后对转换后得到的源声音执行“空屋回声”操作 再与“风声”“混音” 当然,本领域的普通技术人员很容易知道,还可以采用其它形式的音效表达式。
然后,在步骤115,对通过步骤110形成的源声音的音效表达式进行解释,以确定该音效表达式中的每个音效标识所对应的操作和该操作的执行顺序。在该步骤中,确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象对于种子声音,确定其被施加的操作;对于音效动作,确定其操作的声音对象。
对于不同形式的音效表达式,根据其形成方式采用相对应的的解释方式。
对于XML格式的音效表达式,采用XML解释器进行解释。关于XML解释器,可以参考http://www.w3.org/TR/REC-xml/中的XML解释器,此处不再详述。
对于文本形式的音效表达式,则采用标准的堆栈式的规则解释方法进行解释。这种规则解释方法对于本领域普通技术人员来说是公知的技术,此处不再详述。
对于文本和图标相结合的音效表达式,在对其进行解释时,首先需要将该音效表达式中的图标翻译成对应的文字标识,然后采用标准的堆栈式的规则解释方法进行。
在上面的例子中,在对音效表达式进行解释后,可以得到相关的操作及操作顺序如下首先,执行“空屋回声”操作,其操作的声音对象是合成声音“你会有报应的”;其次,执行“混音”操作,其操作的声音对象是具有空屋回声效果的合成声音“你会有报应的”和风声。
在步骤120,按照通过步骤115获得的操作顺序执行相关的操作以输出具有音效的声音。在上面的例子中,首先调用“空屋回声”操作应用程序以使合成声音“你会有报应的”具有回声效果,然后获取风声的声音文件并调用“混音”操作应用程序,以将具有回声效果的合成声音与风声混合,生成最终的音效。
通过以上描述可以看出,根据本发明的交互式音效产生方法可以分别提供声音标识和动作标识,克服了现有技术中音效动作和音效动作的对象(声音文件)不能分离的缺点,使音效标识更加灵活。在本发明中,可以通过对音效标识进行进一步的组合,形成音效表达式,于是便于用户实时、动态地进行音效编辑,从而提供了更具用户个性化的音效。
在同一个发明构思下,图2是根据本发明的一个实施例的交互式音效产生系统的示意性框图。下面结合附图详细说明本发明的实施例。
如图2所示,该交互式音效产生系统包括音效标识产生装置201,其通过在特定音效对象与特定标识之间建立链接来生成音效标识,如上所述,音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;音效标识提供装置202,为用户提供多个音效标识;音效标识选择装置203,用户通过该装置对于整个源声音或者源声音的一段或多段选择一个或多个音效标识;音效编辑装置204,其利用所选择的音效标识编辑源声音,以获得源声音的音效表达式;音效解释装置205,其解释音效表达式,以确定与音效表达式中的每个音效标识相关的操作和该操作的执行顺序;音效引擎206,其按照上述顺序执行上述操作以输出具有音效的声音。
以下进一步详细地说明该交互式音效产生系统中的各个组成部分。
如图所示,在该实施例中,音效标识提供装置202包括用于存储音效标识的音效标识库212。在音效标识库212中,可以将声音标识和动作标识分开组织,其组织方式可以采用分类组织方式或使用频率排序的组织方式。关于音效标识的组织方式在前面已经详细描述过,此处不再赘述。此外,由于以上这些音效标识即可以是系统预定义的,也可以是用户自定义的,所以,在音效标识库212中可以将系统预定义的音效标识和用户自定义音效标识分开组织,即音效标识库212可以包括预定义音效标识库和自定义音效标识库。
如前所述,音效标识产生装置201用于在特定音效对象与特定标识之间建立链接来生成音效标识。音效标识中的各种音效对象在前面已经详细描述过,此处不再赘述。音效标识根据音效对象的不同,可以包括声音标识和动作标识。
进一步地,音效标识产生装置201还包括音效标识设置界面211,用于由用户自定义音效标识。由于种子声音标识和音效动作标识设置方法差异较大,在本实施例中,分别给出两种不同的音效标识设置界面,分别用于声音标识设置和动作标识设置。
以下针对不同的音效标识组织方法,介绍声音标识设置界面和动作标识设置界面。
首先,介绍声音标识设置界面。在声音标识是按使用频率排序的情况下用户选择创建种子声音标识;系统弹出一个对话框,要求用户指定1.声音文件2.对应标识。
用户完成输入后点击确认。
该声音标识被加入音效标识库的自定义标识库中。
用户可以在图标列表的自定义标识列表最后看到加入的新标识。
在声音标识是按分类组织的情况下用户选择创建种子声音标识;系统弹出一个对话框,要求用户指定1.声音文件2.对应标识3.所属分类用户完成输入后点击确认,该声音标识被加入音效标识库的自定义标识库中。
用户可以在对应分类的自定义标识列表最后看到加入的新标识。
下面,介绍音效动作标识设置界面。由于音效动作标识通常是按照分类组织的,于是,下面针对按分类组织的音效动作标识来介绍音效动作标识设置界面。
用户选择创建音效动作标识;系统弹出一个对话框,要求用户指定1.音效动作所属分类用户选择,系统弹出相应分类的参数对话框,要求用户指定2.具体的动作参数设置;用户完成参数设置后,系统将要求用户指定3.对应标识;用户完成输入后点击确认,该音效动作标识被加入音效动作标识库的自定义标识库中。
用户可以在对应分类的自定义标识列表最后看到加入的新标识。
以上介绍了根据本发明优选实施例的交互式音效产生系统20中的音效标识产生装置201。下面详细介绍交互式音效产生系统20中的其他装置。
当用户需要进行音效编辑时,首先将源声音输入到音效标识选择装置202中。在音效标识选择装置202中,用户根据自己的喜好对整个源声音或者源声音的一段或多段的,选择一个或多个音效标识。
源声音可以是预先录制的声音或者实时的声音。另外,当用户输入文本时,需要先通过文本语音转换操作将该文本转换为声音,然后将该合成声音作为源声音输入到音效标识选择装置202中。
例如,用户想要对文本“你会有报应的”进行音效编辑,首先需要调用文本语音转换操作将该文本转换为声音以作为源声音,然后对于这段源声音,用户通过音效标识的标记列表从音效标识数据库211中依次选择了“空屋回声”动作标识、“风声”声音标识以及“混音”动作标识。
当用户选择了音效标识后,这些音效标识及其对应的源声音被输出到音效编辑装置203中。在上面的例子中,“空屋回声”动作标识、“风声”声音标识、“混音”动作标识以及合成声音“你会有报应的”被输入到音效编辑装置203中。
在音效编辑装置203中,对于整个源声音或者一段或多段源声音,将所选择的一个或多个音效标识与对应的源声音相结合而形成源声音的音效表达式。在上面的例子中,将“空屋回声”动作标识与合成声音“你会有报应的”相结合,然后与“风声”声音标识通过“混音”动作标识相结合,从而得到音效表达式。
进一步地,音效编辑装置203可以是XML编辑器,通过该XML编辑器可以形成XML格式的音效表达式。在上面的例子中,源声音的音效表达式如下所示<Operation-mix>
<seed>wind<\seed>
<Operation-echo_room>
<TTS>
你会有报应的<\TTS>
<\Operation>
<\Operation>
音效编辑装置203也可以是文字编辑器,通过该文字编辑器可以形成文本形式的音效表达式。在上面的例子中,源声音的音效表达式如下所示MIX(WIND,ECHOROOM(TTS(你会有报应的)))此外,音效编辑装置203还可以是可编辑文本和图标的编辑器,通过其可以形成文本和图标相结合的音效表达式。在上面的例子中,源声音的音效表达式如下所示 其中,音效标识都以图标表示。
当然,本领域的普通技术人员很容易知道,还可以采用其它的编辑器作为音效编辑装置。
当源声音的音效表达式在音效编辑装置203中形成后,该音效表达式被输出到音效解释装置204中进行解释。由于音效表达式的形成方式不同,因此音效解释装置204需采用相对应的解释装置。音效解释装置204通过对音效表达式的解释,可以确定与每个音效标识对应的操作和该操作的执行顺序,其中与每个音效标识对应的操作包括确定每个音效标识的音效内容,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
对于XML格式的音效表达式,音效解释装置204是XML解释器,其可以解释XML格式的音效表达式。关于XML解释器,可以参考http://www.w3.org/TR/REC-xml/中的XML解释器,此处不再详述。
对于文本形式的音效表达式,音效解释装置204采用标准的堆栈式的规则解释方法进行解释。这种规则解释方法对于本领域普通技术人员来说是公知的技术,此处不再详述。
对于文本和图标相结合的音效表达式,音效解释装置204将该音效表达式中的图标翻译成对应的文字标记,再采用标准的堆栈式的规则解释方法进行解释。
在上面的例子中,通过音效解释装置204的解释,可以得到该音效表达式的相关操作及操作顺序如下首先,执行“空屋回声”操作,其操作的声音对象是合成声音“你会有报应的”;其次,执行“混音”操作,其操作的声音对象是具有空屋回声效果的合成声音“你会有报应的”和风声。
与音效表达式相关的操作及操作顺序被输入到音效引擎205中,由音效引擎205根据操作顺序执行相关的操作。
进一步地,音效引擎205包括插入处理模块,用于执行插入操作,即将一段声音插入另一段声音的操作;混音处理模块,用于执行混音操作,即将一段声音与另一段声音混合的操作;回声处理模块,用于执行回声操作,即使一段声音产生回声效果的操作;以及声音转换处理模块,用于执行声音转换操作,即将一段声音变声的操作。
在上面的例子中,合成声音“你会有报应的”首先被输入到回声处理模块中进行处理,回声处理模块输出具有回声效果的合成声音,然后,具有回声效果的合成声音和风声声音文件被输入到混音处理模块中进行混音,最后从混音处理模块中输出具有最终音效的声音。
通过以上描述可以看出,采用本实施例的交互式音效产生系统,可以为用户分别提供声音标识和动作标识,克服了现有技术中音效动作和音效动作的对象(声音文件)不能分离的缺点,使音效标识更加灵活。在本发明中,可以通过对音效标识进行进一步的组合,形成音效表达式,于是便于用户实时、动态地进行音效编辑,从而提供了更具用户个性化的音效。
以上虽然结合实施例对本发明的交互式音效产生方法及系统进行了详细地描述,但应当理解,在不脱离本发明的精神和范围的情况下,本发明的普通技术人员可以对上述实施例进行各种修改。
权利要求
1.一种交互式音效产生方法,包括以下步骤为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;针对整个源声音或者至少一段源声音,用户选择至少一个所述音效标识;利用所选择的音效标识对源声音进行编辑,形成音效表达式;解释上述音效表达式,以确定上述音效表达式中每个音效标识所对应的操作和该操作的执行顺序;以及按照上述顺序执行上述操作以输出具有音效的声音。
2.根据权利要求1所述的交互式音效产生方法,其中所述音效标识包括系统预定义的音效标识。
3.根据权利要求2所述的交互式音效产生方法,其中所述音效标识还包括用户自定义的音效标识。
4.根据权利要求1所述的交互式音效产生方法,其中,所述音效标识是以文字标记和/或图标的形式提供给用户的,并且上述图标具有对应的文字标记。
5.根据权利要求1所述的交互式音效产生方法,其中,所述音效标识是按照类型进行分类的或者按照使用频率进行排序的。
6.根据权利要求1所述的交互式音效产生方法,其中,所述音效动作包括插入操作、混音操作、回声操作和声音转换操作;其中,所述插入操作是将一段声音插入另一段声音的操作;所述混音操作是将一段声音与另一段声音混合在一起的操作;所述回声操作是使一段声音产生回声效果的操作;以及所述声音转换操作是将一段声音变声的操作。
7.根据权利要求1所述的交互式音效产生方法,其中,所述源声音是预先录制的声音或者实时的声音或者通过文本语音转换合成的声音中的任意一种。
8.根据权利要求1所述的交互式音效产生方法,其中,所述音效表达式采用XML格式。
9.根据权利要求4所述的交互式音效产生方法,其中,所述音效表达式采用文本形式。
10.根据权利要求4所述的交互式音效产生方法,其中,所述音效表达式采用文本和图标相结合的形式。
11.根据权利要求8所述的交互式音效产生方法,其中,采用XML解释器解释所述音效表达式。
12.根据权利要求9所述的交互式音效产生方法,其中,通过标准的堆栈式的规则解释方法解释所述音效表达式。
13.根据权利要求10所述的交互式音效产生方法,其中,解释所述音效表达式的步骤包括将所述音效表达式中的图标翻译成对应的文字标记;以及通过标准的堆栈式的规则解释方法解释上述音效表达式。
14.根据权利要求1所述的交互式音效产生方法,其中确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
15.一种交互式音效产生系统,包括音效标识提供装置,用于为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;音效标识选择装置,用于由用户针对整个源声音或者至少一段源声音选择至少一个音效标识;音效编辑装置,用于利用所选择的音效标识编辑源声音,以获得音效表达式;音效解释装置,用于解释音效表达式,以确定与音效表达式中的每个音效标识相关的操作和该操作的执行顺序;以及音效引擎,用于按照上述顺序执行上述操作以输出具有音效的声音。
16.根据权利要求15所述的交互式音效产生系统,进一步还包括音效标识产生装置,用于在特定标识与特定音效对象之间建立链接,生成音效标识。
17.根据权利要求16所述的交互式音效产生系统,其中,所述音效标识产生装置还包括音效标识设置界面,用于由用户自定义音效标识。
18.根据权利要求16或17所述的交互式音效产生系统其中,所述音效标识提供装置还包括音效标识库,用于存储系统预定义的音效标识和/或用户自定义的音效标识。
19.根据权利要求15所述的交互式音效产生系统,其中,所述音效标识是以文字标记和/或图标的形式提供给用户的,并且上述图标具有对应的文字标记。
20.根据权利要求18所述的交互式音效产生系统,其中,所述音效标识在所述音效标识库中是按照类型进行分类的或者按照使用频率进行排序的。
21.根据权利要求15所述的交互式音效产生系统,其中,所述音效动作包括插入操作、混音操作、回声操作和声音转换操作;其中,所述插入操作是将一段声音插入另一段声音的操作;所述混音操作是将一段声音与另一段声音混合在一起的操作;所述回声操作是使一段声音产生回声效果的操作;以及所述声音转换操作是将一段声音变声的操作。
22.根据权利要求15所述的交互式音效产生系统,其中,所述源声音是预先录制的声音或者实时的声音或者通过文本语音转换合成的声音中的任意一种。
23.根据权利要求15所述的交互式音效产生系统,其中,所述音效编辑装置是XML编辑器,通过其形成XML格式的音效表达式。
24.根据权利要求15所述的交互式音效产生系统,其中,所述音效编辑装置是文字编辑器,通过其形成文本形式的音效表达式。
25.根据权利要求15所述的交互式音效产生系统,其中,所述音效编辑装置是可编辑文本和图标的编辑器,通过其形成文本和图标相结合的音效表达式。
26.根据权利要求23所述的交互式音效产生系统,其中,所述音效解释装置是XML解释器,其用于解释XML格式的音效表达式,并且确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
27.根据权利要求24所述的交互式音效产生系统,其中,所述音效解释装置采用标准的堆栈式的规则解释方法以解释文本形式的音效表达式;确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
28.根据权利要求25所述的交互式音效产生系统,其中,所述音效解释装置将上述音效表达式中的图标翻译成对应的文字标记并采用标准的堆栈式的规则解释方法以解释文本和图标相结合的音效表达式;确定与每个音效标识对应的操作包括确定每个音效标识所对应的音效对象,并且对于种子声音,还确定其被施加的操作;对于音效动作,还确定其操作的声音对象。
29.根据权利要求15所述的交互式音效产生系统,其中,所述音效引擎包括插入处理模块,用于执行所述插入操作;混音处理模块,用于执行所述混音操作;回声处理模块,用于执行所述回声操作;以及声音转换处理模块,用于执行所述声音转换操作。
全文摘要
本发明提供了一种交互式音效产生方法,包括为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;针对整个源声音或者至少一段源声音,用户选择至少一个所述音效标识;利用所选择的音效标识对源声音进行编辑,形成音效表达式;解释上述音效表达式,以确定上述音效表达式中每个音效标识所对应的操作和该操作的执行顺序;以及按照上述顺序执行上述操作以输出具有音效的声音。本发明的方法使得用户可以实时、动态地对声音进行音效编辑,从而提供更具用户个性化的音效。另外,本发明还提供一种交互式音效产生系统。
文档编号G10H1/00GK101046956SQ20061006650
公开日2007年10月3日 申请日期2006年3月28日 优先权日2006年3月28日
发明者沈丽琴, 施勤, 李海萍, 双志伟 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1