一种数据处理方法和装置制造方法
【专利摘要】本发明涉及多媒体处理领域,特别是涉及一种数据处理方法和装置,所述方法应用于多媒体终端,包括:接收第一输入;根据所述第一输入生成第一语音请求;获取对所述第一语音请求进行处理得到的第一语音输出结果;判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果;当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。应用本发明提供的方法,多媒体终端播放的语音输出结果总是与最新的语音请求相对应,实现了语音输出结果与语音请求的匹配,使得语音播放结果符合用户的期望。
【专利说明】一种数据处理方法和装置
【技术领域】
[0001]本发明涉及多媒体处理领域,特别是涉及一种数据处理方法和装置。
【背景技术】
[0002]TTS (Text To Speech,从文本到语音)是一种语音合成技术,可以将用户的文本输入转换为语音数据播放给用户。由于应用TTS技术得到的语音数据中人声非常动听,给用户带来非常好的体验,因此TTS技术在语音控制领域得到了广泛的应用。现有技术中,TTS一般为异步播放形式,客户端向TTS服务器请求语音事件后,即处于等待TTS服务器反馈语音信息状态,直到服务器反馈语音信息,客户端进行播放。如果用户在客户端等待服务器反馈的过程中,快速进行了另外一个语音事件请求时,客户端如果还播放的是针对第一个语音事件请求的反馈,这显然不符合用户的期望。因此现有技术的TTS异步声音输出方法,无法解决用户的语音请求与播放的语音数据的匹配对应问题。
【发明内容】
[0003]为解决上述技术问题,本发明实施例提供了一种数据处理方法和装置,可以实现语音请求与播放的语音数据的匹配对应问题。技术方案如下:
[0004]根据本发明实施例的第一方面,公开了一种数据处理方法,应用于多媒体终端,所述方法包括:
[0005]接收第一输入;
[0006]根据所述第一输入生成第一语音请求;
[0007]获取对所述第一语音请求进行处理得到的第一语音输出结果;
[0008]判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果;
[0009]当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。
[0010]较佳地,在接收第一输入之后,所述方法还包括:
[0011]接收第二输入;
[0012]根据所述第二输入生成第二语音请求;
[0013]获取对所述第二语音请求进行处理得到的第二语音输出结果;
[0014]当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果;
[0015]当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
[0016]较佳地,所述根据所述第一输入生成第一语音请求包括:
[0017]对所述第一输入进行处理,获取第一处理结果;
[0018]将第一处理结果作为第一语音请求。
[0019]较佳地,所述根据所述第一输入生成第一语音请求包括:[0020]根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。
[0021]较佳地,所述判断第一语音输出结果是否满足第一预设条件,获取第一判断结果包括:
[0022]根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求;
[0023]根据所述第一语音请求与所述第一标识的对应关系,获取第一标识;
[0024]获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
[0025]较佳地,所述获取对所述第一语音请求进行处理得到的第一语音输出结果包括:
[0026]将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果;
[0027]接收服务器发送的第一语音输出结果。
[0028]较佳地,所述第一标识为时间戳、通用唯一识别码UUID或者哈希值。
[0029]较佳地,当所述第一标识为时间戳时,则所述根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系包括:
[0030]根据所述第一输入生成第一语音请求;
[0031]根据所述第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系;
[0032]所述方法还包括:
[0033]根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识;所述第三标识在有新的语音请求生成时被更新。
[0034]较佳地,所述获取第三标识,将所述第一标识与所述第三标识进行比较为:
[0035]获取全局时间戳,所述全局时间戳与最新的语音请求相对应;
[0036]将与所述第一语音请求对应的第一局部时间戳与所述全局时间戳进行比较。
[0037]根据本发明实施例的第二方面,公开了一种数据处理装置,所述装置包括:
[0038]第一接收单元,用于接收第一输入;
[0039]第一生成单元,用于根据所述第一输入生成第一语音请求;
[0040]第一获取单元,用于获取对所述第一语音请求进行处理得到的第一语音输出结果;
[0041]第一判断单元,用于判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果;
[0042]输出单元,用于当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。
[0043]较佳地,所述装置还包括:
[0044]第二接收单元,用于接收第二输入;
[0045]第二生成单元,用于根据所述第二输入生成第二语音请求;
[0046]第二获取单元,用于获取对所述第二语音请求进行处理得到的第二语音输出结果;
[0047]第二判断单元,用于当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果;
[0048]则所述输出单元还用于当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
[0049]较佳地,所述第一生成单元具体用于对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。
[0050]较佳地,所述第一生成单元还用于根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。
[0051]较佳地,所述第一判断单元包括:
[0052]第二获取单元,用于根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求;
[0053]第三获取单元,用于根据所述第一语音请求与所述第一标识的对应关系,获取第一标识;
[0054]比较单元,用于获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
[0055]较佳地,所述第一获取单元包括:
[0056]发送单元,用于将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果;
[0057]接收单元,用于接收服务器发送的第一语音输出结果。
[0058]较佳地,所述第一标识为时间戳、通用唯一识别码UUID或者哈希值。
[0059]较佳地,当所述第一标识为时间戳时,则所述第一生成单元包括:
[0060]语音请求生成单元,用于根据所述第一输入生成第一语音请求;
[0061]第一标识生成单元,用于根据所述第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系;
[0062]第三标识生成单元,用于根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识;所述第三标识在有新的语音请求生成时被更新。
[0063]较佳地,所述比较单元具体用于获取全局时间戳,所述全局时间戳与最新的语音请求相对应;将与所述第一语音请求对应的第一局部时间戳与所述全局时间戳进行比较。
[0064]本发明实施例的一个方面的有益效果为:本发明提供了一种数据处理方法,应用于多媒体终端,所述多媒体终端接收第一输入,根据所述第一输入生成第一语音请求,并获取对所述第一语音请求进行处理得到的第一语音输出结果。判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果;当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,则不播放所述第一语音输出结果。这样,当多媒体终端判断返回的第一语音输出结果不满足预设条件时,则确定返回的第一语音输出结果与最新的语音请求不对应,则不播放所述第一语音输出结果,仅在第一语音输出结果与最新的语音请求相对应时,才播放第一语音输出结果。这样,多媒体终端播放的语音输出结果总是与最新的语音请求相对应,实现了语音输出结果与语音请求的匹配,使得语音播放结果符合用户的期望。
【专利附图】
【附图说明】
[0065]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0066]图1为本发明实施例提供的数据处理方法第一实施例示意图;
[0067]图2为本发明实施例提供的数据处理方法第二实施例示意图;
[0068]图3为本发明实施例提供的数据处理方法第三实施例示意图;
[0069]图4为本发明实施例提供的数据处理装置一实施例示意图。
【具体实施方式】
[0070]本发明实施例提供了 一种数据处理方法和装置,可以实现语音请求与播放的语音数据的匹配对应问题。
[0071]为了使本【技术领域】的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0072]参见图1,为本发明提供的数据处理方法第一实施例流程图。
[0073]本发明第一实施例提供的方法应用于多媒体终端,所述多媒体终端具有输出单元,用于输出音频数据。所述多媒体终端可以是智能电视、手机、PAD、计算机等电子设备。
[0074]S101,接收第一输入。
[0075]多媒体终端接收第一输入,所述第一输入可以是按键输入、手势输入、光标输入或者语音输入。所述多媒体终端可以具有用户界面,用于接收用户的第一输入,所述第一输入与一语音请求相关联。用户可以通过预设的按键动作、输入指令、鼠标点选、光标点选或移动动作、预设的手势输入来触发、生成语音请求。或者,用户通过输入文本信息作为第一输入。或者,将用户的语音输入作为第一输入。当第一输入为语音输入时,所述多媒体终端应当具有音频采集单元,用于采集用户的语音输入。当然,第一输入也可以是来自其他电子设备的控制信息或数据。
[0076]S102,根据所述第一输入生成第一语音请求。
[0077]具体实现时,当第一输入为非文本输入时,对第一输入进行处理将其转换为文本输入,将文本输入结果作为第一语音请求。进一步的,当第一输入为语音输入时,进行语音识别处理,将语音输入转换为文本输入。较佳地,对将语音输入转换为文本输入获取的文本输入结果进行语义识别处理,将所述语义识别结果作为第一语音请求。其中,进行语义识别处理的目的是对文本输入结果进行语义分析,以获取能够被具有处理器的计算设备识别的结果。一般地,语义识别或分析的结果可以包括动作、动作执行的目标或者应用的场景的一种或者多种。本发明对此不进行限制。
[0078]进一步地,根据所述第一输入生成第一语音请求的一种可能的实现方式为:对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。具体实现时,用户通过多媒体终端进行了第一输入以发起第一语音请求,当用户期望播放的是对所述第一输入的处理结果时,则需要先对第一输入进行处理,获取第一处理结果,将第一处理结果作为第一语音请求。
[0079]进一步地,根据所述第一输入生成第一语音请求的另一种实现方式为:根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。所述第一标识可以是时间戳、通用唯一识别码UUID或者哈希值。其中,第一标识用于唯一标识第一语音请求。本发明不限定第一标识的具体方式,本领域技术人员在不付出创造性劳动下获取的其他实现方式均属于本发明的保护范围。
[0080]S103,获取对所述第一语音请求进行处理得到的第一语音输出结果。
[0081]在本发明这一实施例中,多媒体终端还具有通信模块,用于与服务器进行数据连接。较佳地,所述服务器为云端TTS服务器。
[0082]步骤S103具体通过以下步骤实现:
[0083]S103A,多媒体终端将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果。
[0084]多媒体终端将第一语音请求发送至服务器,服务器响应多媒体终端的第一语音请求,并对第一请求进行处理以获取第一语音输出结果。服务器根据第一语音请求获取第一语音输出结果的具体实现可以依照现有技术提供的方式,本发明在此不再赘述。
[0085]S103B,接收服务器发送的第一语音输出结果。
[0086]当服务器对第一语音请求进行处理后,将获取的第一语音输出结果发送至多媒体终端,多媒体终端接收服务器发送的第一语音输出结果。
[0087]S104,判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果。
[0088]在本发明第一实施例中,为了实现多媒体终端当前播放的语音输出结果总是与最新的语音请求相匹配,设置了第一预设条件,当判断第一语音输出结果满足第一预设条件时,播放第一语音输出结果。当判断第一语音输出结果不满足第一预设条件时,则不播放第一语音输出结果。其中,第一预设条件用于判定当前获取的语音输出结果是否与最新的语音请求相匹配。对应到第一实例这一步骤,则第一预设条件用于判断获取的第一语音输出结果是否与最新的语音请求相匹配。具体实现时,第一预设条件可以由系统或用户预先设定。
[0089]较佳地,当生成第一语音请求的实现方式为根据第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识时,则判断所述第一语音输出结果是否满足第一预设条件具体可以包括:
[0090]S104A,根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求。
[0091]在本发明实施例中,多媒体终端具有通信模块,所述通信模块可以实现与服务器的数据通信。所述通信模块具有一种处理机制,可以实现发送的语音请求与服务器返回的语音输出结果的对应。具体实现时,可以将通信模块的处理方式设置为同步处理方式,即所述通信模块的一个子模块发送一个语音请求后,会一直等待服务器返回对所述语音请求进行处理得到的语音输出结果。所述通信模块可以具有多个子模块,所述多个子模块用于发送\接收数据。所述多个子模块又可以进一步划分为发送单元和接收单元。
[0092]当多媒体终端接收到服务器返回的第一语音输出结果时,则获取与第一语音输出结果对应的第一语音请求。
[0093]S104B,根据所述第一语音请求与所述第一标识的对应关系,获取第一标识。
[0094]根据预先保存的第一语音请求与第一标识的对应关系,获取第一标识。
[0095]S104C,获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
[0096]其中,第三标识与最新的语音请求相对应。在本发明第一实施例中,多媒体终端每接收到用户输入,即生成与用户输入对应的语音请求,并为所述语音请求设置唯一的标识。当用户的输入为多个时,第三标识为与最新的语音请求相对应的最近生成的标识。
[0097]将与第一语音请求/第一语音输出结果对应的第一标识与第三标识进行比较,如果所述第一标识与第三标识相同,则确定第一语音输出结果与最新的语音请求相对应,则判断第一语音输出结果符合第一预设条件。如果所述第一标识与第三标识不相同,则确定第一语音输出结果与最新的语音请求不对应,则判断第一语音输出结果不符合第一预设条件。
[0098]S105,当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。
[0099]在本发明第一实施例中,仅在第一语音输出结果满足第一预设条件时,才播放第一语音输出结果,当第一语音输出结果不满足第一预设条件时,不播放第一语音输出结果。这样,保证了多媒体终端播放的语音输出结果总是与最新的语音请求相对应,实现了语音输出结果与语音请求的匹配,更加符合用户的真实期望,提升了用户体验。
[0100]参见图2,为本发明提供的数据处理方法第二实施例流程图。
[0101]本发明第二实施例提供的方法应用于多媒体终端,所述多媒体终端具有输出单元,用于输出音频数据。所述多媒体终端可以是智能电视、手机、PAD、计算机等电子设备。
[0102]在本发明第二实施例中,描述了多媒体终端接收到两个输入请求的情形,本领域技术人员可以理解的是,本发明第二实施例提供的方法也可以应用到多媒体终端接收到多个输入请求的情形。本领域技术人员在不付出创造性劳动下获取对本发明方案的改动和变形,均属于本发明的保护范围。
[0103]S201,接收第一输入。
[0104]S202,根据所述第一输入生成第一语音请求。
[0105]具体实现时,当第一输入为非文本输入时,对第一输入进行处理将其转换为文本输入,将文本输入结果作为第一语音请求。进一步的,当第一输入为语音输入时,进行语音识别处理,将语音输入转换为文本输入。较佳地,对将语音输入转换为文本输入获取的文本输入结果进行语义识别处理,将所述语义识别结果作为第一语音请求。其中,进行语义识别处理的目的是对文本输入结果进行语义分析,以获取能够被具有处理器的计算设备识别的结果。一般地,语义识别或分析的结果可以包括动作、动作执行的目标或者应用的场景的一种或者多种。本发明对此不进行限制。
[0106]进一步地,根据所述第一输入生成第一语音请求的一种可能的实现方式为:对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。具体实现时,用户通过多媒体终端进行了第一输入以发起第一语音请求,当用户期望播放的是对所述第一输入的处理结果时,则需要先对第一输入进行处理,获取第一处理结果,将第一处理结果作为第一语音请求。
[0107]进一步地,根据所述第一输入生成第一语音请求的另一种实现方式为:根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。所述第一标识可以是时间戳、通用唯一识别码UUID或者哈希值。其中,第一标识用于唯一标识第一语音请求。本发明不限定第一标识的具体方式,本领域技术人员在不付出创造性劳动下获取的其他实现方式均属于本发明的保护范围。
[0108]进一步地,在生成第一标识并保存了第一标识与第一语音请求的对应关系之后,本发明提供的方法还包括:生成第三标识。所述第三标识与最新的语音请求相对应。具体实现时,当生成第一语音请求并生成第一标识时,将第一标识的副本作为第三标识。所述第三标识在有新的语音请求生成时被更新。
[0109]S203,获取对所述第一语音请求进行处理得到的第一语音输出结果。
[0110]S204,接收第二输入。
[0111]其中,第二输入发生在第一输入之后。
[0112]S205,根据所述第二输入生成第二语音请求。
[0113]其中,根据第二输入生成第二语音请求的实现方式与根据第一输入生成第一请求的实现方式相同。具体实现时,根据所述第二输入生成第二语音请求以及与所述第二语音请求对应的第二标识,保存所述第二语音请求与所述第二标识的对应关系。所述第二标识可以是时间戳、通用唯一识别码UUID或者哈希值。其中,第二标识用于唯一标识第二语音请求。本发明不限定第二标识的具体方式,本领域技术人员在不付出创造性劳动下获取的其他实现方式均属于本发明的保护范围。一般地,第一标识与第二标识的类型相同。
[0114]进一步地,前面提到,在生成第一标识的同时或之后生成了第三标识,所述第三标识与最新的语音请求相对应。因此当有新的语音请求生成时,即生成第二语音请求时,更新所述第三标识。具体地,当生成第二语音请求并生成第二标识时,将第二标识的副本作为第三标识。这样,第三标识则在有新的语音请求生成时被更新。
[0115]本领域技术人员可以理解的是,第二输入的生成时间晚于第一输入生成的时间,但对第一输入处理的步骤(S202、S203)与对第二输入处理的步骤(S205、S206)的执行顺序可以颠倒地执行,或者并行地执行。
[0116]S206,获取对所述第二语音请求进行处理得到的第二语音输出结果。
[0117]S207,判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果。
[0118]具体实现时,第一预设条件用于判定当前获取的语音输出结果是否与最新的语音请求相匹配。当判断第一语音输出结果满足第一预设条件时,播放第一语音输出结果。当判断第一语音输出结果不满足第一预设条件时,则不播放第一语音输出结果,并进入步骤S208。
[0119]以第一预设条件为判断当前语音输出结果对应的标识是否与最近更新的语音请求对应的标识相对应为例进行说明。具体实现时,第一预设条件为判断第一语音输出结果对应的第一标识是否与第三标识相同为例进行说明,由于第三标识在生成第二语音请求时被更新(替换为第二标识的副本),因此,当将第一标识与第三标识进行比较时,获取的判断结果为第一标识与第三标识不相同,则进入步骤S208。
[0120]S208,当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果。
[0121]其中,第一预设条件还用于判断当前获取的语音输出结果(即第二语音输出结果)是否与最新的语音请求相匹配。
[0122]仍以第一预设条件为判断当前语音输出结果对应的标识是否与最近更新的请求对应的标识相对应为例进行说明。具体实现时,在这一步骤中,以第一预设条件为判断第二语音输出结果对应的第二标识是否与第三标识相同为例进行说明,由于第三标识在生成第二语音请求时被更新(替换为第二标识的副本),因此,当将第二标识与第三标识进行比较时,获取的判断结果为第二标识与第三标识相同,则确定第二语音输出结果满足第一预设条件,进入步骤S209。
[0123]S209,当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
[0124]当判断第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。如果当前输入为多个,当判断第二语音输出结果不满足第一预设条件时,即确定第二语音输出结果与最新的语音请求不对应时,则不播放第二语音输出结果。
[0125]在本发明第二实施例中,当多媒体终端接收到两个或多个请求语音的输入时,仅在判断当前获取的语音输出结果与最新的语音请求相对应时,才播放语音输出结果;否则,抛弃所述语音输出结果,不进行播放。具体实现时,为语音请求赋予了唯一的标识,并将当前获取的语音输出结果对应的标识与最新的语音请求对应的标识进行比较,当判断二者相同时,则确定当前获取的语音输出结果与最新的语音请求相对应,才输出当前获取的语音输出结果,实现了语音输出结果与语音请求的匹配,改善了用户体验。另一方面,本发明提供的方法完全由多媒体终端通过赋予唯一标识的方式进行语音请求与语音输出结果的匹配,无需服务器进行额外的操作,避免了对服务器的改造,并且节省了网络传输资源。
[0126]参见图3,为本发明提供的数据处理方法第三实施例流程图。
[0127]本发明第一实施例和第二实施例提供的方法中,为生成的语音请求赋予的唯一标识具体可以为时间戳、通用唯一识别码UUID或者哈希值,用于唯一标识语音请求以及与语音请求对应的语音输出结果。下面以所述唯一标识为时间戳为例,对本发明的具体应用场景进行介绍。以下方法也可以使用于使用其他标识的情形。或者,本领域技术人员也可以对下述实施例提供的方法进行改进和变形,以适应与其他形式标识的实现,由此得到的实施方式均属于本发明的保护范围。
[0128]在本发明第三实施例中,仍以多媒体终端接收到两个输入请求的情形为例进行描述,本领域技术人员可以理解的是,本发明第三实施例提供的方法也可以应用到多媒体终端接收到多个输入请求的情形。本领域技术人员在不付出创造性劳动下获取对本发明方案的改动和变形,均属于本发明的保护范围。
[0129]S301,接收第一输入。[0130]S302,根据所述第一输入生成第一语音请求,生成与第一语音请求对应的第一局部时间戳,并根据第一语音请求生成的时间生成全局时间戳。
[0131]具体实现时,根据所述第一输入生成第一语音请求的一种可能的实现方式为:对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。具体实现时,用户通过多媒体终端进行了第一输入以发起第一语音请求,当用户期望播放的是对所述第一输入的处理结果时,则需要先对第一输入进行处理,获取第一处理结果,将第一处理结果作为第一语音请求。以一个实例进行说明,用户向多媒体终端发送一个输入(可以是文本输入或者语音输入)询问“现在几点了”,这时,多媒体终端需要对这个输入进行处理,即获取当前的时间,并将对输入进行处理的结果(例如现在是12点)作为第一语音请求。当然,这只是一种简单的示例,多媒体终端对第一输入的处理可以涉及到更为复杂的处理,例如查询、检索、翻译、转换等,本发明对此不进行限定。
[0132]在根据所述第一输入生成第一语音请求时,根据第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系。
[0133]进一步地,在生成第一局部时间戳并保存了第一局部时间戳与第一语音请求的对应关系之后,本发明提供的方法还包括:根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识。所述全局时间戳与最新的语音请求相对应。具体实现时,当生成第一语音请求并生成第一局部时间戳时,将第一局部时间戳的副本作为全局时间戳。所述全局时间戳在有新的语音请求生成时被更新。
[0134]S303,获取对所述第一语音请求进行处理得到的第一语音输出结果。
[0135]S304,接收第二输入。
[0136]其中,第二输入发生在第一输入之后。
[0137]S305,根据所述第二输入生成第二语音请求,生成与第二语音请求对应的第二局部时间戳,并根据第二语音请求生成的时间更新所述全局时间戳。
[0138]其中,根据第二输入生成第二语音请求的实现方式与根据第一输入生成第一请求的实现方式相同。具体实现时,根据所述第二输入生成第二语音请求以及与所述第二语音请求对应的第二局部时间戳,保存所述第二语音请求与所述第二局部时间戳的对应关系。
[0139]进一步地,前面提到,在生成第一局部时间戳的同时或之后生成了全局时间戳,所述全局时间戳与最新的语音请求相对应。因此当有新的语音请求生成时,即生成第二语音请求时,更新所述全局时间戳。具体地,当生成第二语音请求并生成第二局部时间戳时,将第二局部时间戳的副本作为全局时间戳。这样,全局时间戳在有新的语音请求生成时被更新。
[0140]本领域技术人员可以理解的是,第二输入的生成时间晚于第一输入生成的时间,但对第一输入处理的步骤(S302、S303)与对第二输入处理的步骤(S305、S306)的执行顺序可以颠倒地执行,或者并行地执行。
[0141]S306,获取对所述第二语音请求进行处理得到的第二语音输出结果。
[0142]S307,获取全局时间戳,将第一局部时间戳与全局时间戳进行比较,获取第一判断结果,当第一判断结果表明第一局部时间戳与全局时间戳不同时,进入步骤S308。
[0143]S308,比较与第二语音输出结果对应的第二局部时间戳是否与全局时间戳相同,获取第二判断结果。
[0144]S309,当所述第二判断结果表明所述第二语音输出结果对应的第二局部时间戳与全局时间戳相同时,播放与所述第二语音请求对应的第二语音输出结果。
[0145]当判断第二语音输出结果对应的第二局部时间戳与全局时间戳相同时,则确定第二语音输出结果与最新的语音请求相对应,播放与所述第二语音请求对应的第二语音输出结果。如果当前输入为多个,当判断第二语音输出结果对应的第二局部时间戳与全局时间戳不相同时,即确定第二语音输出结果与最新的语音请求不对应时,则不播放第二语音输出结果。
[0146]在本发明第三实施例中,具体实现时,使用时间戳的方式为语音请求赋予了唯一的标识,并将当前获取的语音输出结果对应的标识与最新的语音请求对应的时间戳进行比较,当判断二者相同时,则确定当前获取的语音输出结果与最新的语音请求相对应,才输出当前获取的语音输出结果,实现了语音输出结果与语音请求的匹配,改善了用户体验,方法实现简单。
[0147]更进一步地,在本发明第一实施例、第二实施例、第三实施例中,在多媒体终端播放语音输出结果之后,还可以进一步包括:将满足第一预设条件的语音输出结果转换为控制信令,控制多媒体终端执行所述控制信令。以一个实例进行说明,例如,当用户通过文本或语音输入“播放刘德华的忘情水”,则多媒体终端对输入进行处理后获取的语音输出结果为“现在为您播放刘德华的忘情水”,这时,多媒体终端在播放所述语音输出结果的同时,可以控制多媒体终端的处理单元搜索媒体库并播放与语音输出结果匹配的音频数据。以上仅为一个示例,不视为对本发明的限制,本领域技术人员在不付出创造性劳动下获取的其他实施方式均属于本发明的保护范围。
[0148]参见图4,为本发明实施例提供的一种数据处理装置示意图。
[0149]所述装置包括:
[0150]第一接收单元401,用于接收第一输入。
[0151]第一生成单元402,用于根据所述第一输入生成第一语音请求。
[0152]第一获取单元403,用于获取对所述第一语音请求进行处理得到的第一语音输出结果。
[0153]第一判断单元404,用于判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果。
[0154]输出单元405,用于当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。
[0155]较佳地,所述装置还包括:
[0156]第二接收单元,用于接收第二输入;
[0157]第二生成单元,用于根据所述第二输入生成第二语音请求;
[0158]第二获取单元,用于获取对所述第二语音请求进行处理得到的第二语音输出结果;
[0159]第二判断单元,用于当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果;
[0160]则所述输出单元还用于当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
[0161]较佳地,所述第一生成单元具体用于对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。
[0162]较佳地,所述第一生成单元还用于根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。
[0163]较佳地,所述第一判断单元包括:
[0164]第二获取单元,用于根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求;
[0165]第三获取单元,用于根据所述第一语音请求与所述第一标识的对应关系,获取第一标识;
[0166]比较单元,用于获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
[0167]较佳地,所述第一获取单元包括:
[0168]发送单元,用于将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果;
[0169]第三接收单元,用于接收服务器发送的第一语音输出结果。
[0170]较佳地,所述第一标识为时间戳、通用唯一识别码UUID或者哈希值。
[0171]较佳地,当所述第一标识为时间戳时,则所述第一生成单元包括:`[0172]语音请求生成单元,用于根据所述第一输入生成第一语音请求;
[0173]第一标识生成单元,用于根据所述第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系;
[0174]第三标识生成单元,用于根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识;所述第三标识在有新的语音请求生成时被更新。
[0175]较佳地,所述比较单元具体用于获取全局时间戳,所述全局时间戳与最新的语音请求相对应;将与所述第一语音请求对应的第一局部时间戳与所述全局时间戳进行比较。
[0176]较佳地,所述数据处理装置还可以包括音频采集单元,用于采集语音输入。
[0177]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0178]本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0179]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0180]以上所述仅是本发明的【具体实施方式】,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【权利要求】
1.一种数据处理方法,其特征在于,应用于多媒体终端,所述方法包括: 接收第一输入; 根据所述第一输入生成第一语音请求; 获取对所述第一语音请求进行处理得到的第一语音输出结果; 判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果; 当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。
2.根据权利要求1所述的方法,其特征在于,在接收第一输入之后,所述方法还包括: 接收第二输入; 根据所述第二输入生成第二语音请求; 获取对所述第二语音请求进行处理得到的第二语音输出结果; 当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果; 当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一输入生成第一语音请求包括: 对所述第一输入进行处理`,获取第一处理结果; 将第一处理结果作为第一语音请求。
4.根据权利要求1或3所述的方法,其特征在于,所述根据所述第一输入生成第一语音请求包括: 根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述判断第一语音输出结果是否满足第一预设条件,获取第一判断结果包括: 根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求; 根据所述第一语音请求与所述第一标识的对应关系,获取第一标识; 获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
6.根据权利要求1所述的方法,其特征在于,所述获取对所述第一语音请求进行处理得到的第一语音输出结果包括: 将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果; 接收服务器发送的第一语音输出结果。
7.根据权利要求4所述的方法,其特征在于,所述第一标识为时间戳、通用唯一识别码UUID或者哈希值。
8.根据权利要求7所述的方法,其特征在于,当所述第一标识为时间戳时,则所述根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系包括:根据所述第一输入生成第一语音请求; 根据所述第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系; 所述方法还包括: 根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识;所述第三标识在有新的语音请求生成时被更新。
9.根据权利要求5或8所述的方法,其特征在于,所述获取第三标识,将所述第一标识与所述第三标识进行比较为: 获取全局时间戳,所述全局时间戳与最新的语音请求相对应; 将与所述第一语音请求对应的第一局部时间戳与所述全局时间戳进行比较。
10.一种数据处理装置,其特征在于,所述装置包括: 第一接收单元,用于接收第一输入; 第一生成单元,用于根据所述第一输入生成第一语音请求; 第一获取单元,用于获取对所述第一语音请求进行处理得到的第一语音输出结果;第一判断单元,用于判断所述第一语音输出结果是否满足第一预设条件,获取第一判断结果; 输出单元,用于当所述第一判断结果表明所述第一语音输出结果不满足第一预设条件时,不播放所述第一语音输出结果。`
11.根据权利要求10所述的装置,其特征在于,所述装置还包括: 第二接收单元,用于接收第二输入; 第二生成单元,用于根据所述第二输入生成第二语音请求; 第二获取单元,用于获取对所述第二语音请求进行处理得到的第二语音输出结果;第二判断单元,用于当判断所述第一语音输出结果不满足第一预设条件时,判断所述第二语音输出结果是否满足第一预设条件,获取第二判断结果; 则所述输出单元还用于当所述第二判断结果表明所述第二语音输出结果满足第一预设条件时,播放与所述第二语音请求对应的第二语音输出结果。
12.根据权利要求10所述的装置,其特征在于,所述第一生成单元具体用于对所述第一输入进行处理,获取第一处理结果;将第一处理结果作为第一语音请求。
13.根据权利要求10或12所述的装置,其特征在于,所述第一生成单元还用于根据所述第一输入生成第一语音请求以及与所述第一语音请求对应的第一标识,保存所述第一语音请求与所述第一标识的对应关系。
14.根据权利要求13所述的装置,其特征在于,所述第一判断单元包括: 第二获取单元,用于根据第一语音输出结果,获取与所述第一语音输出结果对应的第一语音请求; 第三获取单元,用于根据所述第一语音请求与所述第一标识的对应关系,获取第一标识; 比较单元,用于获取第三标识,将所述第一标识与所述第三标识进行比较,当所述第一标识与所述第三标识相同时,确定满足第一预设条件;其中,所述第三标识与最新的语音请求相对应。
15.根据权利要求10所述的装置,其特征在于,所述第一获取单元包括: 发送单元,用于将第一语音请求发送至服务器,以使得所述服务器对所述第一语音请求进行处理以得到第一语音输出结果; 接收单元,用于接收服务器发送的第一语音输出结果。
16.根据权利要求13所述的装置,其特征在于,所述第一标识为时间戳、通用唯一识别码UUID或者哈希值。
17.根据权利要求16所述的装置,其特征在于,当所述第一标识为时间戳时,则所述第一生成单元包括: 语音请求生成单元,用于根据所述第一输入生成第一语音请求; 第一标识生成单元,用于根据所述第一语音请求生成的时间,生成与所述第一语音请求对应的第一局部时间戳作为第一标识,并保存所述第一语音请求与所述第一局部时间戳的对应关系; 第三标识生成单元,用于根据所述第一语音请求生成的时间,生成全局时间戳作为第三标识;所述第三标识在有新的语音请求生成时被更新。
18.根据权利要求14或17所述的装置,其特征在于,所述比较单元具体用于获取全局时间戳,所述全局时间戳与最新的语音请求相对应;将与所述第一语音请求对应的第一局部时间戳与所述全局时间 戳进行比较。
【文档编号】H04L29/08GK103871410SQ201210533421
【公开日】2014年6月18日 申请日期:2012年12月11日 优先权日:2012年12月11日
【发明者】蔡明祥 申请人:联想(北京)有限公司