语音消息处理方法及装置与流程

文档序号:18358460发布日期:2019-08-06 23:28阅读:137来源:国知局
语音消息处理方法及装置与流程

本发明涉及通信技术领域,特别涉及一种语音消息处理方法及装置。



背景技术:

随着通信技术的发展,终端之间可以便捷地传输语音消息,并可以对接收到的语音消息进行展示,以提醒用户读取。例如,终端可以通过安装的即时通信应用或社交软件应用等应用收发语音消息,并可以在应用界面对接收到的语音消息进行展示。

相关技术中,提供了一种语音消息处理方法,包括:第一终端基于登录的第一账号向服务器发送语音消息发送请求,该语音消息发送请求携带语音消息和第二账号信息。服务器接收该语音发送请求,并根据该第二账号信息,将该语音消息发送给登录该第二账号的第二终端。第二终端接收到该语音消息后,在指定会话界面中显示语音消息图标,该语音消息图标用于指示该语音消息,并可以触发播放该语音消息,该指定会话界面是指包括该第一账号和第二账号的会话界面。

相关技术中,对于会话界面上显示的语音消息图标,需要用户通过点击触发播放来听取对应的语音消息内容,但是在某些诸如会议的场合可能不适合播放收听,因此可能会导致用户无法及时获知重要消息。而且,对于会话界面上通过相同的语音消息图标展示的多个已读取的语音消息,如果用户想要再次读取其中某个特定的语音消息,则需要依次收听这些语音消息,才能准确找到这个特定的语音消息,查找语音消息的操作繁琐,效率较低。



技术实现要素:

本发明实施例提供了一种语音消息处理方法及装置,可以用于解决相关技术中存在的无法及时获取重要消息,以及查找语音消息的操作繁琐,效率较低等问题。所述技术方案如下:

一方面,提供了一种语音消息处理方法,所述方法包括:

接收第一终端基于登录的第一账号发送的语音消息发送请求,所述语音消息发送请求携带语音消息和第二账号信息,用于请求所述服务器将所述语音消息转发给第二账号;

获取所述语音消息的关键字;

基于所述第二账号信息,将所述语音信息和所述语音消息的关键字发送给登录所述第二账号的第二终端,由所述第二终端在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,应用于服务器中,所述装置包括:

接收模块,用于接收第一终端基于登录的第一账号发送的语音消息发送请求,所述语音消息发送请求携带语音消息和第二账号信息;

获取模块,用于获取所述语音消息的关键字;

发送模块,用于基于所述第二账号信息,将所述语音信息和所述语音消息的关键字发送给登录所述第二账号的第二终端,由所述第二终端在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种语音消息处理方法,应用于第二终端中,所述方法包括:

基于登录的第二账号接收服务器发送的语音信息和所述语音消息的关键字,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号,所述语音消息的关键字由所述服务器基于所述语音消息获取得到;

在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,应用于第二终端中,所述装置包括:

接收模块,用于基于登录的第二账号接收服务器发送的语音信息和所述语音消息的关键字,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号,所述语音消息的关键字由所述服务器基于所述语音消息获取得到;

显示模块,用于在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种语音消息处理方法,应用于第二终端中,所述方法包括:

基于登录的第二账号接收服务器发送的语音消息,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号;

获取所述语音消息的关键字;

在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,应用于第二终端中,所述装置包括:

接收模块,用于基于登录的第二账号接收服务器发送的语音消息,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号;

获取模块,用于获取所述语音消息的关键字;

显示模块,用于在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种语音消息处理方法,应用于第二终端中,所述方法包括:

接收第一终端发送的语音消息;

获取所述语音消息的关键字;

在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指所述第一终端和所述第二终端所在的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,应用于第二终端中,所述装置包括:

接收模块,用于接收第一终端发送的语音消息;

获取模块,用于获取所述语音消息的关键字;

显示模块,用于在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指所述第一终端和所述第二终端所在的会话界面,所述语音消息图标用于触发播放所述语音消息。

一方面,提供了一种语音消息处理装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述语音消息处理方法。

一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述语音消息处理方法。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例中,服务器接收到第一终端发送的语音消息之后,可以先将获取该语音消息的关键字,然后将该语音消息和该语音消息的关键字一起发送给第二终端,使得第二终端在会话界面上显示语音消息图标时,还可以显示该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的一种语音消息处理系统的示意图;

图1b是本发明实施例提供的另一种语音消息处理系统的示意图;

图1c是本发明实施例提供的一种语音消息处理方法的流程图;

图1d是本发明实施例提供的一种第一终端的会话界面的示意图;

图1e是本发明实施例提供的又一种语音消息处理系统的示意图;

图1f是本发明实施例提供的一种第二终端的会话界面的示意图;

图1g是本发明实施例提供的一种即时通信应用的通用设置菜单的示意图;

图1h是本发明实施例提供的一种语音消息处理方法的流程示意图;

图2是本发明实施例提供的另一种语音消息处理方法的流程图;

图3是本发明实施例提供的又一种语音消息处理方法的流程图;

图4是本发明实施例提供的一种消息处理装置的结构示意图;

图5是本发明实施例提供的另一种消息处理装置的结构示意图;

图6是本发明实施例提供的又一种消息处理装置的结构示意图;

图7是本发明实施例提供的一种服务器700的结构示意图;

图8是本发明实施例提供的一种终端800的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

在对本发明实施例进行详细地解释说明之前,先对本发明实施例的应用场景予以说明。

本发明实施例应用于终端对接收到的语音消息进行展示的场景中,具体可以适用于会议等需要保持安静的场景,或者人员嘈杂的场景,或者查找语音消息的场景等,当然也可以适应于其他需要展示语音消息的场景,本发明实施例对此不做限定。

会议等需要保持安静的场景

对于终端接收到的语音消息,用户一般需要点击终端的会话界面上显示的语音消息图标,触发终端播放该语音消息图标对应的语音消息,然后将终端放在耳边进行收听。但是,在一些会议或电影院等需要保持安静的场合,用户并不方便播放语音消息,这样将可能会导致用户无法及时获知消息,特别是重要消息,造成重要消息遗漏。而本发明实施例中,当用户处于会议或电影院等需要保持安静的场合时,可以设置终端在显示语音消息图标时,在语音消息图标附近显示语音消息的关键字,这样用户无需点击播放语音消息,通过显示的关键字即可及时获知语音消息的大概意思,避免了重要消息的遗漏。

人员嘈杂的场景

在一些闹市或演唱会等人员较多的嘈杂场合,即使用户触发终端播放语音消息,用户也有可能听不清具体消息内容,这样也可能会导致用户无法及时获知消息,造成重要消息遗漏。而本发明实施例中,当用户处于人员较多的嘈杂场合时,可以设置终端在显示语音消息图标时,在语音消息图标附近显示语音消息的关键字,这样用户不仅可以点击播放语音消息,还可以通过显示的关键字即可及时获知语音消息的大概意思,避免了重要消息的遗漏。

查找语音消息的场景

对于用户已读取的多条语音消息,如果用户想要重复读取其中的某条特定的语音消息,由于这些语音消息都是通过相同的语音消息图标进行展示,用户并不能分辨出哪个语音消息图标对应的是用户想要重复读取的语音消息,因此用户需要依次收听这些语音消息,才能准确地找到这个特定的语音消息。本发明实施例中,终端在显示语音消息图标时,还可以在语音消息图标附近显示语音消息的关键字,因此用户可以直接通过显示的关键字快速查找想要重复收听的消息,而无需依次收听,提高了语音消息的查找效率。

或者,当终端接收到大量语音消息时,由于这些语音消息都是通过相同的语音消息图标进行展示,用户并不能分辨出哪些语音消息是重要消息,哪些消息是不重要的消息,这样用户也就需要对每条语音消息都从头到尾收听一遍,才能筛选出需要的消息内容。本发明实施例中,终端在显示语音消息图标时,还可以在语音消息图标附近显示语音消息的关键字,这样用户就可以通过显示的关键字快速获知哪些语音消息是用户需要关注的重要消息,哪些语音消息是用户无需关注的不重要的消息,然后优先收听重要消息。

接下来对本发明实施例的系统架构进行介绍。

图1a是本发明实施例提供的一种语音消息处理系统的示意图,如图1a所示,该系统包括第一终端10、服务器20和第二终端30。第一终端10和服务器20可以通过网络进行连接,服务器20和第二终端30也可以通过网络进行连接。

其中,第一终端10为语音消息的发送端,第二终端30为语音消息的接收端。实际实现时,在通信系统中,一般需要通过服务器来支持多个终端之间消息的传输,因此当第一终端10要向第二终端30发送语音消息时,一般需要通过服务器20进行转发。也即是,第一终端10先将语音消息发送给服务器20,再由服务器20将语音消息转发给第二终端30。

进一步地,为了区分用户,终端一般会基于用户登录的账号,进行语音消息的发送或接收。为了便于说明,本发明实施例中,将第一终端10登录的账号称为第一账号,将第二终端30登录的账号称为第二账号。

进一步地,第一终端10和第二终端30之间还可以通过安装的消息应用传输语音消息,相应地,该第一账号和第二账号为用户在消息应用中登录的账号。其中,该消息应用是指能够支持收发语音消息的应用,例如该消息应用可以为即时通信应用或社交软件应用等。

本发明实施例中,基于上述语音消息处理系统,可以对第一终端10发送给第二终端30的语音消息进行处理,以使第二终端30在显示语音消息图标时,在语音消息图标附近显示该语音消息的关键字,从而解决相关技术中存在的无法及时获取重要消息,以及查找语音消息的操作繁琐,效率较低的问题。

具体地,基于上述语音消息处理系统,可以采用以下两种实现方式对语音消息进行处理:

第一种实现方式:由服务器进行关键字的提取。

第一终端10,用于基于登录的第一账号向服务器20发送语音消息发送请求,该语音消息发送请求携带语音消息和第二账号信息;

服务器20,用于接收第一终端10发送的语音消息发送请求;获取该语音消息的关键字;基于第二账号信息,将该语音信息和该语音消息的关键字发送给登录第二账号的第二终端30;

第二终端30,用于接收服务器10发送的语音信息和该语音消息的关键字;在指定会话界面中显示语音消息图标和该语音消息的关键字,该指定会话界面是指包括第一账号和第二账号的会话界面,该语音消息图标用于触发播放该语音消息。

也即是,在第一种实现方式中,由服务器20对第一终端10发送给第二终端30的语音消息进行处理,得到该语音消息的关键字,并将该语音消息和语音消息的关键字一起发送给第二终端30,使得第二终端30在显示语音消息图标的同时,在语音消息图标附近显示该语音消息的关键字。

第二种实现方式:由第二终端进行关键字的提取。

第一终端10,用于基于登录的第一账号向服务器20发送语音消息发送请求,该语音消息发送请求携带语音消息和第二账号信息;

服务器20,用于接收第一终端10发送的语音消息发送请求;基于第二账号信息,将该语音信息发送给登录第二账号的第二终端30;

第二终端30,用于接收服务器10发送的语音信息;获取该语音消息的关键字;在指定会话界面中显示语音消息图标和该语音消息的关键字,该指定会话界面是指包括第一账号和第二账号的会话界面,该语音消息图标用于触发播放该语音消息。

也即是,在第二种实现方式中,服务器不对第一终端10发送给第二终端30的语音消息进行处理,直接将语音消息转发给第二终端30,由第二终端30对语音消息进行处理,得到该语音消息的关键字,然后在显示语音消息图标时,在语音消息图标附近显示该语音消息的关键字。

需要说明的是,上述两种实现方式仅是以终端需要通过服务器转发语音消息为例进行说明,而在另一实施例中,终端之间还可以直接传输语音消息,而不需要通过服务器进行转发,也即是,第一终端10可以直接向第二终端30发送语音消息。

图1b是本发明实施例提供的另一种语音消息处理系统的示意图,如图1b所示,该系统包括第一终端10和第二终端30,第一终端10和第二终端30可以通过网络进行通信,例如可以通过wifi(wireless-fidelity,无线保真)或蓝牙等的无线局域网进行通信。

第一终端10,用于向第二终端30发送语音消息。

第二终端30,用于接收第一终端10发送的语音消息;获取该语音消息的关键字;在指定会话界面中显示语音消息图标和该语音消息的关键字,该指定会话界面是指第一终端10和第二终端30所在的会话界面,该语音消息图标用于触发播放该语音消息。

接下来,对本发明实施例提供的语音消息处理方法进行详细介绍。

图1c是本发明实施例提供的一种语音消息处理方法的流程图,该方法应用于上述图1a所示的语音消息处理系统中。参见图1c,该方法包括:

步骤101:第一终端基于登录的第一账号向服务器发送语音消息发送请求,该语音消息发送请求携带语音消息和第二账号信息。

其中,该语音消息发送请求用于请求服务器将该语音消息转发给第二账号。第一账号是指第一终端登录的用于发送语音消息的账号,第二账号是指第二终端登录的用于接收语音消息的账号。

其中,第二账号信息用于指示第二账号,第二账号是指该语音消息的接收账号。具体地,第二账号信息可以为第二账号的标识,或者第一账号所在群组的标识。其中,第二账号的标识可以为第二账号的名称或id(identification,身份标识号)等,该群组的标识可以为群组的名称或id等。

例如,当第一账号在单人会话中发送语音消息时,第二账号信息可以为该单人会话中接收方账号的标识,即第二账号的标识。当第一账号在群组会话中发送语音消息时,第二账号信息可以为第一账号所在群组的标识,以通过该群组的标识指示第二账号,相应地,第二账号是指该群组的群组成员中除该第一账号之外的其他账号。

其中,第一终端可以在基于登录的第一账号检测到语音发送指令时,向服务器发送语音消息发送请求。该语音发送指令可以由用户通过指定操作触发,该指定操作可以为在第一终端的会话界面中点击语音发送按选项的操作,或者为按压录音选项录制语音之后,松开录音选项的操作等。其中,该录音选项用于录制用户的语音,并触发发送录制得到的语音消息。实际应用中,该录音选项的名称可以为“按住说话”选项,当然也可以为其他名称,本发明实施例对此不做限定。

进一步地,第一终端还可以基于安装的消息应用向服务器发送语音消息发送请求,相应地,该第一账号是指用户在该消息应用中登录的账号。其中,该消息应用是指能够支持收发语音消息的应用,例如可以为即时通信应用或社交软件应用等。

以第一终端安装即时通信应用,并在即时通信应用中登录第一账号为例,参见图1d,第一终端可以根据用户在即时通信应用中的操作,进入如图1d所示的第一账号与第二账号之间的会话界面。该会话界面可以用于收发语音消息或文字消息。当该会话界面切换至收发语音消息时,可以在会话界面底部显示“按住说话”选项。当用户想要发送语音消息时,可以按住该“按住说话”选项,并对着麦克风说话,说完话之后可以通过松开该“按住说话”选项,触发该第一终端向服务器发送语音消息发送请求,以通过服务器将语音消息转发给第二账号。

步骤102:服务器接收第一终端发送的语音消息发送请求,获取该语音消息的关键字。

服务器接收到第一终端发送的语音消息发送请求之后,可以获取该语音发送请求携带的语音消息和第二账号信息,然后对该语音消息进行处理,得到该语音消息的关键字。

其中,该语音消息的关键字用于对该语音消息进行概括的描述,能够指示该语音消息的关键内容。例如,若语音消息为“晚上一起去吃饭吧”,则该语音消息的关键字可以为“晚上吃饭”。

具体地,获取该语音消息的关键字包括:将该语音消息转换成文本;对该语音消息进行关键字提取,得到该语音消息的关键字。

其中,将该语音消息转换成文本是指将语音形式的消息内容转换为文本形式的消息内容。具体地,可以通过预设的语音转换模型,将该语音消息转换成文本,该语音消息转换模型是指预先训练的能够将语音转换成文本的模型。例如,可以将该语音消息作为该语音转换模型的输入,通过该语音转换模型对该语音消息进行处理,输出得到对应的文本。

本发明实施例中,可以采用预设的关键字提取策略,对该文本进行关键字提取,得到该语音消息的关键字。其中,该关键字提取策略可以为基于训练集的关键字提取策略,或者为不需要训练集的关键字提取策略。

基于训练集的关键字提取策略是指将关键字提取视为分类问题,通过将文本中出现的词语划分为关键字类别或非关键字类别,再从属于关键字类别的词语中选择若干词语作为关键字。例如,可以先对该文本进行分词处理,得到多个分词,然后通过指定分类模型对该多个分词进行分类,确定该多个分词中的每个词是属于关键字类别,还是属于非关键字类别,并将该多个分词中属于关键字类别的分词,确定为该语音消息的关键字。其中,该指定分类模型可以预先根据多个关键字和多个非关键字进行训练得到。

不需要训练集的关键字提取策略可以包括:基于统计的算法,如频率统计;基于词同现图的算法,如keygraph(词语图);基于词语网络的算法,如基于中介性指标的词语网络关键字提取算;以及基于swn(smallworldnetwork,小世界网络)的算法等。

其中,基于统计的算法,是指统计文本中每个词语出现的频率,选取频率超过一定阈值的词语作为关键字。基于词同现图的算法,是指将文本的词语和对应的语义关系映射到词共现图,该词共现图可以包括n个顶点,然后利用该词共现图计算每个顶点的key值,从该n个顶点中选择key值大于一定阈值的顶点,或者按照key值大小排序的前m个顶点,将选择的顶点对应的词语确定为关键字,key值的大小代表对应顶点的重要性。基于词语网络的算法,是指将文本中的词语映射为顶点,将文本的语义映射为边,以建立包含n个顶点的无向词语网络,然后利用顶点重要性的度量指标量化各个顶点的重要程度,并从n个顶点中选择多个重要顶点,将选择的重要顶点对应的词语作为关键字。基于swn的算法,是指将文本的词语和对应的语义关系映射到文档结构图,然后从该文本的词语中提取对该文档结构图的小世界特征其关键作用的词语,将提取的词语作为关键字。

在一个实施例中,对该语音消息进行关键字提取,得到该语音消息的关键字可以包括:通过对该文本进行分词和语义分析,提取该文本的关键字,然后将提取的关键字确定为该语音消息的关键字。

进一步,由于文本的主语、谓语和宾语通常能够指示文本的关键内容,能够对文本进行概括的描述,因此为了简化关键字提取算法,还可以从文本中提取主谓宾关键字,将提取的主谓宾关键字作为该语音消息的关键字。

具体地,对该文本进行关键字提取,得到该语音消息的关键字还可以包括:通过对该文本进行分词和语义分析,提取该文本的主谓宾关键字;将提取的主谓宾关键字确定为该语音消息的关键字。

其中,通过对该文本进行分词和语义分析,提取该文本的主谓宾关键字可以包括:对该文本进行分词和语义分析,得到分析结果,该分析结果包括该文本中每个词语的词性标注,词性标注用于指示每个词语的词性,比如名词、代词或动词等;根据该分析结果,确定该文本的主谓宾关键字。

其中,主谓宾关键字是指该文本包括的主语、谓语和宾语,具体可以包括主语、谓语和宾语中的至少一个。本领域人员可以理解,当该文本仅包括主语和谓语,不包括宾语时,该主谓宾关键字是指该文本的主语和谓语;当该文本仅包括主语和宾语,不包括谓语时,该主谓宾关键字是指该文本的主语和宾语;同理类推。具体地,可以先对该文本进行分词处理,得到多个词语,然后通过对该文本进行语义分析,从该多个词语中提取出主谓宾关键字,将提取的主谓宾关键字确定为该语音消息的关键字。

进一步地,为了减小服务器的处理负担,该服务器还可以将该语音消息发送给专门的语言处理服务器,由该语言处理服务器对该语音消息进行处理,得到该语音消息的关键字,然后将该语音消息的关键字返回给该服务器。或者,服务器先将语音消息转换成文本,然后将该文本发送给专门的语言处理服务器,由该语言处理服务器对该文本进行关键字提取,得到该语音消息的关键字,然后将该语音消息的关键字返回给该服务器。或者,服务器先将语音消息转换成文本,然后将该文本发送给专门的语言处理服务器,由该语言处理服务器对该文本进行分词和语义分析,得到分析结果,然后将该分析结果返回给该服务器,由服务器根据该分析结果确定该语音消息的关键字。

实际应用中,该语言处理服务器可以为第三方提供的语言云服务,语言云服务是指以语言技术平台为基础,能够为用户提供高效精准的中文自然语言处理的云服务。

例如,图1e是本发明实施例提供的又一种语音消息处理系统的示意图,该系统可以包括第一终端10、服务器20、第二终端30和第三方提供的语言云服务40。服务器20接收到第一终端10发送的语音消息之后,可以先将该语音消息转换成文本,然后将该文本发送给语言云服务40,由语言云服务40对该文本进行分词和语义分析,得到分析结果,然后将该分析结果返回给服务器20。服务器20接收到该分析结果之后,可以根据该分析结果确定该语音消息的关键字,然后将该语音消息和该语音消息的关键字一起发送给第二终端30。

进一步地,获取该语音消息的关键字之前,还可以获取该第二账号的关键字配置信息,该关键字配置信息用于指示是否允许对待转发给该第二账号的语音消息进行关键字提取;当确定该第二账号的关键字配置信息指示允许对待转发给该第二账号的语音消息进行关键字提取时,执行获取该语音消息的关键字的步骤。

另外,当确定该第二账号的关键字配置信息指示不允许对待转发给该第二账号的语音消息进行关键字提取时,该服务器还可以不获取该语音消息的关键字,并仅将语音消息发送给登录第二账号的第二终端。

通过先获取第二账号的关键字配置信息,再根据关键字配置信息判断是否需要对待转发给第二账号的语音消息进行关键字提取时,可以利用第二账号的配置信息,对是否需要对语音消息进行关键字提取进行灵活控制,如此可以提高语音消息处理的灵活性,减小服务器的处理负担。

其中,第二账号的关键字配置信息可以包括关键字配置标志,该关键字配置标志可以为第一配置标志或第二配置标志。第一配置标志用于指示允许对待转发给该第二账号的语音消息进行关键字提取,第二配置标志用于指示不允许对待转发给该第二账号的语音消息进行关键字提取。示例的,第一配置标志为0,第二配置标志为1;或者,第一配置标志为1,第二配置标志为0。

其中,第二账号的关键字配置信息可以由登录该第二账号的第二终端向该服务器发送得到。服务器接收到第二账号的关键字配置信息之后,可以先将该第二账号的关键字配置信息存储在数据库中,当接到待发送给第二账号的语音消息时,再从数据库中读取该第二账号的关键字配置信息,并根据该第二账号的关键字配置信息,判断是否需要对该语音消息进行关键字提取。

实际应用中,服务器可以在数据库中存储每个账号的关键字配置信息,而且可以根据任一账号发送的关键字配置信息更新消息,对该账号的关键字信息进行更新。例如,服务器可以在数据库中存储每个账号的设置表(setting.db),该设置表中包括对应账号的关键字配置信息。实际应用中,服务器可以根据任一账号发送的关键字配置信息更新消息,对该账号的设置表中存储的关键字配置信息进行更新。

其中,第二账号的关键字配置信息可以由第二终端进行设置,且可以根据用户在该第二终端的操作进行设置,具体设置方法请参考下述步骤104中的相关描述,本步骤不做详细赘述。

步骤103:服务器基于第二账号信息,将该语音信息和该语音消息的关键字发送给登录第二账号的第二终端。

服务器可以根据该第二账号信息,确定该第二账号信息指示的第二账号,以便将该第二账号作为语音消息的接收账号,将该语音信息和该语音消息的关键字一起发送给登录该第二账号的第二终端。

例如,当该第二账号信息为第一账号所在群组的标识时,可以将该群组的群组成员中除该第一账号之外的其他账号确定为第二账号,并将该语音信息和该语音消息的关键字分别发送给该群组成员中除该第一账号之外的每个账号。

步骤104:第二终端接收服务器发送的语音信息和该语音消息的关键字,在指定会话界面中显示语音消息图标和该语音消息的关键字。

其中,该指定会话界面是指包括第一账号和第二账号的会话界面,具体可以为第一账号和第二账号之间的单人会话界面,也可以为第一账号和第二账号所在的群组会话界面。

其中,该语音消息图标用于指示该语音消息,且可以用于触发播放该语音消息。具体地,该语音消息图标可以为消息框或消息气泡等形式,本发明实施例对该语音消息图标的展示形式不做限定。

进一步地,在该语音消息图标之后还可以显示该语音消息的时长。例如,该语音消息图标可以为图1f所示的语音消息框,且在语音消息框之后还显示有对应语音消息的时长。另外,该语音消息图标指示的语音消息可以为已读语音消息,也可以为未读语音消息,也即是,可以显示已读语音消息的关键字,也可以显示未读语音消息的关键字。

进一步地,可以在指定会话界面中对应显示该语音消息图标和该语音消息的关键字。也即是,可以在该会话界面中,将接收到的每条语音消息的语音消息图标和关键字对应显示,使得用户直观获知显示的关键字属于那条语音消息。

具体地,可以通过在语音消息图标的指定区域内显示该语音消息的关键字,对应显示该语音消息图标和该语音消息的关键字。其中,该语音消息图标的指定区域可以预先设置,具体可以为距离该语音消息图标不远的附近区域。例如,该指定区域可以为该语音消息图标的上方、该语音消息图标的下方、该语音消息图标的后方或该语音消息图标上(该语音图标表面)等,本发明实施例对此不做限定。例如,参见图1f,可以在每个语音消息图标上显示对应语音消息的关键字。

进一步地,还可以在该语音消息图标的指定区域内滚动显示该语音消息的关键字,具体可以在该指定区域内从左到右滚动显示,也可以从右向左滚动显示。例如,可以在该语音消息图标上从左到右或从右向左滚动显示该语音消息的关键字。当然,也可以根据实际需要采用其他形式进行显示,本发明实施例对此不做限定。

进一步地,显示该语音消息的关键字之后,当基于该语音消息图标接收到取消显示关键字的指令时,还可以停止显示该语音消息的关键字。

其中,停止显示该语音消息的关键字可以包括删除该语音消息的关键字,或者隐藏该语音消息的关键字。该取消显示关键字的指令可以由用户通过指定操作触发,该指定操作可以为关闭单条语音消息的关键字显示开关的操作,也可以为关闭所有语音消息的关键字显示开关的操作。

例如,可以在语音消息图标的指定区域内提供第一关键字显示开关,用户可以通过关闭第一关键字显示开关,触发取消显示关键字的指令。示例的,可以在语音消息图标后方显示第一关键字显示开关。

本发明实施例中,可以在每个语音消息图标的指定区域内均提供一个对应的第一关键字显示开关,该第一关键字显示开关用于控制对应语音消息的关键字的显示和关闭。当某个语音消息图标的第一关键字显示开关开启时,表示允许显示对应语音消息的关键字;当某个语音消息图标的第一关键字显示开关关闭时,表示不允许显示对应语音消息的关键字。

进一步地,在显示该语音消息的关键字之前,还可以先判断该语音消息图标对应的第一关键字显示开关是否已开启,当开启时,显示该语音消息的关键字,当未开启时,不显示该语音消息的关键字。

再例如,可以在该指定会话界面中,或者在该指定会话界面的设置菜单中提供第二关键字显示开关,该第二关键字显示开关用于控制该指定会话界面上所有语音消息图标对应语音消息的关键字的显示和关闭。当该第二关键字显示开关开启时,表示允许显示每个语音消息图标对应的语音消息的关键字;当该第二关键字显示开关开启时,表示不允许显示每个语音消息图标对应语音消息的关键字。

进一步地,在显示该语音消息的关键字之前,还可以先判断该指定会话界面的第二关键字显示开关是否已开启,当开启时,显示该语音消息的关键字,当未开启时,则不显示该语音消息的关键字。

进一步地,在显示该语音消息的关键字之后,当基于该语音消息图标接收到播放指令时,还可以不对该播放指令进行响应,即不播放该语音消息。通过这种方式,当显示语音消息的关键字时,可以禁止该语音消息图标触发播放语音消息,使得语音消息的展示方式更加适用于需要保持安静的场景中。当然,显示语音消息的关键字时,也可以不禁止该语音消息图标触发播放语音消息。

进一步地,在显示该语音消息的关键字之后,还可以确定该语音消息的关键字的显示时长,当该显示时长大于或等于预设时长时,停止显示该语音消息的关键字。其中,该预设时长可以预先设置,且可以由终端默认设置,也可以由用户设置。

进一步地,还可以在该指定会话界面中,或者该指定会话界面的设置菜单中提供语音关键字提取开关,该语音关键字提取开关用于设置该第二账号的关键字配置信息。例如,当第二终端检测到语音关键字提取开关开启时,可以向服务器发送第一配置信息,该第一配置信息携带该第二账号信息,用于指示将该第二账号的关键字配置信息中的关键字配置标志更新为第一配置标志,以指示允许对待转发给该第二账号的语音消息进行关键字提取。当第二终端检测到语音关键字提取开关关闭时,可以向服务器发送第二配置信息,该第二配置信息携带该第二账号信息,用于指示将该第二账号的关键字配置信息中的关键字配置标志更新为第二配置标志,以指示不允许对待转发给该第二账号的语音消息进行关键字提取。

以该指定会话界面为即时通信应用的会话界面时,如图1g所示,可以在即时通信应用的通用设置菜单中增加一个语音关键字提取开关,该音关键字提取开关用于对登录该即时通信应用的第二账号的关键字配置信息进行设置。

图1h是本发明实施例提供的一种语音消息处理方法的流程示意图,假设第一终端和第二终端之间通过安装的即时通信应用传输语音消息,且该即时通信应用的设置菜单中包括语音关键字提取开关,该即时通信应用的会话界面中的每条语音消息图标之后显示有第一关键字显示开关,如图1h所示,该方法的实现流程可以包括如下步骤1)-10):

1)用户打开第二终端安装的即时通信应用,进入该即时通信应用的设置菜单,并开启该设置菜单中的语音关键字提取开关。

2)当第二终端检测到该语音关键字提取开关开启时,向服务器发送第一配置信息,该第一配置信息携带第二账号信息,用于指示服务器根据该第一配置信息对存储的该第二账号的关键字配置信息进行更新。

其中,该第二账号信息用于指示登录该即时通信应用的第二账号。

具体地,服务器可以根据该第一配置信息,将存储的该第二账号的关键字配置信息中的关键字配置标志设置为第一配置标志,该第一配置标志用于指示该允许对待转发给该第二账号的语音消息进行关键字提取。

3)服务器接收待转发给第二账号的语音消息。

4)服务器读取该第二账号的关键字配置信息,根据该关键字配置信息判断是否允许对待转发给该第二账号的语音消息进行关键字提取。

5)当根据该关键字配置信息,确定允许对待转发给该第二账号的语音消息进行关键字提取时,服务器获取该语音消息的关键字。

6)服务器将该语音消息和该语音消息的关键字一起发送给登录该第二账号的第二终端。

7)第二终端接收服务器发送的语音消息和该语音消息的关键字,在指定会话界面中显示语音消息图标,并在该语音消息图标上显示该语音消息的关键字。

8)用户查看该语音消息的关键字。

9)用户通过打开或关闭该语音消息图标后方的第一关键字显示开关,控制该语音消息的关键字的显示或关闭。

本发明实施例中,服务器接收到第一终端发送的语音消息之后,可以先获取该语音消息的关键字,然后将该语音消息和该语音消息的关键字一起发送给第二终端,使得第二终端在会话界面上显示语音消息图标时,还可以显示该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

图2是本发明实施例提供的另一种语音消息处理方法的流程图,该方法应用于上述图1a所示的语音消息处理系统中。参见图2,该方法包括:

步骤201:第一终端基于登录的第一账号向服务器发送语音消息发送请求,该语音消息发送请求携带语音消息和第二账号信息。

其中,步骤201的具体实现过程可以参考上述图1c实施例中步骤101的相关描述,本发明实施例在此不再赘述。

步骤202:服务器接收第一终端发送的语音消息发送请求,基于第二账号信息,将该语音信息发送给登录第二账号的第二终端。

其中,服务器向第二终端转发语音消息的方式,与上述图1c实施例中步骤103所述的转发方式基本相同,不同之处在于,上述图1c实施例中服务器在向第二终端发送语音消息之前,还需要对该语音消息进行关键字提取,并需要将语音消息的关键字和该语音消息一起发送给第二终端,而本步骤中服务器只需要向第二终端转发语音消息,不需要对该语音消息进行关键字提取。

步骤203:第二终端接收服务器发送的语音信息,获取该语音消息的关键字。

其中,步骤203的实现方式可以参考上述图1c实施例中步骤102的实现方法,不同之处仅在于,步骤203的执行主体是第二终端,而步骤102的执行主体是服务器。

具体地,获取该语音消息的关键字可以包括:将该语音消息转换为文本;通过对该文本进行分词和语义分析,提取该文本的关键字;将提取的关键字确定为该语音消息的关键字。

进一步地,获取该语音消息的关键字之前,还可以先获取该第二账号的关键字配置信息,该关键字配置信息用于指示是否允许对待转发给该第二账号的语音消息进行关键字提取;当确定该第二账号的关键字配置信息指示允许对待转发给该第二账号的语音消息进行关键字提取时,执行获取该语音消息的关键字的步骤。

步骤204:第二终端在指定会话界面中显示语音消息图标和该语音消息的关键字。

其中,该指定会话界面是指包括第一账号和第二账号的会话界面,该语音消息图标用于触发播放该语音消息。

其中,步骤204的具体实现过程可以参考上述图1c实施例中步骤104的相关描述,本发明实施例在此不再赘述。

具体地,显示该语音消息的关键字可以包括:在该语音消息图标的指定区域内滚动显示该语音消息的关键字。

进一步地,显示该语音消息的关键字之后,当基于该语音消息图标接收到取消显示关键字的指令时,还可以停止显示该语音消息的关键字。

进一步地,显示该语音消息的关键字之后,还可以确定该语音消息的关键字的显示时长,当该显示时长大于或等于预设时长时,停止显示该语音消息的关键字。

本发明实施例中,第二终端在接收到第一终端通过服务器转发的语音消息之后,可以先获取该语音消息的关键字,然后在会话界面上显示语音消息图标和该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

图3是本发明实施例提供的又一种语音消息处理方法的流程图,该方法应用于上述图1b所示的语音消息处理系统中。参见图3,该方法包括:

步骤301:第一终端向第二终端发送语音消息。

其中,第一终端可以通过网络向第二终端发送语音消息,例如可以通过wifi或蓝牙等无线局域网,向第二终端发送语音消息。

步骤302:第二终端接收该语音消息,获取该语音消息的关键字。

其中,步骤302的实现方式可以参考上述图1c实施例中步骤102的实现方法,不同之处仅在于,步骤302的执行主体是第二终端,而步骤102的执行主体是服务器。

具体地,获取该语音消息的关键字可以包括:将该语音消息转换为文本;通过对该文本进行分词和语义分析,提取该文本的关键字;将提取的关键字确定为该语音消息的关键字。

进一步地,获取该语音消息的关键字之前,还可以获取该第二终端的关键字配置信息,该关键字配置信息用于指示是否允许对该第二终端接收的语音消息进行关键字提取;当确定该第二终端的关键字配置信息指示允许对该第二终端接收的语音消息进行关键字提取时,执行获取该语音消息的关键字的步骤。

步骤303:第二终端在指定会话界面中显示语音消息图标和该语音消息的关键字。

其中,该指定会话界面是指第一终端和第二终端所在的会话界面,该语音消息图标用于触发播放该语音消息。

其中,步骤303的具体实现过程可以参考上述图1c实施例中步骤104的相关描述,本发明实施例在此不再赘述。

具体地,显示该语音消息的关键字可以包括:在该语音消息图标的指定区域内滚动显示该语音消息的关键字。

进一步地,显示该语音消息的关键字之后,当基于该语音消息图标接收到取消显示关键字的指令时,还可以停止显示该语音消息的关键字。

进一步地,显示该语音消息的关键字之后,还可以确定该语音消息的关键字的显示时长,当该显示时长大于或等于预设时长时,停止显示该语音消息的关键字。

本发明实施例中,第二终端在接收到第一终端通过服务器转发的语音消息之后,可以先获取该语音消息的关键字,然后在会话界面上显示语音消息图标和该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

图4是本发明实施例提供的一种消息处理装置的结构示意图,该装置应用于服务器中,如图4所示,该装置包括接收模块401,语音处理模块402和发送模块403。

接收模块401,用于接收第一终端基于登录的第一账号发送的语音消息发送请求,所述语音消息发送请求携带语音消息和第二账号信息;

获取模块402,用于获取所述语音消息的关键字;

发送模块403,用于基于所述第二账号信息,将所述语音信息和所述语音消息的关键字发送给登录所述第二账号的第二终端,由所述第二终端在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

可选地,获取模块402具体用于:

将所述语音消息转换成文本;

通过对所述文本进行分词和语义分析,提取所述文本的关键字;

将提取的关键字确定为所述语音消息的关键字。

可选地,所述装置还包括:

获取模块,用于获取所述第二账号的关键字配置信息,所述关键字配置信息用于指示是否允许对待转发给所述第二账号的语音消息进行关键字提取;

触发模块,用于当确定所述第二账号的关键字配置信息指示允许对待转发给所述第二账号的语音消息进行关键字提取时,触发所述获取模块302获取所述语音消息的关键字。

本发明实施例中,服务器接收到第一终端发送的语音消息之后,可以先获取该语音消息的关键字,然后将该语音消息和该语音消息的关键字一起发送给第二终端,使得第二终端在会话界面上显示语音消息图标时,还可以显示该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

图5是本发明实施例提供的另一种消息处理装置的结构示意图,该装置应用于第二终端中,如图5所示,该装置包括接收模块501和显示模块502。

接收模块501,用于基于登录的第二账号接收服务器发送的语音信息和所述语音消息的关键字,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号,所述语音消息的关键字由所述服务器基于所述语音消息获取得到;

显示模块502,用于在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

可选地,所述显示模块502具体用于:

在所述语音消息图标的指定区域内滚动显示所述语音消息的关键字。

可选地,所述装置还包括停止显示模块,所述停止显示模块用于:

当基于所述语音消息图标接收到取消显示关键字的指令时,停止显示所述语音消息的关键字;或者,

确定所述语音消息的关键字的显示时长,当所述显示时长大于或等于预设时长时,停止显示所述语音消息的关键字。

本发明实施例中,第二终端可以接收服务器发送的语音消息和该语音消息的关键字,并可以在会话界面上显示语音消息图标和该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

图6是本发明实施例提供的又一种消息处理装置的结构示意图,该装置应用于第二终端中,如图6所示,该装置包括接收模块601,语音处理模块602和显示模块603。

接收模块601,用于基于登录的第二账号接收服务器发送的语音消息,所述语音消息由登录第一账号的第一终端发送给所述服务器,并指示所述服务器转发给所述第二账号;

获取模块602,用于获取所述语音消息的关键字;

显示模块603,用于在指定会话界面中显示语音消息图标和所述语音消息的关键字,所述指定会话界面是指包括所述第一账号和所述第二账号的会话界面,所述语音消息图标用于触发播放所述语音消息。

可选地,所述获取模块602具体用于:

将所述语音消息转换成文本;

通过对所述文本进行分词和语义分析,提取所述文本的关键字;

将提取的关键字确定为所述语音消息的关键字。

可选地,所述显示模块603具体用于:

在所述语音消息图标的指定区域内滚动显示所述语音消息的关键字。

可选地,所述装置还包括:

获取模块,用于获取所述第二账号的关键字配置信息,所述关键字配置信息用于指示是否允许对待转发给所述第二账号的语音消息进行关键字提取;

触发模块,用于当确定所述第二账号的关键字配置信息指示允许对待转发给所述第二账号的语音消息进行关键字提取时,触发所述获取模块602获取所述语音消息的关键字。

可选地,所述装置还包括停止显示模块,所述停止显示模块用于:

当基于所述语音消息图标接收到取消显示关键字的指令时,停止显示所述语音消息的关键字;或者,

确定所述语音消息的关键字的显示时长,当所述显示时长大于或等于预设时长时,停止显示所述语音消息的关键字。

本发明实施例中,第二终端在接收到第一终端通过服务器转发的语音消息之后,可以先获取该语音消息的关键字,然后在会话界面上显示语音消息图标和该语音消息的关键字。如此,当用户处于不适合收听语音消息的场合时,可以直接通过显示的关键字及时获知语音消息内容,避免了无法及时获知消息的问题。而且,还可以通过在语音消息图标附近显示的关键字,从多个语音消息中快速查找某个特定的语音消息,提高了语音消息的查找效率。

需要说明的是:上述实施例提供的语音消息处理装置在处理语音消息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音消息处理装置与语音消息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图7是本发明实施例提供的一种服务器700的结构示意图。该服务器可以是后台服务器集群中的服务器。具体来讲:

服务器700包括中央处理单元(cpu)701、随机存取存储器(ram)702和只读存储器(rom)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(i/o系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。

基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说,大容量存储设备707可以包括诸如硬盘或者cd-rom驱动器之类的计算机可读介质(未示出)。

不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括ram、rom、eprom、eeprom、闪存或其他固态存储其技术,cd-rom、dvd或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。

根据本发明的各种实施例,服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由cpu执行。所述一个或者一个以上程序包含用于进行上述图1c或图2实施例中服务器执行方法的指令。

在另一实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述图1c或图2实施例中服务器执行的语音消息处理方法。

图8是本发明实施例提供的一种终端800的结构示意图。该终端800可以是:智能手机、平板电脑、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常,终端800包括有:处理器801和存储器802。

处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用dsp(digitalsignalprocessing,数字信号处理)、fpga(field-programmablegatearray,现场可编程门阵列)、pla(programmablelogicarray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(centralprocessingunit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有gpu(graphicsprocessingunit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括ai(artificialintelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中上述图1c、图2或图3实施例中的第一终端或第二终端执行的语音消息处理方法。

在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、触摸显示屏805、摄像头806、音频电路807、定位组件808和电源809中的至少一种。

外围设备接口803可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。

射频电路804用于接收和发射rf(radiofrequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wirelessfidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括nfc(nearfieldcommunication,近距离无线通信)有关的电路,本申请对此不加以限定。

显示屏805用于显示ui(userinterface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用lcd(liquidcrystaldisplay,液晶显示屏)、oled(organiclight-emittingdiode,有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtualreality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。

定位组件808用于定位终端800的当前地理位置,以实现导航或lbs(locationbasedservice,基于位置的服务)。定位组件808可以是基于美国的gps(globalpositioningsystem,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3d动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或触摸显示屏805的下层。当压力传感器813设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时,由处理器801根据用户对触摸显示屏805的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商logo时,指纹传感器814可以与物理按键或厂商logo集成在一起。

光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制触摸显示屏805的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏805的显示亮度;当环境光强度较低时,调低触摸显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。

接近传感器816,也称距离传感器,通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时,由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

在另一实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现上述图1c、图2或图3实施例中的第一终端或第二终端执行的语音消息处理方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1