语音交互方法、装置和终端与流程

文档序号:12470060阅读:275来源:国知局
语音交互方法、装置和终端与流程

本发明涉及智能电视,尤其涉及一种语音交互方法、装置和终端。



背景技术:

随着语音识别技术的发展和应用,语音识别应用在了各类终端和设备上,使用自然语言进行人机交互已经成为智能化设备的明显标志。随着自然语言交互的应用,对于语音识别的效果的要求也越来越高。

现有技术中,用户在终端上输入了语音之后,终端可以对语音进行语音识别,进而终端将语音转换为文字之后,为用户提供与语音对应的服务和显示效果。

然而现有技术中,语音识别的过程受到了方言、环境噪音等多方面的影响,用户输入的语音并不完整,终端无法根据不完整的语音为用户提供相应的服务,进而影响了采用自然语言进行人机交互的效果,降低了用户体验。



技术实现要素:

本发明提供一种语音交互方法、装置和终端,用以解决现有技术中终端无法根据不完整的语音为用户提供相应的服务,进而影响了采用自然语言进行人机交互的效果,降低了用户体验的问题。

本发明的一方面是提供一种语音交互方法,包括:

将接收到的语音信息转换为文本信息;

根据预设的垂直领域业务定位依赖关系库,确定所述文本信息是否包括业务中心词,其中,所述垂直领域业务定位依赖关系库中包括各业务对应的业务中心词;

确定所述文本信息不包括业务中心词时,根据所述垂直领域业务定位依赖关系库和预设的记忆知识库,确定所述文本信息的关键词对应的业务中心词;

将所述文本信息的关键词对应的业务中心词补充到所述文本信息中,以确定补全后的文本信息。

本发明的另一方面是提供一种语音交互装置,包括:

处理模块,用于将接收到的语音信息转换为文本信息;

确定模块,用于根据预设的垂直领域业务定位依赖关系库,确定所述文本信息是否包括业务中心词,其中,所述垂直领域业务定位依赖关系库中包括各业务对应的业务中心词;

挖掘模块,用于确定所述文本信息不包括业务中心词时,根据所述垂直领域业务定位依赖关系库和预设的记忆知识库,确定所述文本信息的关键词对应的业务中心词;

补充模块,用于将所述文本信息的关键词对应的业务中心词补充到所述文本信息中,以确定补全后的文本信息。

本发明的又一方面是提供一种终端,所述终端上设置有如上任一项所述的语音交互装置。

本实施例的语音交互方法,根据垂直领域业务定位依赖关系库确定文本信息是否缺失的业务中心词,当确定文本信息缺少业务中心词时,进而进行垂直领域业务定位依赖关系库和上下文信息挖掘,基于上下文的分析结果确定文本信息缺失的业务中心词,进而将该业务中心词补充到该文本信息中。因此,本实施例的语音交互方法,可以将文本信息进行补全,使得终端可以根据补全后的文本信息为用户提供相应的服务,提高了采用自然语言进行人机交互的效果,提升了用户体验;同时,可以结合采用自然语言进行人机交互过程中的上下文场景,进行文本信息的分析,找出文本信息中的缺失信息,进而补全该文本信息,可以准确的理解用户的语音信息,避免了终端对于用户语音信息的理解偏差和歧义。

附图说明

图1为本发明实施例一提供的语音交互方法的流程图;

图2为本发明实施例二提供的语音交互方法的流程图;

图3为本发明实施例三提供的语音交互方法的流程图;

图4为本发明实施例四提供的语音交互装置的结构示意图;

图5为本发明实施例五提供的语音交互装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在对本发明实施例进行详细的解释说明之前,先对本发明实施例的应用场景予以介绍。本发明实施例提供的语音交互方法应用于终端中,该终端至少配置有语音交互功能,可以通过该终端进行语音信息的输入,采用自然语言进行人机交互。示例的,该终端可以为智能手机、智能电视、高清机顶盒、平板电脑、笔记本电脑、超级移动个人计算机(英文:Ultra-mobile Personal Computer,简称:UMPC)、上网本、个人数字助理(英文:Personal Digital Assistant,简称:PDA)等终端;同时,该终端内配置的语音交互功能可以通过安装在该终端内的具有语音交互功能的应用软件实现,比如语音助手等应用软件。

本发明提供的方法应适应于各类操作系统,如适用于Windows系统、Android系统等等;示例的,本发明实施例提供的方法可以应用于具有Windows系统的平板电脑、笔记本电脑、超级移动个人计算机、上网本等终端,还可以应用于具有Android系统的智能手机、智能电视等终端。

本发明人提供的装置、终端可以采用现有的操作系统的任意一种,例如可以采用Windows系统、安卓系统等等,本发明实施例对此不作限定。

图1为本发明实施例一提供的语音交互方法的流程图,如图1所示,本实施例的方法,包括:

步骤101、将接收到的语音信息转换为文本信息。

在本实施例中,具体的,用户可以直接或间接在终端中输入语音信息,从而终端接收到用户输入的语音信息,然后终端将语音信息转化为文本信息。

举例来说,用户在终端中输入语音信息“我想看电影”,终端可以接收并去检测语音信息“我想看电影”,并将该语音信息转换为文本信息。

步骤102、根据预设的垂直领域业务定位依赖关系库,确定文本信息是否包括业务中心词,其中,垂直领域业务定位依赖关系库中包括各业务对应的业务中心词。

其中,步骤102的具体实现方式为:

对文本信息进行分词处理,确定文本信息的关键词;

根据预设的垂直领域业务定位依赖关系库,确定关键词中是否包括业务中心词,其中,垂直领域业务定位依赖关系库中包括各业务对应的业务中心词。

在本实施例中,具体的,对步骤101生成的文本信息进行分词处理,进而去检测文本信息,可以确定出文本信息的关键词。然后,根据预设的垂直领域业务定位依赖关系库,去确定文本信息的关键词中是否包括业务中心词。

具体来说,首先需要构建起一个垂直领域业务定位依赖关系库,其中,垂直领域是相对水平领域而言的;在水平领域中通常包含大而全的通用信息,但是水平领域不能针对特定领域去提供具体信息;但是,垂直领域的注意力集中在某些特定的领域或某种特定的需求,进而提供有关这个领域或需求的全部深度信息和相关服务。垂直领域业务定位依赖关系库的构建包含以下几步:首先,创建包含所有支持业务的垂直领域业务数据库,其中垂直领域业务数据库所支持的业务为影视方面的业务、自然科学方面的业务、社会科学方面的业务等等;各类业务具有各自的多个业务中心词,将各类业务的各业务中心词以结构化形式存储到垂直领域业务数据库中,同时,各类业务具有多个关键词,将关键词也存储到垂直领域业务数据库中;对垂直领域业务数据库中各关键词以及各业务中心词进行进一步的处理,从而将每一个关键词与至少一个业务中心词进行对应,进而建立起关键词与业务中心词之间的依赖关系。

在用户向终端中输入语音信息之后,终端可以将语音信息转换为文本信息,然后对转换后的文本信息进行分词处理;接着,终端基于预设的垂直领域业务定位依赖关系库,根据垂直领域业务定位依赖关系库中包括的各关键词,确定在文本信息中是否包含有垂直领域业务定位依赖关系库中的关键词。若终端确定在语音信息中包含有垂直领域业务定位依赖关系库中的关键词,接着就基于垂直领域业务定位依赖关系库以及文本信息中的关键词,根据垂直领域业务定位依赖关系库中包括的各业务中心词,确定文本信息中的关键词中,是否具有业务中心词,若具有,则终端可以确定当前的文本信息是完整的,若不具有,则终端可以确定当前的文本信息是不完整的,不足以定位当前语音所请求的业务的场景。若终端确定在文本信息中不包含有垂直领域业务定位依赖关系库中的关键词,则终端可以直接确定当前的文本信息是不完整的,不足以定位当前语音所请求的业务的场景。

举例来说,关键词为电影、电视剧、音乐、歌曲等等,同时这些也是业务中心词,其他的关键词为各业务中心词下的具体实例的名称,刘德华、梁朝伟、胡歌、周迅、孟京辉。

举例来说,文本信息为“我想看刘德华的电影”,终端可以根据垂直领域业务定位依赖关系库,确定在该文本信息中具有关键词“刘德华”、“电影”;然后终端就可以确定关键词“刘德华”、“电影”中是否具有业务中心词,终端可以确定出具有业务中心词“电影”,从而终端确定当前文本信息“我想看刘德华的电影”是完整的,可以确定出用户想查询电影。

再举例来说,文本信息为“我想看刘德华的”,终端可以根据垂直领域业务定位依赖关系库,确定在该文本信息中具有关键词“刘德华”;然后终端就可以确定关键词“刘德华”是否是业务中心词,终端可以确定出具有关键词“刘德华”不是业务中心词,关键词中不具有业务中心词,从而终端确定当前文本信息“我想看刘德华的”是不完整的。

又举例来说,用户输入文本信息“我想看”,终端可以根据垂直领域业务定位依赖关系库,确定在该文本信息中具有不具有任意一个关键词,只具有查询关键词“看”,从而终端可以直接确定当前文本信息“我想看”是不完整的。

从而可以通过构建垂直领域业务定位依赖关系库,对用户输入的语音信息进行垂直搜索,能够快速的定位出文本信息是否完整,进而能够快速定位用户的需求业务。

步骤103、确定文本信息不包括业务中心词时,根据垂直领域业务定位依赖关系库和预设的记忆知识库,确定文本信息的关键词对应的业务中心词。

其中,步骤102提供了两种具体实现方式:

步骤102的第一种具体实现方式为:确定文本信息不包括业务中心词时,根据预设的垂直领域业务定位依赖关系库以及文本信息中的关键词,确定与文本信息中的关键词对应的业务中心词,其中,垂直领域业务定位依赖关系库中还包括每一个关键词与至少一个业务中心词相对应的对应关系;

若与文本信息中的关键词对应的业务中心词的个数为一个,则确定业务中心词为文本信息的关键词对应的业务中心词;

若与文本信息中的关键词对应的业务中心词的个数为至少两个,则根据预设的记忆知识库,确定业务中心词中的一个为文本信息中的关键词对应的业务中心词,其中,记忆知识库中存储有预设时间段内用户输入的各历史语音查询信息、以及与各历史语音查询信息对应的业务中心词。

在实施例中,具体的,在终端确定文本信息不包括业务中心词时,终端可以确定出文本信息是不完整的;终端确定在语音信息中具有关键词,但是在关键词中不具有业务中心词;此时,终端可以根据垂直领域业务定位依赖关系库以及文本信息中的关键词,去确定出与文本信息中的关键词对应的业务中心词,具体的,由于在垂直领域业务定位依赖关系库中存储了每一个关键词与至少一个业务中心词的对应关系,终端可以基于垂直领域业务定位依赖关系库,去查询出文本信息中的关键词与那些业务中心词相对应,进而确定出与文本信息中的关键词对应的业务中心词。

如果终端确定出与文本信息中的关键词对应的业务中心词的个数为一个,那么当前确定出的业务中心词,就是与文本信息中的关键词对应的业务中心词,即将与文本信息中的关键词对应的业务中心词作为待补充信息。

举例来说,用户在终端中输入语音信息“我想看李小龙的”,将该语音信息转换为文本信息“我想看李小龙的”,终端可以基于垂直领域业务定位依赖关系库确定文本信息中具有关键词“李小龙”,然后终端确定关键词“李小龙”不是业务中心词;然后终端可以基于垂直领域业务定位依赖关系库中的关键词与至少一个业务中心词的对应关系,确定出与关键词“李小龙”对应的业务中心词“电影”;此时终端可以确定与关键词“李小龙”对应的业务中心词只有一个,为业务中心词“电影”;从而,终端可以将该业务中心词“电影”,作为与关键词“李小龙”对应的业务中心词。

如果终端确定出与文本信息中的关键词对应的业务中心词的个数为至少两个,此时由于预先构建起了一个记忆知识库,在记忆知识库中存储有预设时间段内用户输入的各历史语音查询信息、以及与各历史语音查询信息对应的业务中心词,从而终端可以根据该记忆知识库,去挖掘出与文本信息对应的业务中心词;然后终端就可以将与文本信息对应的业务中心词,作为待补充信息。具体的,此时在记忆知识库中存储有用户之前输入的各历史语音查询信息以及查询结果这些上文信息业务请求的分析结果,即在记忆知识库中具有用户输入的各历史语音查询信息、以及与各历史语音查询信息对应的业务中心词;根据马尔科夫模型可知,用户的当前文本信息所表征的业务请求,仅与在当前文本信息之前的T个历史语音查询信息所表征的业务请求有关,而与前面的第T+1个历史语音查询信息所表征的业务请求无关,从而记忆知识库可以每隔一段时间就进行清理,从而在记忆知识库中存储的是预设时间段内用户输入的各历史语音查询信息、以及与各历史语音查询信息对应的业务中心词,而历史语音查询信息的个数为T个,同时,各历史语音查询信息在记忆知识库中已经根据时间从近到远的关系进行了排序和存储;其中,预设时间段为当前时刻之前的预设时间长度,T为正整数,T的具体数值根据实际情况而设定,例如T可以选取终端所支持的业务类型的类型个数;从而终端可以在在记忆知识库中,获取出预设时间段内的T个历史语音查询信息、以及与每一个历史语音查询信息对应的业务中心词,其中,T个历史语音查询信息根据时间由近到远的关系而排序;然后,终端就可以对T个历史语音查询信息进行加权处理,可以确定各历史语音查询信息的权重值分别为从而距离当前时间越近的历史语音查询信息的权重值的取值越大,距离当前时间越远的历史语音查询信息的权重值的取值越小;并且,在与历史语音查询信息对应的业务中心词为与文本信息中的关键词对应的业务中心词的时候,Weight=2,而在与历史语音查询信息对应的业务中心词不是与文本信息中的关键词对应的业务中心词的时候,Weight=1,t∈[1,T],t为正整数,从而提高与文本信息中的关键词对应的业务中心词的权重值,充分利用到根据垂直领域业务定位依赖关系库而确定出的可能缺失的业务中心词;然后,终端可以将业务中心词相同的历史语音查询信息划分为同一组,从而可以将各历史语音查询信息划分为n组历史语音查询信息组合,其中n为整数;接着,终端可以将每一个历史语音查询信息组合中的各历史语音查询信息的权重值进行求和,具体的,终端分别统计出各历史语音查询信息组合的组合权重值其中,αij为第j组历史语音查询信息组合中的第i个历史语音查询信息的权重值,m为第j组历史语音查询信息组合中的历史语音查询信息的个数,i∈[1,m],j∈[1,n],i、m、j为正整数;然后,终端可以根据各历史文本查询信息组合对应的组合权重值,确定业务中心词中的一个为文本信息中的关键词对应的业务中心词,具体来说,终端可以将各历史语音查询信息组合的组合权重值进行由大到小的排序,从而确定出组合权重值最大的历史语音查询信息组合;最后,终端就可以确定出与组合权重值最大的历史语音查询信息组合对应的业务中心词,终端可以将与组合权重值最大的历史语音查询信息组合对应的业务中心词,作为与文本信息对应的业务中心词。

举例来说,用户在终端中输入语音信息“我想看周迅的”,终端将语音信息转换为文本信息“我想看周迅的”,终端可以基于垂直领域业务定位依赖关系库确定文本信息中具有关键词“周迅”,然后终端确定关键词“周迅”不是业务中心词;然后终端可以基于垂直领域业务定位依赖关系库中的关键词与至少一个业务中心词的对应关系,确定出与关键词“周迅”对应的业务中心词“电影”、业务中心词“电视剧”、业务中心词“歌曲”;此时终端可以确定与关键词“周迅”对应的业务中心词有三个;从而,终端在记忆知识库中确定出5个历史语音查询信息、以及与每一个历史语音查询信息对应的业务中心词,根据时间由近到远,分别为第一个历史语音查询信息“我想看周星驰的电影”、以及与第一个历史语音查询信息对应的业务中心词“电影”,第二个历史语音查询信息“我想听王菲的歌曲”、以及与第二个历史语音查询信息对应的业务中心词“歌曲”,第三个历史语音查询信息“我想看胡歌的电视剧”、以及与第三个历史语音查询信息对应的业务中心词“电视剧”,第四个历史语音查询信息“我想看岳云鹏的综艺”、以及与第四个历史语音查询信息对应的业务中心词“综艺”,第五个历史语音查询信息“我想看杨颖的综艺”、以及与第五个历史语音查询信息对应的业务中心词“综艺”;然后,终端可以确定第一个历史语音查询信息的权重值为第二个历史语音查询信息的权重值为第三个历史语音查询信息的权重值为第四个历史语音查询信息的权重值为第五个历史语音查询信息的权重值为终端将业务中心词相同的历史语音查询信息划分为同一组,得到第一组历史语音查询信息组合,第一组历史语音查询信息组合中包括第一个历史语音查询信息,第二组历史语音查询信息组合,第二组历史语音查询信息组合中包括第二个历史语音查询信息,第三组历史语音查询信息组合,第三组历史语音查询信息组合中包括第三个历史语音查询信息,第四组历史语音查询信息组合,第四组历史语音查询信息组合中包括第四个历史语音查询信息和第五个历史语音查询信息;然后就可以计算出第一组历史语音查询信息组合的组合权重值Acom1=2,第二组历史语音查询信息组合的组合权重值Acom2=1,第三组历史语音查询信息组合的组合权重值第四组历史语音查询信息组合的组合权重值从而终端可以确定出组合权重值最大的历史语音查询信息组合为第一组历史语音查询信息组合,而第一组历史语音查询信息组合的业务中心词为“电影”,终端可以确定出与文本信息对应的业务中心词为“电影”。

步骤103的第二种具体实现方式为:对文本信息进行信息处理,以确定文本信息中的查询关键词;

根据记忆知识库中查询关键词与业务中心词的对应关系,确定与查询关键词对应的业务中心词。

在本实施例中,具体的,在终端确定出当前文本信息不完整的时候,若此时终端确定的是在文本信息中的词语没有垂直领域业务定位依赖关系库中的关键词,终端可以对文本信息进行信息处理,从而确定出语音信息的查询关键词,查询关键词为一种查询句式。

可以预先构建起一个预设的记忆知识库,在记忆知识库中存储有查询句式与业务中心词的对应关系;从而在记忆知识库中可以存储一些用户经常使用的一些查询句式与业务中心词的对应关系,从而将查询句式与业务场景进行了关联;中可以根据各查询句式与业务中心词的对应关系,确定与文本信息的查询关键词对应的业务中心词,进行当前业务场景的识别,从而判断出当前用户的业务需求;然后终端就可以将与文本信息的查询关键词对应的业务中心词,作为待补充信息。

举例来说,在记忆知识库中存储有查询句式“我想看”、“我想听”、“我想查”等等,其中,“我想看”与业务中心词“电影”、“电视剧”相对应,“我想听”与业务中心词“歌曲”相对应,“我想查”与业务中心词“百科”相对应;用户输入语音信息“我现在想听”之后,终端可以根据垂直领域业务定位依赖关系库确定语音信息“我现在想听”中不具有业务中心词;终端可以确定出当前文本信息的查询关键词为“我想听”;从而终端根据记忆知识库,可以确定与“我想听”对应的业务中心词为“歌曲”,进而将与“我想听”对应的业务中心词为“歌曲”,作为待补充信息。

步骤104、将文本信息的关键词对应的业务中心词补充到文本信息中,以确定补全后的文本信息。

在本实施例中,具体的,在确定出了文本信息的关键词对应的业务中心词之后,文本信息的关键词对应的业务中心词可以作为待补充信息,终端就可以将待补充信息补充到文本信息中,从而确定出补全后的文本信息。

举例来说,确定出文本信息的关键词对应的业务中心词为“电视剧”,从而将业务中心词“电视剧”补充到文本信息“我想看周迅的”中去,构成补全后的文本信息“我想看周迅的电视剧”。

再举例来说,确定出文本信息的关键词对应的业务中心词为“歌曲”,从而将业务中心词“歌曲”补充到文本信息“我想听胡歌的”中去,构成补全后的文本信息“我想听胡歌的歌曲”。

本实施例的语音交互方法,通过将接收到的语音信息转换为文本信息,根据预设的垂直领域业务定位依赖关系库,确定文本信息不包括业务中心词时,根据垂直领域业务定位依赖关系库和预设的记忆知识库,确定文本信息的关键词对应的业务中心词,进而根据该业务中心词补充到文本信息中。本实施例的语音交互方法,根据垂直领域业务定位依赖关系库确定文本信息是否缺失的业务中心词,当确定文本信息缺少业务中心词时,进而进行垂直领域业务定位依赖关系库和上下文信息挖掘,基于上下文的分析结果确定文本信息缺失的业务中心词,进而将该业务中心词补充到该文本信息中。因此,本实施例的语音交互方法,可以将文本信息进行补全,使得终端可以根据补全后的文本信息为用户提供相应的服务,提高了采用自然语言进行人机交互的效果,提升了用户体验。同时,可以结合采用自然语言进行人机交互过程中的上下文场景和关联场景,进行文本信息的分析,找出文本信息中的缺失信息,进而补全该文本信息,可以准确的理解用户的语音信息,避免了终端对于用户语音信息的理解偏差和歧义。

图2为本发明实施例二提供的语音交互方法的流程图,在实施例一的基础上,如图2所示,本实施例的方法,在步骤104之后,还包括:

步骤201、根据补全后的文本信息,确定与补全后的文本信息对应的交互结果,并显示交互结果。

在本实施例中,具体的,在步骤104之后,终端在确定出了补全后的文本信息之后,终端就可以确定出与补全后的文本信息对应的交互结果,然后显示该交互结果。

举例来说,终端在确定出了补全后的文本信息“我想看周迅的电影”,终端就可以依据该补全后的文本信息进行查询,确定用户需要查看与关键词“周迅”对应的电影业务,然后终端进行智能查询之后,查询到交互结果“风声”、“云图”、“画皮”、“龙门飞甲”等等,终端可以在终端的界面上显示出交互结果“风声”、“云图”、“画皮”、“龙门飞甲”等等各方面的信息。

图3为本发明实施例三提供的语音交互方法的流程图,上述实施例的基础上,如图3所示,本实施例的方法,还包括:

步骤301、确定文本信息中包括业务中心词时,确定与文本信息对应的交互结果,并显示交互结果。

在本实施例中,具体的,终端基于垂直领域业务定位依赖关系库,确定文本信息中的关键词中具有业务中心词,终端可以确定文本信息完整;从而终端可以直接查询与文本信息对应的交互结果,然后去显示该交互结果。

举例来说,用户输入语音信息“我想看梁朝伟的电影”,终端将该语音信息转换为文本信息“我想看梁朝伟的电影”,终端可以根据垂直领域业务定位依赖关系库,确定在该文本信息中具有关键词“梁朝伟”、“电影”;然后终端就可以确定关键词“梁朝伟”、“电影”中是否具有业务中心词,终端可以确定出具有业务中心词“电影”,从而终端确定当前文本信息“我想看梁朝伟的电影”是完整的,可以确定出用户想查询电影;然后,终端就可以依据该文本信息进行查询,确定用户需要查看与关键词“梁朝伟”对应的电影业务,然后终端进行智能查询之后,查询到交互结果“无间道”、“韩城攻略”、“2046”、“赤壁”等等,终端可以在终端的界面上显示出交互结果“无间道”、“韩城攻略”、“2046”、“赤壁”等等各方面的信息。

图4为本发明实施例四提供的语音交互装置的结构示意图,如图4所示,本实施例提供的语音交互装置,包括:

处理模块41,用于将接收到的语音信息转换为文本信息;

确定模块42,用于根据预设的垂直领域业务定位依赖关系库,确定文本信息是否包括业务中心词,其中,垂直领域业务定位依赖关系库中包括各业务对应的业务中心词;

挖掘模块43,用于确定文本信息不包括业务中心词时,根据垂直领域业务定位依赖关系库和预设的记忆知识库,确定文本信息的关键词对应的业务中心词;

补充模块44,用于将文本信息的关键词对应的业务中心词补充到文本信息中,以确定补全后的文本信息。

确定模块42,具体用于:

对文本信息进行分词处理,确定文本信息的关键词;

根据预设的垂直领域业务定位依赖关系库,确定关键词中是否包括业务中心词,其中,垂直领域业务定位依赖关系库中包括各业务对应的业务中心词。

挖掘模块43,包括:

确定子模块431,用于根据预设的垂直领域业务定位依赖关系库以及文本信息中的关键词,确定与文本信息中的关键词对应的业务中心词,其中,垂直领域业务定位依赖关系库中还包括每一个关键词与至少一个业务中心词相对应的对应关系;

第一分析子模块432,用于若与文本信息中的关键词对应的业务中心词的个数为一个,则确定业务中心词为文本信息的关键词对应的业务中心词;

第二分析子模块433,用于若与文本信息中的关键词对应的业务中心词的个数为至少两个,则根据预设的记忆知识库,确定业务中心词中的一个为文本信息中的关键词对应的业务中心词,其中,记忆知识库中存储有预设时间段内用户输入的各历史语音查询信息、以及与各历史语音查询信息对应的业务中心词。

第二分析子模块433,具体用于:

若与文本信息中的关键词对应的业务中心词的个数为至少两个,则在记忆知识库中,确定预设时间段内的T个历史文本查询信息、以及与每一个历史文本查询信息对应的业务中心词,其中,T个历史文本查询信息根据时间由近到远的关系而排序,预设时间段为当前时刻之前的预设时间长度,T为正整数;

确定各历史文本查询信息的权重值分别为其中,在与历史文本查询信息对应的业务中心词为与文本信息中的关键词对应的业务中心词时,Weight=2,在与历史文本查询信息对应的业务中心词不是与文本信息中的关键词对应的业务中心词时,Weight=1,t∈[1,T],t为正整数;

将业务中心词相同的历史文本查询信息划分为同一组,以将各历史文本查询信息划分为n组历史文本查询信息组合,其中n为整数;

根据各历史文本查询信息的权重值,分别统计各历史文本查询信息组合的组合权重值其中,αij为第j组历史文本查询信息组合中的第i个历史文本查询信息的权重值,m为第j组历史文本查询信息组合中的历史文本查询信息的个数,i∈[1,m],j∈[1,n],i、m、j为正整数;

根据各历史文本查询信息组合对应的组合权重值,确定业务中心词中的一个为文本信息中的关键词对应的业务中心词。

或者,挖掘模块43,具体用于:

对文本信息进行信息处理,以确定文本信息中的查询关键词;

根据记忆知识库中查询关键词与业务中心词的对应关系,确定与查询关键词对应的业务中心词。

本实施例的语音交互装置可执行本发明实施例一提供的语音交互方法,其实现原理相类似,此处不再赘述。

本实施例的语音交互装置,通过将接收到的语音信息转换为文本信息,根据预设的垂直领域业务定位依赖关系库,确定文本信息不包括业务中心词时,根据垂直领域业务定位依赖关系库和预设的记忆知识库,确定文本信息的关键词对应的业务中心词,进而根据该业务中心词补充到文本信息中。本实施例的语音交互方法,根据垂直领域业务定位依赖关系库确定文本信息是否缺失的业务中心词,当确定文本信息缺少业务中心词时,进而进行垂直领域业务定位依赖关系库和上下文信息挖掘,基于上下文的分析结果确定文本信息缺失的业务中心词,进而将该业务中心词补充到该文本信息中。因此,本实施例的语音交互方法,可以将文本信息进行补全,使得终端可以根据补全后的文本信息为用户提供相应的服务,提高了采用自然语言进行人机交互的效果,提升了用户体验。同时,可以结合采用自然语言进行人机交互过程中的上下文场景和关联场景,进行文本信息的分析,找出文本信息中的缺失信息,进而补全该文本信息,可以准确的理解用户的语音信息,避免了终端对于用户语音信息的理解偏差和歧义。

图5为本发明实施例五提供的语音交互装置的结构示意图,在实施例四的基础上,如图5所示,本实施例提供的语音交互装置,还包括:

显示模块51,用于在补充模块44将文本信息的关键词对应的业务中心词补充到文本信息中,确定补全后的文本信息,并根据补全后的文本信息确定与补全后的文本信息对应的交互结果时,显示交互结果。

本实施例的语音交互装置可执行本发明实施例二提供的语音交互方法,其实现原理相类似,此处不再赘述。

本发明实施例六提供了一种终端,终端上设置有如上述实施例中提供的语音交互装置。

在本实施例中,具体的,可以在终端上设置有如上述实施例中提供的语音交互装置。

语音交互装置的结构和原理,与上述实施例中提供的语音交互装置的结构和原理相同,此处不再赘述。

本实施例的终端,通过将接收到的语音信息转换为文本信息,根据预设的垂直领域业务定位依赖关系库,确定文本信息不包括业务中心词时,根据垂直领域业务定位依赖关系库和预设的记忆知识库,确定文本信息的关键词对应的业务中心词,进而根据该业务中心词补充到文本信息中。本实施例的语音交互方法,根据垂直领域业务定位依赖关系库确定文本信息是否缺失的业务中心词,当确定文本信息缺少业务中心词时,进而进行垂直领域业务定位依赖关系库和上下文信息挖掘,基于上下文的分析结果确定文本信息缺失的业务中心词,进而将该业务中心词补充到该文本信息中。因此,本实施例的语音交互方法,可以将文本信息进行补全,使得终端可以根据补全后的文本信息为用户提供相应的服务,提高了采用自然语言进行人机交互的效果,提升了用户体验。同时,可以结合采用自然语言进行人机交互过程中的上下文场景和关联场景,进行文本信息的分析,找出文本信息中的缺失信息,进而补全该文本信息,可以准确的理解用户的语音信息,避免了终端对于用户语音信息的理解偏差和歧义。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1