对用户简档的声控管理的制作方法

文档序号:20606332发布日期:2020-05-01 22:07阅读:218来源:国知局
对用户简档的声控管理的制作方法

本实施例总体上涉及管理用户简档,并且具体地涉及对用户简档的声控管理。



背景技术:

在过去的几年中,自动语音识别(asr)算法已进入用户设备领域。这项技术融合使消费者仅使用口头命令就能够对用户设备(例如机顶盒)进行免提控制。除了简单的控制之外,如今,用户还可以与用户设备进行交互,请求与内容相关的信息,执行搜索,以及接收内容推荐。

为了实现用户设备的声音适配,需要在注册会话中对用户的声音进行登记。从用户的角度来看,注册会话是一个麻烦且人为的要求,因为每个用户都必须大声朗读文本来训练算法。

典型的注册会话的另一个问题是,在用户设备的实际操作或使用过程中,它很少能够捕获用户声音的可变性以及声学背景环境的可变性。这直接影响了训练后的算法的可靠性。

us2009/0119103公开了一种自动识别通过输入接收到的语音的方法。该方法访问一个或多个与说话者无关的说话者模型。该方法根据自适应的预定标准来检测接收到的语音输入是否与说话者模型匹配。当基于输入没有匹配发生时,该方法创建指派给说话者模型集合的说话者模型。

wo01/95625公开了一种语音识别的方法和系统,其由来自支持有线电视和/或视频传送的网络内的多个用户站点的后声道呈现。

在声控用户设备的领域中,尤其是在实现对诸如机顶盒之类的用户设备中的用户简档的声控管理方面,仍然需要进行改进。特别需要在没有任何注册会话的情况下实现这种声控用户简档管理。



技术实现要素:

一个总体目标是提供一种适合于在家庭环境中使用的对用户简档的声控管理。

该目的和其他目的由本文公开的实施例来满足。

实施例的一方面涉及一种管理用户简档的方法。该方法包括:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。该方法还包括:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

实施例的另一方面涉及一种管理用户简档的方法。该方法包括:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。该方法还包括:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。该方法还包括:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

实施例的另一方面涉及一种用于管理用户简档的设备。该设备被配置为:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。该设备还被配置为:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

实施例的另一方面涉及一种用于管理用户简档的设备。该设备包括计算模块,该计算模块用于:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。该设备还包括更新模块,该更新模块用于:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

实施例的又一方面涉及一种用于管理用户简档的设备。该设备被配置为:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。该设备还被配置为:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。该设备还被配置为:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

实施例的另一方面涉及一种用于管理用户简档的设备。该设备包括分类模块,该分类模块用于:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。该设备还包括创建模块,该创建模块用于:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。该设备还包括更新模块,针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

实施例的另一方面涉及一种包括指令的计算机程序,该指令当由至少一个处理器执行时,使该至少一个处理器:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。还使至少一个处理器:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

实施例的另一方面涉及一种包括指令的计算机程序,该指令当由至少一个处理器执行时,使至少一个处理器:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。还使至少一个处理器:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。进一步使至少一个处理器:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

实施例的相关方面定义了一种包括根据上述内容的计算机程序的载体。载体是以下各项之一:电子信号、光信号、电磁信号、磁信号、电信号、无线电信号、微波信号、或计算机可读存储介质。

实施例实现了适合于家庭环境的有效的声控用户简档管理。如果可以准确地确定说话者的身份,则实施例可靠地更新用户简档。用户简档的更新和说话者模型的更新在使用期间进行,而不需要任何专用的注册会话。

附图说明

通过参考以下结合附图的描述,可以最好地理解实施例及其进一步的目的和优点,在附图中:

图1是示出根据实施例的管理用户简档的方法的流程图;

图2是示出根据实施例的图1所示的方法的附加可选步骤的流程图;

图3是示出执行说话者分类的实施例的流程图;

图4是示出根据另一实施例的图1所示的方法的附加可选步骤的流程图;

图5是示出根据另一实施例的图1所示的方法的附加可选步骤的流程图;

图6是示出指派用户偏好的实施例的流程图;

图7是根据实施例的更新用户简档的流程图;

图8是示出根据实施例的图1所示的方法的附加可选步骤的流程图;

图9是示出根据另一实施例的管理用户简档的方法的流程图;

图10示意性地示出根据实施例的用于收集用户偏好并更新用户简档和说话者模型的说话者分类方法;

图11示意性地示出管理用户简档的实施例;

图12是根据实施例的用于管理用户简档的设备的示意框图;

图13是根据另一实施例的用于管理用户简档的设备的示意框图;

图14是根据进一步的实施例的用于管理用户简档的设备的示意框图;

图15是基于计算机程序的实施例的实现的示意框图;

图16是根据又一实施例的用于管理用户简档的设备的示意框图;

图17是根据进一步的实施例的用于管理用户简档的设备的示意框图;

图18是示出根据实施例的用户设备的示意框图;以及

图19示意性地示出多个网络设备之间的分布式实现。

具体实施方式

本实施例总体上涉及管理用户简档,并且具体地涉及对用户简档的声控管理。

在用户设备和家庭用户之间的交互向声控用户接口发展的过程中,两种类型的系统是主要的驱动力。一种是理解正在说什么。这是借助于能够实现快速的声控和搜索的自动语音识别(asr)以及后续的自然语言处理(nlp)和自然语言理解(nlu)来实现的。另一种是理解是谁说的,这是借助于说话者识别(sr)来实现的。

具有sr功能的扩展用户设备(例如机顶盒)具有两个主要优点。第一个是使用声音生物识别技术作为备选方案和/或附加安全层,以将对信息和/或服务的访问限制为借助于sr辨识出的被授权用户。第二个是使用用户的声音来进行智能资料收集(profiling),即用户简档管理。由于这些原因,非常需要针对声学环境和家庭成员的声音进行优化的稳健sr。

说话者识别,也称为声音识别,是根据声音特性来辨识说话者。说话者识别使用语音的声学特征,即所谓的说话者模型,已经发现说话者模型在个体之间是不同的。说话者模型既反映了解剖学(例如,声道的大小和形状),又反映了已学习的行为模式(例如,音高和说话风格)。说话者识别过程是模式识别过程。用于处理和存储声纹的各种技术包括:频率估计、隐马尔可夫模型(hmm)、高斯混合模型(gmm)、模式匹配算法、神经网络、矩阵表示、向量量化、以及决策树。

先前的sr解决方案通常使用所谓的注册会话,在注册会话中,每个用户都必须读出预定义的文本来训练sr算法并建立说话者模型。这样的注册会话存在内在的问题,因为它们很少捕获用户声音的可变性。另外,与自由说话相比,大多数用户在大声朗读测试时具有不同的声音特性。注册会话的另一个问题是,注册会话期间的声学环境通常与附近可能有其他说话的家庭成员和其他背景噪声的常规环境不同。除了使用注册会话的这些缺点外,注册会话通常是对用户的麻烦且人为的要求。

本实施例能够在声控情境中实现智能用户信息收集和用户简档管理,而无需注册会话来训练sr算法和建立说话者模型。这是通过不断学习用户的声音(例如基于说话者分类(speakerdiarization))和不断适配用户简档来实现的。通过避免注册会话并且代之以基于用户的声音不断地更新sr算法和说话者模型,由于对声音和声学环境可变性的更加准确的建模,实施例是更加用户友好的并且同时是更稳健的。

该实施例的另一优点在于,可以在后台运行对用户的声音和与那些声音相关联的偏好的学习,并且因此对于用户而言可以是完全不可见的。

图1是示出根据实施例的管理用户简档的方法的流程图。该方法包括:在步骤s2中,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。置信度的计算是针对至少一个说话者模型中的每个说话者模型执行的,这由图中的线l1表示。接下来的步骤s4包括:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

因此,实施例包括针对可用于sr算法、模块或引擎的每个说话者模型计算置信度。然后,每个这样的置信度表示说话者模型代表音频片段簇的说话者或对该说话者进行建模的相应概率。在其他模型中,置信度表示说话者模型对当前正在音频片段簇期间讲话的说话者的声音特性进行建模的概率。

因此,置信度反映将音频片段簇识别为包括特定说话者的语音的可靠性,该特定说话者的声音特性由说话者模型进行建模。

优选地,针对可用于sr算法的每个说话者模型执行步骤s2中的置信度的计算。

接下来的步骤s4包括:基于在步骤s2中计算出的置信度和阈值的比较来执行判定。因此,如果计算出的置信度表示高于目标概率的概率,则在步骤s4中基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

因此,在优选实施例中,与说话者模型相关联的用户简档以及由此对说话者或用户的任何更新的条件是:sr算法可以可靠地识别出说话者,如基于计算出的置信度所确定的以及更详细地基于概率与目标概率的比较所确定的。

用户简档的有条件的更新意味着用户简档将准确地反映用户的真实偏好。因此,目标概率与由计算出的置信度表示的概率之间的比较有效地降低了利用另一用户的偏好来更新给定用户的用户简档的风险。

这进一步意味着随着时间的推移,当不同的用户使用声控来控制用户设备时,越来越多的用户偏好被收集,从而可以自动且可靠地更新不同用户的用户简档,以反映相应用户的真实偏好。

因此,用户简档的这种有条件的更新可以自动运行,而无需注册会话来生成说话者模型,这将在本文进一步描述。

图2是示出图1所示方法的附加可选步骤的流程图。该步骤s1包括:对音频流执行说话者分类,以形成至少一个音频片段簇。然后,每个这样的音频片段簇包括单个说话者的语音。然后,该方法继续进行到图1中的步骤s2。

因此,在说话者分类中处理音频流,以将音频流划分成包括单个说话者的语音的音频片段簇。然后,在步骤s2中,针对每个这样的音频片段簇计算至少一个置信度。

图3是示出执行说话者分类的实施例的流程图。该实施例包括:在步骤s10中,从音频流中检测语音有效片段。接下来的步骤s11包括:检测语音有效片段中的说话者变化点,以形成单个说话者的音频片段。然后,在步骤s12中,对同一说话者的音频片段进行聚类,以形成至少一个音频片段簇。然后,该方法继续进行到图1中的步骤s2。

通常,说话者分类是将输入音频流划分为同质音频片段并基于它们的相似性进一步对这些片段进行分组的过程。同质音频片段是包括单个说话者的语音的音频片段。说话者分类通过将音频流结构化为同质音频片段来增强自动语音转录的可读性。说话者分类是说话者分段和说话者聚类的组合。说话者分段的目的是找到音频流中的说话者变化点,而说话者聚类的目的是基于说话者的特性将音频片段分组在一起。

在说话者分类中,最流行的方法之一是使用gmm对每个说话者建模,并在hmm的帮助下为每个说话者指派对应的音频帧。聚类方案主要有两种类型。第一种是迄今为止最受欢迎的,并且被称为bottom-up。该算法开始于将完整的音频内容拆分成一系列簇,并逐步尝试融合冗余簇,从而实现每个簇对应于一个真实说话者的情况。第二种聚类策略被称为top-down,从所有音频数据的单个簇开始,然后尝试对其进行迭代拆分,直到达到与说话者数量相等的簇的数量。

例如,借助于声音有效性检测器(vad)检测来自进入的音频流的语音有效片段。接下来,从语音有效片段中提取出一组特征向量,该组特征向量对音频波形的短期频率特性进行建模。这种特征向量的一种常用表示是梅尔倒频谱系数(mel-frequencycepstralcoefficient,mfcc),通常每10毫秒提取一次。属于大小为几秒钟的滑动窗口左侧或右侧的特征集合的统计信息的变化被用于检测滑动窗口中间的潜在说话者变化点。

在说话者变化检测中形成的音频片段最初例如借助于k均值聚类算法被聚类,以形成初始声音划分。随着更多音频样本的累积,可以使用gmm对每个个体声音的特征分布进行建模。一旦各个说话者的gmm可用,就不需要盲说话者分类,并且可以针对每个说话者模型测试新的特征向量。选择最匹配的说话者模型来确定说话者身份。

有关说话者分类的更多信息,可以参见jin等人在2004年韩国济州岛的proceedingsofthe8thinternationalconferenceonspokenlanguageprocessing中发表的“speakersegmentationandclusteringinmeetings”。

因此,说话者分类的输出是包括单个说话者的语音的至少一个音频片段簇。

图4是示出图1所示方法的附加可选步骤的流程图。该方法从图1中的步骤s4继续。下一步骤s5包括:如果根据说话者模型计算出的置信度表示高于目标概率的概率,则基于音频片段簇来更新说话者模型。

在图4中,步骤s5被示为在图1中的步骤s4之后执行。在其他实施例中,步骤s5在步骤s4之前执行,或者步骤s4和s5至少部分地并行执行。

因此,在这些实施例中,除了对用户简档的有条件的更新之外,该方法还包括对说话者模型的有条件的更新。因此,如果sr算法能够可靠地辨识音频片段簇的说话者,则在步骤s4和s5中更新该说话者的说话者模型和用户简档。

对说话者模型的更新优选地通过基于针对音频片段簇计算出的特征向量更新说话者模型的设置来执行,如上文所述的。说话者识别可以使用基于gmm的算法来对特征向量(例如mfcc)的分布并且可选地对基本频率(音高)进行建模,以确定说话者身份并计算对应的置信度。说话者识别的更多信息可以参见reynolds和rose于1995年在ieeetransactionsonspeechandaudioprocessing第3卷第1期第72-83页发表的“robusttext-independentspeakeridentificationusinggaussianmixturespeakermodels”。因此,可以使用针对说话者分类中的音频片段簇导出的诸如mfcc之类的特征向量以及基本频率来更新说话者的gmm模型。

如前文所述,对用户简档的有条件的更新是基于指派给音频片段簇的用户偏好来执行的。因此,在实施例中,该方法包括如图5所示的附加可选步骤s3。该方法从图1中的步骤s2继续。接下来的步骤s3包括:将用户偏好指派给音频片段簇。然后,该方法继续进行到图1中的步骤s4。

如图6中进一步示出的那样,优选地借助于自动语音识别来执行向音频片段簇指派用户偏好,图6是示出该用户偏好的这种指派的实施例的流程图。该方法从图1中的步骤s2继续。接下来的步骤s20包括:对音频片段簇执行自动语音识别,以辨识用户偏好。接下来的步骤s21包括:将辨识出的用户偏好指派给音频片段簇。然后,该方法继续进行到图1中的步骤s4。

从说话者分类输出的音频片段簇也被输入到自动语音识别,以便分析说话者所说的内容,从而辨识任何用户偏好。

自动语音识别在语音识别中使用声学模型(am)和语言模型(lm)。

声学模型表示音频信号与构成语音的音速(phenome)或其他语言单元之间的关系。声学模型是一种统计模型,其估计已在音频片段中发出某个音素或子音素的概率。这种模型的非限制性且示例性示例包括gmm、hmm、具有softmax输出层的神经网络等。使用不同的方法对这些模型进行说话者适配。这种方法的示例是:声道长度归一化(vtln)、hmm/gmm参数的最大后验(map)适配、高斯参数的最大似然线性回归(mllr)、以及加权的说话者聚类方法,这些方法使用插值模型来表示当前说话者。

语言模型是一种统计模型,其估计某一词语在某一短序列词语之后的概率。这些被称为n元语法(n-gram),其中1元语法提供不考虑某一词语的前一词语的情况下该词语的概率。2元语法提供给出某一词语的前一词语的情况下该词语的概率,3元语法提供给出某一词语的前两个词语的情况下该词语的概率,依此类推。语言模型通过在来自不同上下文的文本材料上编译n元语法模型来适应不同的上下文。获得可用的语言模型需要大量文本材料,尤其是对于高阶n元语法而言。当通过最大似然估计生成n元语法概率时,对在训练文本中见到的n元语法的估计往往太高,而对见不到的n元语法的估计却太低。通常可以通过从所见到的事件中获取一些概率质量并将其重新分配给所有未见事件来纠正这种不平衡。这被称为语言模型平滑。am和lm适配的更多信息可以参见2010年阿尔西大学的mansikkaniemi的硕士学位论文“acousticmodelandlanguagemodeladaptationforamobiledictationservice”。

因此,自动语音识别尝试将声音与词语序列进行匹配。语言模型提供上下文来区分听起来相似的词语和短语。

自动语音识别的输出是辨识出的用户偏好。然后,在且优选地仅在针对说话者模型计算出的置信度表示高于目标概率的概率时,才在步骤s4中使用辨识出的用户偏好来更新用户简档。

用户偏好的非限制性而是说明性的示例包括:媒体的类型(例如音乐或视频的类型);歌手或乐队的名称;男演员或女演员的名字;导演的名字;运动队或运动员的名字;网站地址;用户设备设置;等等。

例如,假设一个简单的示例,其中用户简档包括电影类型和音乐类型。电影类型可以是任一喜剧电影、动作电影、戏剧电影、惊悚电影或科幻电影,而音乐类型是摇滚音乐、流行音乐、古典音乐、乡村音乐以及说唱音乐之一。新创建的用户简档可能会为这些备选项设置相等的权重,即p=[{喜剧,动作,戏剧,惊悚,科幻},{摇滚,流行,古典,乡村,说唱}]=[{0.2,0.2,0.2,0.2,0.2},{0.2,0.2,0.2,0.2,0.2}]。但是,当给定用户使用声控来选择电影和音乐时,asr算法例如基于电影的选定标题、乐队或艺术家的名字、曲调的标题和/或基于与选定电影或音乐相关联的类型分类来辨识电影和音乐的类型,并且sr算法辨识说话者的身份以更新其用户简档。如果用户主要对科幻电影和动作电影感兴趣,并且仅听摇滚音乐,则更新后的用户简档可能随着时间推移而成为p=[{{0.05,0.4,0.1,0.05,0.4},{1,0,0,0,0}]。

在实施例中,图1的步骤s2包括:针对多个(即,至少两个)说话者模型中的每个说话者模型计算置信度,该置信度表示该说话者模型代表音频片段簇的说话者的概率。在该实施例中,优选地如图7所示地执行图1的步骤s4。因此,该实施例包括:在步骤s30中,辨识多个说话者模型中的如下说话者模型:针对该说话者模型,计算出的置信度表示计算出的置信度中的最高概率。接下来的步骤s31包括:如果针对辨识出的说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与辨识出的说话者模型相关联的用户简档。

然后该方法结束或继续进行到图4中的步骤s5。在后一种情况下,步骤s5优选地包括:如果针对辨识出的说话者模型计算出的置信度表示高于目标概率的概率,则基于音频片段簇来更新该辨识出的说话者模型。

因此,在该实施例中,存在一群或一组可用用户,例如用户设备的家庭成员。在这种情况下,每个用户具有表示用户的声音特性的相应说话者模型。这意味着针对每个说话者模型并因此针对每个用户计算相应置信度。然后,选择表示最高概率的置信度,该最高概率是音频片段簇包括一组用户中的给定用户的语音的概率。

例如,假设一组四个用户或家庭成员。在这种情况下,sr算法可以访问四个说话者模型s1、s2、s3、s4,并且在步骤s2中计算四个置信度c1、c2、c3、c4。然后,步骤s30辨识出这四个说话者模型之一,并且更详细地选择表示最高概率的说话者模型,该最高概率是关于音频片段簇包括该特定用户的语音的概率。

因此,在典型的实施方式中,sr算法使用说话者模型来辨识音频片段簇的说话者。每个这样的说话者模型都输出相应置信度c1、c2、c3、c4,这些置信度表示音频片段簇包含说话者的语音的概率,其中给定的说话者模型表示该说话者的声音或对该声音进行建模。在典型情况下,置信度的范围可以从表示音频片段簇包括用户的语音的最小概率值0到表示音频片段簇包括用户的语音的最大概率1。该范围应仅被看作是置信度值的说明性而非限制性示例。例如,在其他情况下,值0可以表示最大概率,而值1表示最小概率。另一个示例可以是有无限的置信度,例如,最小概率由-∞(负无穷大)表示,并且0可以表示最大概率。或更一般而言,值x表示最小概率(或最大概率),而值y表示最大概率(或最小概率),其中x<y。

在通常情况下,置信度的总和等于表示最大概率的值(例如1),例如例如,假设sr算法计算出以下置信度:c1=0.08,c2=0.73,c3=0.11并且c4=0.08。在该说明性示例中,第二说话者模型s2的置信度值c2表示最高概率,从而在步骤s30中被辨识出。

在该示例中,在步骤s30中辨识出或选择第二说话者模型s2,因为其计算出的置信度c2表示计算出的置信度c1、c2、c3、c4中的最高概率。然后将由该置信度表示的概率与目标概率t进行比较。如果该概率高于目标概率,例如c2>t,则基于指派给音频片段簇的用户偏好来更新与辨识出的说话者模型c2相关联的用户简档p2,即,p2=function(用户偏好),其中function(.)表示对用户简档的更新。

在优选实施例中,如果该概率高于目标概率,例如c2>t,则也基于音频片段簇来更新辨识出的说话者模型s2。例如,说话者模型s2是基于特征向量(例如,从音频片段簇中导出的mfcc)来更新的,例如s2=function(mfcc),其中function(.)表示对说话者模型的更新。

表示sr正确辨识出说话者的身份或说话者的团体隶属关系的置信度、可靠性或不确定性的任何度量或参数都可以用作根据实施例的置信度。非限制性示例包括所谓的似然度分数和后验概率。

reynolds于1997年在proceedingsoftheeuropeanconferenceonspeechcommunicationandtechnology第2期第963-966页的“comparisonofbackgroundnormalizationmethodsfortext-independentspeakerverification”中公开了一种在对似然度分数做出判定的情况下计算置信度的方法。如果说话者识别过程计算后验概率而不是似然度,则无需通过与另一模型进行归一化来创建似然比,因为后验概率定义了说话者识别的可信度,即接近1–非常可信,接近0–非常不确定。

图8是示出该方法的附加可选步骤的流程图。该方法从图1中的步骤s2或从图5中的步骤s3继续。该实施例包括:在步骤s40中,如果针对至少一个说话者模型中的每个说话者模型计算出的相应置信度表示不高于目标概率的相应概率,则创建新的说话者模型。该实施例优选地包括:在步骤s41中,如果针对至少一个说话者模型中的每个说话者模型计算出的相应置信度表示不高于目标概率的相应概率,则基于与音频片段簇模型相关联的用户偏好来更新默认用户简档。步骤s40和s41可以以任何次序顺序地执行或至少部分地并行执行。接下来的步骤s42包括:将更新后的默认简档与新的说话者模型相关联。

因此,如果计算出的置信度都不表示足够高的概率,即,都不高于目标概率,则优选地不执行对现有的说话者模型或现有的用户简档的更新。关于上述具有四个家庭成员的示例,此情况对应于当max(c1,c2,c3,c4)≤t的情况,即,使用现有的说话者模型s1、s2、s3、s4针对音频片段簇计算出的最大概率仍不高于目标概率的情况。

在置信度不可靠的情况(这可能导致利用另一用户的用户偏好来更新用户的用户简档以及利用另一用户的声音特性来更新用户的说话者模型的后果)下,不是错误地更新现有的说话者模型和用户简档,而是在步骤s40和s41中创建新的说话者模型并更新默认用户简档。因此,这对应于sr算法已经检测到用户设备的潜在新用户的情况,对于该潜在新用户,sr算法没有任何生成的说话者模型。

在实施例中,可以通过导出gmm来在步骤s40中创建新的说话者模型,该gmm对从音频片段簇中提取的特征向量(例如mfcc)的分布进行建模。除非最初有大量音频片段可用于创建说话者模型,否则这种新创建的说话者模型的可靠性通常非常低。但是,随着同一用户越来越多地使用声控来控制用户设备,说话者模型可以随时间更新,以更正确地表示(例如,由mfcc表示的)用户声音的特性。

在步骤s41中更新的默认用户简档优选地是对于用户偏好的每个备选项具有相等权重的预定义用户简档。例如,假定默认用户简档包括三种类型的用户偏好,并且第一类型的用户偏好具有五个不同的备选项,第二类型的用户偏好具有两个不同的备选项,并且第三类型的用户偏好具有四个不同的备选项,则默认用户简档可以依据pdefault=[{0.20,0.20,0.20,0.20,0.20},{0.50,0.50},{0.25,0.25,0.25,0.25}

然后在步骤s41中,使用与音频片段簇相关联的用户偏好来更新该默认用户简档。这意味着在最初更新用户简档之后,与默认用户简档中的默认偏好相比,更新后的默认用户简档将更正确地表示新用户的用户偏好。

可以根据各种实施例在步骤s42中实现更新后的默认用户简档与新的说话者模型的关联。例如,sr算法可以将更新后的默认用户简档和新的说话者模型一起存储在存储器中,使得sr算法可以根据它们中的任何一者的信息来获取它们。

在实施例中,sr算法已知的每个说话者模型和说话者可以具有所指派的说话者标识符。在这种情况下,该说话者标识符优选地被指派给更新后的默认用户简档和新的说话者模型。这意味着更新后的默认用户简档和新的说话者模型之间的关联是所指派的说话者标识符。

所述实施例实现了无需注册会话的声控用户设备的自动说话者适配。这是通过连续地学习用户的声音(优选地基于说话者分类)以及与特定声音相关联的用户偏好的连续适配来实现的。因为完全避免了注册会话并且sr算法连续地更新说话者模型,因此,由于对声音和声学环境可变性的更精确的建模,实施例是更加用户友好的并且同时是更稳健的。

随着用户设备(例如机顶盒)的使用,说话者分类逐渐累积音频记录并对未知声音进行聚类。最初并不知道声音的真实身份,而是可以将特定标签指派给一个人说出的所有音频片段。用户设备设置、搜索、偏好的电影类型、喜爱的节目和演员以及与特定说话者相对应的其他用户偏好被聚集并与该说话者相关联。这是通过将对播放会话或其他命令的搜索或发起与有效说话者的标签相关联来实现的。

最初,默认配置可以用于未知声音。在对音频记录进行一段时间的累积和聚类之后,声音的分离变得可靠,并且sr算法可以退出默认模式,并切换到与该声音相关联的特定配置。

初始学习优选地基于说话者分类,这包括说话者变化检测和说话者分段步骤。说话者分类的目的是产生跟踪不同说话者的活动的音频信号的时间片段。即使没有关于说话者的先验信息,也可以检测到说话者变化。

首先,借助于vad检测来自进入的音频流的语音有效片段。接下来,提取一组特征向量。这些特征向量捕获音频波形的短期频率特性。例如,每10毫秒提取一组mfcc。属于大小为几秒钟的滑动窗口左侧以及对应地属于其右侧的特征集合的统计信息的变化被用于检测窗口中间的潜在说话者变化点。

在说话者变化检测步骤中形成的音频片段最初例如借助于k均值聚类算法被聚类,以形成初始声音划分。随着更多音频样本的累积,使用gmm对每个个体声音的特征分布进行建模。一旦针对各个说话者的gmm可用,就不需要盲说话者分类,并且针对每个说话者模型测试新的特征向量。选择最佳匹配模型来确定说话者身份。

上述学习确定不同用户的列表,即,具有不同声音的用户sii。假设列表由四个说话者组成,可能对应于四个家庭成员{si1,si2,si3,si4}。我们还具有对应的四个模型{gmm1,gmm2,gmm3,gmm4},这允许在音频流中检测到不同的声音。我们还将特定的用户简档{p1,p2,p3,p4}与各个声音相关联。

顶层概念如图10中所示。已经针对现有的说话者模型{gmm1,gmm2,gmm3,gmm4}从连续的音频流中提取了频谱特征,并且所述最佳匹配确定说话者身份sii。接下来,在该时间间隔内收集的音频特征例如借助于增量k均值聚类或增量expectation-maximization算法被用于更新说话者模型gmmi,并且相同时间窗口(即,音频片段簇)的用户偏好被用于更新用户简档pi。

图9是示出根据另一实施例的管理用户简档的方法的流程图。该实施例包括:在步骤s50中,对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。可以如先前结合图2中的步骤s1所描述的那样执行该步骤s50。优选地,针对至少一个音频片段簇中的每个音频片段簇,执行以下两个步骤s51和s52,其由线l2示意性地表示。

步骤s51包括:创建表示音频片段簇的说话者或对音频片段簇的说话者进行建模的新的说话者模型。可以如先前结合图8中的步骤s40所描述的那样执行该步骤s51。步骤s52,其可以在步骤s51之后或之前或者至少部分地与步骤s51并行地执行,包括基于指派给音频片段簇的用户偏好来更新默认用户简档。可以如先前结合图8中的步骤s41所描述的那样执行该步骤s51。

优选地执行图9所示的实施例,以在用户设备处发起语音识别。因此,在这种情况下,sr算法无法访问任何先前创建的说话者模型,也没有任何更新后的用户简档。这意味着无法计算置信度,因为没有针对其测试音频片段簇的说话者模型。因此,图9所示的实施例对应于所谓的盲说话者分类。

在实施例中,步骤s50优选地如先前结合图3所描述的那样执行,即包括步骤s10至s12。

在实施例中,如图9所示的实施例还包括如图5所示的用户偏好的指派,并且其可以如图6所示地来实现。

图11示意性地示出了管理用户简档的实施例。该实施例示出了输入并经过说话者分类的音频流。说话者分类的输出是包括单个说话者的语音的音频片段簇。在说话者识别中处理音频片段簇,以确定说话者的身份。说话者识别的输出然后是最有可能的说话者的相应用户或说话者标识符,以及针对该用户的置信度。

从说话者分类输出的音频片段簇也被输入到自动语音识别中,以便分析说话者所说的内容,从而辨识任何用户偏好。

自动语音识别的输出是辨识出的用户偏好。用户标识符与置信度一起用于用户简档管理。更详细地,诸如基于用户标识符来辨识用户简档。如果置信度表示足够高的概率(即,高于目标概率),则可以基于从自动语音识别输出的用户偏好来更新选定的用户简档。对应地,如果置信度表示足够高的概率,则可以在说话者模型管理中更新辨识出的用户或说话者的说话者模型。

实施例的另一方面涉及一种用于管理用户简档的设备。该设备被配置为:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。该设备还被配置为:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

在实施例中,该设备被配置为:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。

在特定实施例中,设备被配置为:从音频流中检测语音有效片段。该设备还被配置为:检测语音有效片段中的说话者变化点,以形成单个说话者的音频片段。该设备还被配置为:对同一说话者的音频片段进行聚类,以形成至少一个音频片段簇。

在实施例中,该设备被配置为:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于音频片段簇来更新说话者模型。

在实施例中,该设备被配置为:将用户偏好指派给音频片段簇。

在特定实施例中,该设备被配置为:对音频片段簇执行自动语音识别,以辨识用户偏好。该设备还被配置为:将辨识出的用户偏好指派给音频片段簇。

在实施例中,该设备被配置为:针对多个说话者模型中的每个说话者模型计算置信度,该置信度表示说话者模型代表音频片段簇中的说话者的概率。该设备还被配置为辨识多个说话者模型中的如下说话者模型:针对该说话者模型,计算出的置信度表示计算出的置信度中的最高概率。该设备还被配置为:如果针对辨识出的说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与辨识出的说话者模型相关联的用户简档。

在实施例中,该设备被配置为:如果针对至少一个说话者模型中的每个说话者模型计算出的相应置信度表示不高于目标概率的相应概率,则创建新的说话者模型。该设备还被配置为:如果针对至少一个说话者模型中的每个说话者模型计算出的相应置信度表示不高于目标概率的相应概率,则基于与音频片段簇相关联的用户偏好来更新默认用户简档。该设备还被配置为:将更新后的默认用户简档与新的说话者模型相关联。

实施例的另一方面涉及一种用于管理用户简档的设备。该设备被配置为:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。该设备还被配置为:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。该设备还被配置为:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

应当理解,本文描述的方法、方法步骤和设备、设备功能可以以各种方式实现、组合和重新布置。

例如,实施例可以用硬件、或用由适当的处理电路执行的软件、或其组合来实现。

本文所述的步骤、功能、过程、模块和/或框可以使用任何常规技术在硬件中实现,例如使用分立电路或集成电路技术,包括通用电子电路和专用电路二者。

备选地,或者作为补充,本文描述的步骤、功能、过程、模块和/或框中的至少一些可以在软件中实现,例如由合适的处理电路(例如一个或多个处理器或处理单元)来执行的计算机程序。

处理电路的示例包括但不限于:一个或多个微处理器、一个或多个数字信号处理器(dsp)、一个或多个中央处理单元(cpu)、视频加速硬件、和/或任意合适的可编程逻辑电路,例如一个或多个现场可编程门阵列(fpga)或者一个或多个可编程逻辑控制器(plc)。

还应当理解,可以重用实现所提出技术的任何常规设备或单元的通用处理能力。例如,也可以通过对现有软件进行重新编程或通过添加新的软件组件来重用现有的软件。

图12是示出根据实施例的用于管理用户简档的基于处理器-存储器实现的设备100的示例的示意框图。在该特定示例中,设备100包括处理器101(例如处理电路)以及存储器102。存储器102包括可由处理器101执行的指令。

在实施例中,处理器101能够操作用于:计算置信度,并且如果置信度表示高于目标概率的概率,则更新与说话者相关联的用户偏好,如本文先前所述。

在另一实施例中,处理器101能够操作用于:执行说话者分类,创建新的说话者模型,以及更新默认用户简档,如本文先前所述。

可选地,设备100还可以包括通信电路,由图12中的输入/输出(i/o)单元103表示。i/o单元103可以包括用于与有线或无线通信网络中的其他设备和/或网络节点进行有线和/或无线通信的功能。在特定示例中,i/o单元103可以基于用于与一个或多个其他节点进行通信(包括发送和/或接收信息)的无线电电路。i/o单元103可以互连到处理器101和/或存储器102。举例来说,i/o单元103可以包括以下任何一个:接收器、发射器、收发器、i/o电路、输入端口和/或输出端口。

图13是示出根据实施例的用于管理用户简档的基于硬件电路实现的设备110的另一示例的示意框图。合适的硬件电路的具体示例包括:一个或多个适当配置的或可能可重新配置的电子电路、专用集成电路(asic)、fpga或任何其他硬件逻辑,诸如基于互连的分立逻辑门和/或触发器的用以与合适的寄存器(reg)和/或存储单元(mem)一起执行专用功能的电路。

图14是示出了用于基于处理器122、123和硬件电路124、125两者结合合适的存储器单元121的组合来管理用户简档的设备120的又一示例的示意框图。设备120包括:一个或多个处理器122、123;存储器121,包括用于软件(sw)和数据的存储设备;以及硬件电路124、125的一个或多个单元。因此,整体功能在用于在一个或多个处理器122、123上执行的编程软件与一个或多个预配置的或可能可重新配置的硬件电路124、125之间划分。实际的硬件-软件划分可以由系统设计人员根据众多因素来决定,所述因素包括处理速度、实施成本和其他要求。

图15是示出了根据实施例的用于管理用户简档的设备200的示例的示意图。在该具体示例中,用计算机程序240来实现本文描述的步骤、功能、过程、模块和/或框中的至少一些,其中计算机程序240被加载到存储器220中,用于由包括一个或更多个处理器210的处理电路执行。处理器210和存储器220彼此互连,以实现正常的软件执行。可选的i/o单元230还可以互连到处理器210和/或存储器220,以实现相关数据(例如,音频流、音频片段、用户简档)的输入和/或输出。

术语“处理器”应该在一般意义上解释为能够执行程序代码或计算机程序指令以执行特定的处理、确定或计算任务的任何电路、系统或设备。

因此,包括一个或多个处理器210的处理电路被配置为:在执行计算机程序240时执行例如本文描述的明确定义的处理任务。

处理电路不必须是专用于仅执行上述步骤、功能、过程和/或框,而是还可以执行其他任务。

在实施例中,计算机程序240包括指令,该指令当由至少一个处理器210执行时,使该至少一个处理器210:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。还使至少一个处理器210:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

在另一实施例中,计算机程序240包括指令,该指令当由至少一个处理器210执行时,使该至少一个处理器210:对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。还使至少一个处理器210:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。进一步使所述至少一个处理器210:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

所提出的技术还提供了包括计算机程序240的载体250。载体250是电子信号、光信号、电磁信号、磁信号、电信号、无线电信号、微波信号或计算机可读存储介质中的一种。

通过示例的方式,软件或计算机程序240可以实现为计算机程序产品,其通常在计算机可读介质250(具体地,非易失性介质)上承载或存储。计算机可读介质可包括一个或多个可移除或不可移除的存储设备,包括(但不限于):只读存储器(rom)、随机存取存储器(ram)、高密度盘(cd)、数字多用途盘(dvd)、蓝光盘、通用串行总线(usb)存储器、硬盘驱动器(hdd)存储设备、闪存、磁带或任何其它常规存储设备。因此,计算机程序240可以被加载到设备200的操作存储器220中,以由该设备200的处理电路210执行。

当由一个或多个处理器执行时,本文介绍的流程图可以被认为是一个或多个计算机流程图。对应的设备可以被定义为一组功能模块,其中由处理器执行的每个步骤与功能模块相对应。在这种情况下,功能模块被实现为在处理器上运行的计算机程序。

因此,驻留在存储器中的计算机程序可以被组织为适当的功能模块,所述功能模块被配置为,当被处理器执行时,执行本文所述的步骤和/或任务的至少一部分。

图16是根据实施例的用于管理用户简档的设备130的示意框图。设备130包括计算模块131,该计算模块131用于:针对至少一个说话者模型中的每个说话者模型,计算置信度,该置信度表示说话者模型代表音频片段簇的说话者的概率。设备130还包括更新模块132,该更新模块132用于:如果针对说话者模型计算出的置信度表示高于目标概率的概率,则基于指派给音频片段簇的用户偏好来更新与说话者模型相关联的用户简档。

图17是根据另一实施例的用于管理用户简档的设备140的示意框图。设备140包括分类模块141,该分类模块141用于对音频流执行说话者分类,以形成至少一个音频片段簇。每个音频片段簇包括单个说话者的语音。设备140还包括创建模块142,该创建模块142用于:针对至少一个音频片段簇中的每个音频片段簇,创建表示音频片段簇的说话者或对音频片段簇的说话者建模的新的说话者模型。设备140还包括更新模块143,该更新模块143用于:针对至少一个音频片段簇中的每个音频片段簇,基于指派给音频片段簇的用户偏好来更新默认用户简档。

实施例的另一方面(见图18)涉及一种用户设备300,该用户设备300包括根据任何实施例(例如,本文结合图12至图17所公开的实施例)的用于管理用户简档的设备100。在实施例中,用户设备选自由以下各项组成的组:计算机、膝上型计算机、智能电话、移动电话、平板计算机、音频播放器、多媒体播放器、机顶盒、以及游戏机。在特定实施例中,用户设备意在被安装在家庭环境中,并且优选地是机顶盒或游戏机。

在诸如网络节点和/或服务器之类的网络设备中提供计算服务(硬件和/或软件)也变得日益普遍,其中资源被作为服务通过网络提供给远程位置。举例而言,这意味着如本文所述的功能可被分布或重新定位到一个或多个分离的物理节点或服务器。该功能可被重新定位或分布到可位于分离的物理节点的一个或多个联合工作的物理和/或虚拟机器中,即在所谓的云中。这有时也被称为云计算,云计算是一种支持对诸如网络、服务器、存储设备、应用和通用或定制服务等可配置计算资源的池的随时随地的按需网络访问的模型。

存在在这种上下文中有用的不同形式的虚拟化,包括以下一种或多种:

·将网络功能整合为运行在定制或通用硬件上的虚拟化软件。这有时被称为网络功能虚拟化。

·将在分离的硬件上运行的一个或多个应用堆栈(包括操作系统)共同定位在单个硬件平台上。这有时被称为系统虚拟化或平台虚拟化。

·硬件和/或软件资源的共同定位的目的是使用一些高级的域级别调度和协调技术来获得改善的系统资源利用率。这有时被称为资源虚拟化、或者集中式和协调式资源池化。

虽然将功能集中到所谓的通用数据中心经常是期望的,但在其他场景中实际上将功能分布在网络的不同部分上可能是有利的。

网络设备通常可以被视为通信连接到网络中的其他电子设备的电子设备。作为示例,网络设备可以用硬件、软件或其组合来实现。例如,网络设备可以是专用网络设备或通用网络设备或其混合。

专用网络设备可以使用定制处理电路和专有操作系统(os)来执行软件以提供本文公开的特征或功能中的一个或多个。

通用网络设备可以使用公共现成(cots)处理器和标准os来执行软件,所述软件配置为提供本文公开的特征或功能中的一个或多个。

作为示例,专用网络设备可以包括硬件、物理网络接口(ni)以及其上存储有软件的非暂时性机器可读存储介质,所述硬件包括处理或计算资源,其通常包括一个或多个处理器构成的集合,所述物理网络接口(ni)有时被称为物理端口。物理ni可被视为网络设备中的用于进行网络连接的硬件,所述网络连接例如通过无线网络接口控制器(wnic)以无线方式来进行或者通过将缆线插入连接到网络接口控制器(nic)的物理端口来进行。在操作期间,软件可以被硬件执行,以实例化一个或多个软件实例的集合。每个软件实例以及执行该软件实例的硬件的部分可以形成单独的虚拟网络单元。

作为另一示例,通用网络设备可以例如包括硬件和网络接口控制器(nic)以及其上存储有软件的非暂时性机器可读存储介质,所述硬件包括一个或多个处理器(通常是cots处理器)构成的集合。在操作期间,处理器执行软件以实例化一个或多个应用的一个或多个集合。虽然一个实施例不实现虚拟化,但是备选实施例可以使用不同形式的虚拟化——例如由虚拟化层和软件容器来表示。例如,一个这样的替代实施例实现了操作系统级别的虚拟化,在这种情况下,虚拟化层代表允许创建多个软件容器的操作系统内核或在基础操作系统上执行的垫片(shim),每个软件容器可被用来执行应用集合之一。在示例实施例中,每个软件容器(也称为虚拟化引擎、虚拟专用服务器或空间(jail))是用户空间实例(通常是虚拟存储空间)。这些用户空间实例可以彼此分离并与执行操作系统的内核空间分离;除非明确允许,否则在给定用户空间中运行的应用集合不能访问其他进程的存储器。另一个这样的替代实施例实现完全虚拟化,在这种情况下:1)虚拟化层表示管理程序(有时称为虚拟机监视器(vmm))或在主机操作系统之上执行的管理程序;以及2)软件容器均表示软件容器的紧密隔离形式,称为虚拟机,由管理程序执行,并且可以包括访客操作系统。

管理程序是负责创建和管理各种虚拟化实例以及在某些情况下创建和管理实际物理硬件的软件/硬件。管理程序管理底层资源并将它们呈现为虚拟化实例。管理程序虚拟化以作为单个处理器呈现的内容实际上可以包括多个分开的处理器。从操作系统的角度,虚拟化实例看起来是实际的硬件组件。

虚拟机是物理机器的软件实现,其运行程序如同程序在物理的、非虚拟化的机器上执行一样;以及应用一般不知道它们运行在虚拟机上还是运行在“裸金属”主机电子设备上,尽管出于优化目的,一些系统提供允许操作系统或应用能够意识到存在虚拟化的半虚拟化(para-virtualization)。

一个或多个应用的一个或多个集合的实例化以及虚拟化层和软件容器(如果实现)统称为软件实例。每个应用集合、相应的软件容器(如果实现)以及执行它们的硬件的部分(其是专用于该执行的硬件和/或被软件容器在时间上共享的硬件的时间片)形成单独的虚拟网络元件。

虚拟网络元件可以执行与虚拟网络元件(vne)类似的功能。这种硬件虚拟化有时被称为网络功能虚拟化(nfv)。因此,nfv可以用于将许多网络设备类型统一到工业标准高容量服务器硬件、物理交换机和物理存储器,它们可以位于数据中心、nd、和用户驻地设备(cpe)中。然而,不同实施例可以用不同方式来实现软件容器中的一个或多个。例如,虽然使用与vne对应的每个软件容器说明了各个实施例,但是备选实施例能够在更精细的粒度级别实现软件容器-vne之间的这种对应关系或映射。应当理解:本文参考软件容器与vne的对应关系来描述的技术同样适用于使用这种更精细粒度级别的实施例。

根据又一实施例,提供了一种混合网络设备,其在网络设备(例如,在网络设备nd内的卡或电路板)中既包括定制处理电路/专有os也包括cots处理器/标准os。在这种混合网络设备的某些实施例中,平台虚拟机(vm)(如实现专用网络设备的功能的vm)可以向混合网络设备中存在的硬件提供半虚拟化。

图19是示出一般情况下可以如何在不同网络设备之间分布或划分功能的示例的示意图。在该示例中,至少有两个单独的但互连的网络设备310、311,它们可以具有在网络设备310、311之间划分的不同的功能,或者相同功能的部分。可能存在额外的网络设备312,其是这种分布式实现的一部分。网络设备300、311、312可以是同一无线或有线通信系统的一部分,或者一个或多个网络设备可以是位于无线或有线通信系统外部的所谓的基于云的网络设备。

以上描述的实施例将被理解为本发明的几个说明性示例。本领域技术人员将理解,在不脱离本发明的范围的前提下,可以对实施例作出各种修改、组合和改变。尤其是,在技术上可行的情况下,在其他配置中可以组合不同实施例中的不同部分解决方案。然而,本发明的范围由所附权利要求限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1