确定问题的答案的方法、装置、设备及存储介质与流程

文档序号:24378514发布日期:2021-03-23 11:12阅读:83来源:国知局
确定问题的答案的方法、装置、设备及存储介质与流程

本公开涉及数据处理领域,特别地,涉及人工智能、深度学习、机器问答、知识图谱和事件图谱领域,并且更具体地,涉及确定问题的答案的方法、装置、设备、存储介质和计算机程序产品。



背景技术:

随着计算机技术的发展,目前已经可以基于人工智能技术来处理多种数据的技术方案。例如,已经可以利用机器阅读理解技术来给出对于待回答问题的答案。机器阅读理解(在本文中,有时也被称为阅读理解问答或阅读理解),是一种使机器理解自然语言文本,在给定问题与文档的情况下,回答出相应答案的技术。该技术能够在文本问答、知识图谱和事件图谱中的信息抽取、对话系统等诸多领域应用,是近年来的研究热点。在一些方案中,阅读理解模型可以从文档的文本中确定其中的一个片段,作为待回答问题的答案。然而,阅读理解模型通常一次只能处理一个文本以及对应的一个问题,如果对于同一文本,存在多个待回答的问题,则需要由该阅读理解模型分多次进行处理,每次仅确定针对一个问题的答案。因此,存在对能够高效处理多个待回答的问题的方案的需要。



技术实现要素:

本公开提供了一种确定问题的答案的方法、装置、设备、存储介质和计算机程序产品。

根据本公开的第一方面,提供了一种确定问题的答案的方法。该方法包括:获取包括第一文本、以及第一文本相关联的问题集的第一输入,第一输入包括将问题集中的多个问题分隔开的第一分隔标识符;确定指示第一分隔标识符在第一输入中的位置的问题索引、以及针对问题集的问题掩码,其中问题掩码用于对第一输入中的问题集进行筛选;以及基于问题索引、问题掩码以及阅读理解模型,确定与第一输入相对应的第一输出,以用于生成与多个问题分别对应的多个答案。

根据本公开的第二方面,提供了一种训练阅读理解模型的方法。该方法包括:获取训练数据,所述训练数据包括第一文本、以及所述第一文本相关联的问题集;利用根据本公开的第一方面的方法,生成所述多个答案;以及基于所述多个答案与对应的多个真实答案之间的差异,更新所述阅读理解模型的参数,从而训练所述阅读理解模型。

根据本公开的第三方面,提供了一种确定问题的答案的装置。该装置包括输入获取模块,被配置为获取包括第一文本、以及第一文本相关联的问题集的第一输入,第一输入包括将问题集中的多个问题分隔开的第一分隔标识符;问题集预处理模块,被配置为确定指示第一分隔标识符在第一输入中的位置的问题索引、以及针对问题集的问题掩码,其中问题掩码用于对第一输入中的问题集进行筛选;以及输出确定模块,被配置为基于问题索引、问题掩码以及阅读理解模型,确定与第一输入相对应的第一输出,以用于生成与多个问题分别对应的多个答案。

根据本公开的第四方面,提供了一种训练阅读理解模型的装置,包括:数据获取模块,被配置为获取训练数据,训练数据包括第一文本、以及第一文本相关联的问题集;第二答案生成模块,被配置为利用根据本公开的第一方面的方法,生成多个答案;以及训练模块,被配置为基于多个答案与对应的多个真实答案之间的差异,更新阅读理解模型的参数,从而训练阅读理解模型。

根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,该存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开的第一方面和/或第二方面所述的方法。

根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开的第一方面和/或第二方面所述的方法。

根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序指令,其特征在于,该计算机程序指令被处理器实现根据本公开的第一方面和/或第二方面的方法。

根据本申请的技术能够改进机器阅读理解模型对问题的处理效率。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:

图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;

图2示出了根据本公开的实施例的确定问题的答案的方法的流程图;

图3示出了根据本公开的实施例的用于确定第一输出的方法的示意图;

图4示出了根据本公开的实施例的基于第一输出来确定答案的方法的示意图;

图5示出了根据本公开的实施例的问题掩码矩阵的一个示例的示意图;

图6示出了根据本公开的实施例的确定问题的答案的装置的示意框图;

图7示出了根据本公开的实施例的训练阅读理解模型的方法的流程图;

图8示出了根据本公开的实施例的训练阅读理解模型的装置的示意框图;以及

图9示出了能够实施本公开的多个实施例的电子设备的框图。

具体实施方式

以下结合附图对本申请的实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示例性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如上所讨论的,常规方案中,对于与同一文本相关联的多个待回复问题,计算设备需要多次利用阅读理解模型进行操作,并且因此导致计算开销大、处理缓慢,因而效率不高。

为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,本公开的实施例提出了一种确定问题的答案的技术方案。在该方案中,文本和与该文本相关联的多个问题以阅读理解模型能够读取的方式同时被输入到阅读理解模型中以获取输出的特征表示,使用针对多个问题的索引以指示多个问题的位置,以由此能够在输出的特征表示中确定出针对每个问题的部分,并且使用确定针对多个问题的掩码以屏蔽多个问题之间的文本的相互干扰,因此针对每个问题的特征表示能够与文本的特征表示进行交互,以确定出每个问题的答案。以此方式,阅读理解模型能够一次处理针对相同文档的多个问题,由此提升阅读理解模型对问题的处理效率。

以下将参照附图来具体描述本公开的实施例。

图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。应当理解,仅出于示例性的目的描述示例环境100的结构和功能,而不暗示对于本公开的范围的任何限制。本公开的实施例还可以被应用到具有不同的结构和/或功能的环境中。

示例环境100可以包括计算设备105。计算设备105可以被配置为对阅读理解模型120进行训练、部署、以及使用该阅读理解模型120进行预测。在一些实施例中,阅读理解模型120可以使用用于自然语言处理(nlo)的各种模型来实现,包括但不限于基于cnn(卷积神经网络)的模型、基于rnn(循环神经网络)的模型、基于lstm(长短期记忆人工神经网络)、基于注意力机制的模型、诸如bert(bidirectionalencoderrepresentationfromtransformers)的基于变换器(transformer)的模型。

阅读理解模型120被配置为基于第一输入110确定第一输出130,第一输出130能够指示第一输入110的特征,即,包括第一输入110的特征表示。例如,第一输入110可以采用标识(有时也被称为token)序列的形式,而第一输出130可以采用向量的形式。

第一输入110包括第一文本112。第一文本112可以是一句话、一段话、一篇文章、一个文档、或者任意其他能够承载文本的形式。在一些实施例中,第一文本112可以是知识图谱中一个实体条目的描述文本。在一些实施例中,第一文本112可以是事件图谱中的一个资讯事件的描述文本。

第一输入110还包括与第一文本112相关联的问题集111,该问题集111中的至少一个问题能够由第一文本112的一部分来回答。可以理解的是,并非问题集111中的所有问题均能够由第一文本112的一部分来回答。在第一输入110中,问题集111中的多个问题被拼接在一起,以与第一文本112一起由阅读理解模型120进行处理。在一些实施例中,问题集111中的多个问题之间通过第一分隔标识符而分隔开,而问题集111与第一文本112通过第二分隔标识符而分隔开。因此,经由第一输入110,多个问题可以与对应的第一文本112同时被输入到阅读理解模型120中,以进行进一步的处理。

第一输出130可以包括第一文本112的特征表示、以及问题集111的特征表示。问题集111的特征表示可以包括问题集111中的每个问题的特征表示。在本文中,特征表示可以通过向量或矩阵的形式来实现,但本申请并不以此为限。

基于能够指示第一文本112的特征、以及问题集111中的每个问题的特征的第一输出130,计算设备105可以同时确定针对问题集111中的每个问题的答案140。

为了便于清楚说明,以下将参考图1的环境100来描述本公开的实施例。应当理解,本公开的实施例还可以包括未示出的附加动作和/或可以省略所示出的动作。本公开的范围在此方面不受限制。为了便于理解,在下文描述中提及的具体数据均是示例性的,并不用于限定本公开的保护范围。

图2示出了根据本公开的一些实施的确定问题的答案的方法200的流程图。例如,方法200可以由如图1所示的计算设备105来执行。以下将结合图3来详细描述方法200的各个动作。

在框202,计算设备105可以获取包括第一文本、以及第一文本相关联的问题集的第一输入,第一输入包括将问题集中的多个问题分隔开的第一分隔标识符。

具体地,在由阅读理解模型进行处理之前,需要构建由该模型能够识别的第一输入,这可以通过将问题集中的多个问题拼接起来的方式来实现。为了使得多个问题分隔开,以使其单独能被识别并得出对应的答案,可以在每个问题的文本开始处,设置第一分隔标识符。

现在参考图3,图3示出了根据本公开的一些实施例的用于确定第一输出的方法300的示意图。

第一输入310包括问题集311,问题集311中包括顺序排列的第一问题3111至第n问题311n(n为大于1的整数)。在第一问题3111之前位置处,存在第一分隔标识符311a。可以理解的是,虽未示出,但在跟随在第一问题之后的第二问题之前的位置处,同样存在第一分隔标识符。类似地,在第n问题311n之前位置处,存在第一分隔标识符311b。以此方式,多个问题的文本通过一系列的第一标识符而分隔开。

在一些实施例中,经拼接的问题集还需要进一步与第一文本拼接,以生成第一输入310。在这种情况中,第一输入310还包括与第一分隔标识符不同的第二分隔标识符312a,第二分隔标识符312a将第一文本312与问题集311分隔开。在一些实施例中,第一文本可以通过分词而被划分为多个短语,即第一短语3121至第m短语312m(m为大于1的整数)。每个短语可以是具有明确含义的字符或词语。

例如,在一个具体示例中,文本是“a公司宣布在新一轮裁员中裁减350名员工”,并且与该文本相关联的问题集中存在两个问题,其中第一问题是“裁员方是谁?”,而第二问题是“裁员人数有多少人?”,则可以确定第一输入包括“[第一分隔标识符]裁员方是谁?[第一分隔标识符]裁员人数有多少人?[第二分隔标识符]a公司宣布在新一轮裁员中裁减350名员工”。在一个示例中,当阅读理解模型是基于bert预训练模型来构建时,则第一分隔标识符可以被定义为分类器标识符cls(classifertoken),而第二分隔标识符可以被定义为语句分隔标识符sep(sentenceseparator),则阅读理解模型可以将第一输入划分为“[cls]裁员方是谁?[cls]裁员人数有多少人?”以及“[sep]a公司宣布在新一轮裁员中裁减350名员工”两条语句来进行处理。

将理解的是,当阅读理解模型是基于用于自然语言处理的其他模型来构建时,第一分隔标识符和第二分隔标识符还可以被定义为能由该其他模型识别的其他标识符。

回到参考图2,在框204,计算设备105可以确定指示第一分隔标识符在第一输入中的位置的问题索引、以及针对问题集的问题掩码,其中问题掩码用于对第一输入中的问题集进行筛选。

为了使阅读理解模型能够准确地对所构建的第一输入进行处理,需要构建能够指示问题集中每个问题的位置(这可以由第一分隔标识符的位置来指示)的问题索引,并且构建问题掩码,问题掩码用于对第一输入中的问题集进行筛选,使得阅读理解模型在处理第一输入时,问题集中的多个问题的文本互不干扰。

现在参考图3,在一些实施例中,计算设备105可以构建与问题集311相关联的问题索引向量,问题索引向量312中的一组第一元素与问题集311所包括的每个字符以及第一分隔标识符311a、311b相对应,并指示问题集311所包括的每个字符以及第一分隔标识符的位置。然后,计算设备105可以通过将与第一分隔标识符311a、311b相对应的第一元素设置为第一值,确定问题索引321。

还是以上述第一输入包括“[第一分隔标识符]裁员方是谁?[第一分隔标识符]裁员人数有多少人?[第二分隔标识符]a公司宣布在新一轮裁员中裁减350名员工”的具体示例来进行说明,问题索引用于指示第一分隔标识符在第一输入中的位置,并且更具体地,在问题集所对应的文本中的位置。问题索引可以使用向量来表示,在该向量中,问题集所对应的每个字符、以及每个分隔标识符将占据一个位置,即该向量中的一个元素(第一元素)。因此,与上述具体示例对应的问题索引可以用向量[10000001000000000]来表示,其中第一值1可以用于标识分隔标识符。

在一些实施例中,计算设备105可以构建与问题集311相关联的第一数据项,第一数据项包括以行和列表示的一组第二元素,一组第二元素与问题集311所包括的每个字符以及第一分隔标识符311a、311b相对应,并指示问题集所包括的每个字符以及第一分隔标识符311a、311b的位置。然后,计算设备105可以确定一组第二元素中的多个第二元素,该多个第二元素与问题集311中将被掩码的多个字符相对应,并且计算设备105可以通过将所确定的多个第二元素设置为第二值,来确定问题掩码322。

在一些实施例中,问题掩码可以按照如图5所示的问题掩码矩阵500的方式来实现,图5示出了根据本公开的一些实施例的问题掩码矩阵的一个具体示例的示意图。

问题掩码矩阵500包括多个元素(第二元素),该多个元素以行和列的方式排布。在一些实施例中,行数和列数可以是相同的。

在问题掩码矩阵500所对应的具体示例中,问题集中包括3个问题,其中第一问题包括2个字符,第二问题包括3个字符,并且第三问题包括2个字符,与问题集相关联的第一文本包括4个字符。每个问题之前均设置有第一分隔标识符,并且问题集与第一文本之间设置有第二分隔标识符。将理解的是,根据第一文本和问题集中所包括的字符数,由计算设备105生成的问题掩码矩阵500可以包括更多或更少的元素。

例如,对于第一问题,通过设置问题掩码矩阵中的元素区域522中的元素的值为第二值(例如,0),可以使得阅读理解模型仅处理与元素区域523和元素区域521。元素区域523例如可以对应于具有2个字符的第一问题、以及与之相关的一个第一分隔标识符,其中元素5231指示第一分隔标识符,元素5232指示第一问题中所包括的字符。元素区域521例如可以对应于具有4个字符的第一问题、以及与之相关的一个第二分隔标识符。

以类似的方式,还可以通过设置问题掩码矩阵,使得与问题掩码矩阵500中的元素区域524(其对应于第二问题)和元素区域525(其对应于第三问题)所对应的问题中的字符将被阅读理解模型处理。在一些实施例中,元素区域523、524和525中的每一者可以被设置为上三角矩阵。

在一些实施例中,计算设备105还可以确定多个问题之间的相似度,并基于该相似度(例如大于预定阈值)来确定需要被掩码的多个元素。例如,如果第一问题和第二问题分别与时间和日期相关,其答案将是相同或相似的。由此,计算设备105可以选择不对这些问题的字符进行掩码。

以此方式,计算设备105在例如通过阅读理解模型处理问题集中的第一问题、以及第一文本时,通过设置问题掩码,问题集中其他问题的文本对阅读理解模型是不可见的,因此可以排除多个问题被拼接在一起之后,其他问题中所包括的字符对第一问题的影响。

回到参考图2,在框206,基于问题索引、问题掩码以及阅读理解模型,确定与第一输入相对应的第一输出,以用于生成与多个问题分别对应的多个答案。

现在参考图3,第一输出330是由阅读理解模型320确定的针对第一输入的特征表示,因此其可以包括针对问题集311中的每个问题3111至311n的特征表示、以及第一文本312的特征表示。

上述特征表示可以经由交互层335的处理,来确定与多个问题分别对应的多个答案340。交互层335所进行的操作的一个具体实现将在下文参考图4进行描述,可以理解的是,还可以按照与图4描述不同的方式,对上述特征表示进行处理,以确定按文本形式表示的多个答案。

以此方式,阅读理解模型能够一次处理针对相同文档的多个问题,由此提升阅读理解模型对问题的处理效率。

图4示出了根据本公开的一些实施例的基于第一输出来确定答案的方法的示意图。具体地,图4可以上述交互层所进行的操作中的至少一些

计算设备105可以基于第一输出430,确定与第一文本相关联的第一文本特征表示432、以及与问题集相关联的问题集特征表示431。由于阅读理解模型一次处理多个问题,其输出的问题集特征表示将包括多个问题的特征表示。因此,计算设备105可以基于问题索引(其可以指示多个问题所在的位置),确定(例如,将其划分)问题集特征表示431中分别与问题集中的每个问题相关联的问题特征表示(例如,第一问题特征表示4311至第n问题特征表示431n)。接下来,计算设备105可以基于第一文本特征表示432以及与问题集中的每个问题相关联的问题特征表示,例如经由处理435来生成多个答案440。

在一些实施例中,计算设备105可以基于与问题集中的每个问题相关联的问题特征表示4311至431n,构建以行和列表示的第二数据项433,第二数据项433中的一行对应于与问题集中的一个问题相关联的问题特征表示。在一些实施例中,第一问题特征表示至第n问题特征表示4311至431n可以按顺序与第二数据项中的行对应。

然后,计算设备105可以通过对第二数据项433以及第一文本特征表示432(例如,包括第一短语特征表示4321至第m短语特征表示4320m)进行诸如第一操作的处理435,确定以行和列表示的第三数据项450,第三数据项450包括与问题集相关联的起始标识符元素s以及终止标识符元素e。在一些实施例中,起始标识符元素s和终止标识符元素e均具有第一值(例如,1)。在一些实施例中,第一操作可以例如包括以下操作:对第二数据项433以及第一文本特征表示432执行元素乘法,将所得的结果送入诸如多层感知器(mlp)的神经网络进行处理435,以获取第三数据项450。第三数据项450可以充当指针,其指示答案与第一文本之间的位置关系。

接下来,计算设备105可以基于第三数据项450中所包括起始标识符元素以及终止标识符元素,利用第一文本来生成多个答案。例如,计算设备105可以识别第三数据项中与第一问题相关联的两行元素451中的起始标识符s和终止标识符e相对应的元素的位置,并找到第一文本中与起始标识符s和终止标识符e的位置的相对应的两个位置,并由此(例如,利用该两个位置之间的文本)生成第一答案。以类似的方式,计算设备105可以识别第三数据项中与第n问题相关联的两行元素452中的起始标识符s和终止标识符e相对应的元素的位置,并找到第一文本中与起始标识符s和终止标识符e的位置的相对应的两个位置,并由此生成第n答案。

图6示出了根据本公开的实施例的确定问题的答案的装置600的示意框图。如图6所示,装置600可以包括输入获取模块602,被配置为获取包括第一文本、以及第一文本相关联的问题集的第一输入,第一输入包括将问题集中的多个问题分隔开的第一分隔标识符。装置600还可以包括问题集预处理模块604,被配置为确定指示第一分隔标识符在第一输入中的位置的问题索引、以及针对问题集的问题掩码,其中问题掩码用于对第一输入中的问题集进行筛选。装置600还可以包括输出确定模块606,被配置为基于问题索引、问题掩码以及阅读理解模型,确定与第一输入相对应的第一输出,以用于生成与多个问题分别对应的多个答案。

在一些实施例中,其中第一输入还包括与第一分隔标识符不同的第二分隔标识符,第二分隔标识符将第一文本与问题集分隔开。

在一些实施例中,问题集预处理模块604还包括:问题索引构建模块,被配置为构建与问题集相关联的问题索引向量,问题索引向量中的一组第一元素与问题集所包括的每个字符以及第一分隔标识符相对应,并指示问题集所包括的每个字符以及第一分隔标识符的位置;以及问题索引确定模块,被配置为通过将与第一分隔标识符相对应的第一元素设置为第一值,确定问题索引。

在一些实施例中,问题集预处理模块604还包括:第一数据项构建模块,被配置为构建与问题集相关联的第一数据项,第一数据项包括以行和列表示的一组第二元素,一组第二元素与问题集所包括的每个字符以及第一分隔标识符相对应,并指示问题集所包括的每个字符以及第一分隔标识符的位置;第二元素确定模块,被配置为确定一组第二元素中与问题集所包括的每个字符相对应的多个第二元素;以及问题掩码确定模块,被配置为通过将多个第二元素设置为第一值,来确定问题掩码。

在一些实施例中,装置600还包括:第一特征表示确定模块,被配置为基于第一输出,确定与第一文本相关联的第一文本特征表示、以及与问题集相关联的问题集特征表示;第二特征表示确定模块,被配置为基于问题索引,确定问题集特征表示中分别与问题集中的每个问题相关联的问题特征表示;以及第一答案生成模块,被配置为基于第一文本特征表示以及与问题集中的每个问题相关联的问题特征表示,生成多个答案。

在一些实施例中,答案生成模块还包括:第二数据项构建模块,被配置为基于与问题集中的每个问题相关联的问题特征表示,构建以行和列表示的第二数据项,第二数据项中的一行对应于与问题集中的一个问题相关联的问题特征表示;以及第三数据项确定模块,被配置为通过对第二数据项以及第一文本特征表示进行第一操作,确定以行和列表示的第三数据项,第三数据项包括与问题集相关联的起始标识符元素以及终止标识符元素;并且答案生成模块被进一步配置为基于起始标识符元素以及终止标识符元素,利用第一文本来生成多个答案。

图7示出了根据本公开的实施例的训练阅读理解模型的方法的流程图。

在框702,计算设备105可以获取训练数据,训练数据包括第一文本、以及第一文本相关联的问题集。

可以理解,训练数据可以按照参考图2中的框202和204所描述的方法进行准备,以使得阅读理解模型能够读取并准确处理。

在框704,计算设备105可以利用前面参考图2至图5所描述的方法,生成多个答案。

在框706,计算设备105可以基于多个答案与对应的多个真实答案之间的差异,更新阅读理解模型的参数,从而训练阅读理解模型。

以此方式,在阅读理解模型的训练过程中,基于同一文档的多个问题可以一次获取多个结果以用于对阅读理解模型参数的更新,由此可以减少训练所需的数据量,并且可以改进训练的效率。

图8示出了根据本公开的实施例的训练阅读理解模型的装置的示意框图,如图8所示,装置800可以包括数据获取模块802,被配置为获取训练数据,训练数据包括第一文本、以及第一文本相关联的问题集。装置800还可以包括第二答案生成模块804,被配置为利用前面参考图2至图5所描述的方法,生成多个答案。装置800还可以包括训练模块806,被配置为基于多个答案与对应的多个真实答案之间的差异,更新阅读理解模型的参数,从而训练阅读理解模型。

根据本申请的实施例,本申请还提供了一种电子设备、一种计算机可读存储介质以及计算机程序产品。

如图9所示,是根据本申请实施例的确定问题的答案的方法的电子设备900的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的确定问题的答案的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的确定问题的答案的方法。

存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的确定问题的答案方法对应的程序指令/模块(例如,图6所示的输入获取模块602、问题集预处理模块604和输出确定模块606,图8所示的数据获取模块802、第二答案生成模块804以及训练模块806)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的确定问题的答案的方法。

存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据确定问题的答案的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至确定问题的答案的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

确定问题的答案的方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息,以及产生与训练关键短语标识模型的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

通过根据本申请实施例的技术方案,计算设备在例如通过阅读理解模型处理问题集中的第一问题、以及第一文本时,通过设置问题掩码,问题集中其他问题的文本对阅读理解模型是不可见的,因此可以排除多个问题被拼接在一起之后,其他问题中所包括的字符对第一问题的影响。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1