文章知识问答方法、装置、计算机设备和存储介质与流程

文档序号:35389725发布日期:2023-09-09 13:48阅读:20来源:国知局
文章知识问答方法、装置、计算机设备和存储介质与流程

本技术涉及人工智能,特别是涉及一种文章知识问答方法、装置、计算机设备和存储介质。


背景技术:

1、随着人工智能技术的发展,出现了文章知识问答技术,这个技术可以根据目标文章的文章内容以及针对目标文章的文章问题,确定该文章问题对应的问题答案。

2、传统的文章知识问答技术中,将目标文章的文章内容输入至transformer模型中的编码器、同时将目标文章的文章问题输入至transformer模型中的解码器,transformer模型输出针对目标文章的文章问题对应的问题答案。

3、然而,transformer模型需要将文章问题向量与文章内容向量序列中的每个向量都进行特征关联,从而导致transformer模型的计算量较大,进而降低transformer模型对问题答案的预测效率。其中,文章问题向量是目标文章的文章问题对应的向量,文章内容向量序列是目标文章的文章内容对应的向量序列。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高对问题答案的预测效率的文章知识问答方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种文章知识问答方法。所述方法包括:

3、向问答模型输入目标文章的文章数据和针对所述目标文章的文章问题,所述问答模型包括解码器和质心匹配模块,所述文章数据中包括所述目标文章的文章名;

4、通过所述质心匹配模块根据目标文章的文章名,获取所述目标文章对应的语句匹配集;所述语句匹配集包括至少一个语句质心向量、以及所述语句质心向量对应的至少一个文章语句向量;所述文章语句向量是所述目标文章中的文章语句对应的向量;

5、通过所述解码器对针对所述目标文章的文章问题进行特征提取,得到文章问题向量,并向所述质心匹配模块输入所述文章问题向量;

6、通过所述质心匹配模块根据所述文章问题向量,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量,并将所述目标语句质心向量对应的各所述文章语句向量输入所述解码器;

7、通过所述解码器对所述目标语句质心向量对应的各所述文章语句向量、及所述文章问题向量进行解码处理,得到针对所述文章问题的问题答案。

8、在其中一个实施例中,所述通过所述质心匹配模块根据目标文章的文章名,获取所述目标文章对应的语句匹配集,包括:

9、通过所述质心匹配模块根据目标文章的文章名,在质心数据库中查询语句匹配集,并在查询到所述文章名对应的语句匹配集的情况下,将所述语句匹配集作为所述目标文章对应的语句匹配集。

10、在其中一个实施例中,所述问答模型还包括编码器,所述文章数据包括至少一个文章语句;所述通过所述质心匹配模块根据目标文章的文章名,获取所述目标文章对应的语句匹配集,还包括:

11、在通过所述质心匹配模块未查询到所述文章名对应的语句匹配集的情况下,根据所述文章名,确定所述目标文章中的各文章语句;

12、通过所述编码器对各所述文章语句进行编码处理,得到所述目标文章对应的语句向量集,并向所述质心匹配模块输入所述语句向量集;所述语句向量集中包括各所述文章语句对应的文章语句向量;

13、通过所述质心匹配模块对所述语句向量集中各所述文章语句向量进行聚类处理,得到至少一个所述语句质心向量、以及所述语句质心向量对应的至少一个所述文章语句向量;

14、通过所述质心匹配模块基于各所述语句质心向量、以及各所述语句质心向量对应的各所述文章语句向量,构建所述目标文章对应的语句匹配集。

15、在其中一个实施例中,所述根据所述文章名,确定所述目标文章中的各文章语句,包括:

16、根据所述目标文章的文章名,查询所述目标文章的文章内容数据;

17、对所述文章内容数据进行分句处理,得到所述目标文章中的各文章语句。

18、在其中一个实施例中,所述对所述文章内容数据进行分句处理,得到所述目标文章中的各文章语句,包括:

19、根据预设无用内容类型,从所述文章内容数据中,匹配所述预设无用内容类型对应的无用内容数据;

20、对所述文章内容数据中的所述无用内容数据进行删除处理,得到待分句的文章内容数据;

21、对所述待分句的文章内容数据进行分句处理,得到所述目标文章中的各文章语句。

22、在其中一个实施例中,所述对所述待分句的文章内容数据进行分句处理,得到所述目标文章中的各文章语句,包括:

23、对所述待分句的文章内容数据进行分句处理,得到所述目标文章中的各初始文章语句;

24、针对所述目标文章中的任一所述初始文章语句,基于所述目标文章的文章名和所述初始文章语句,构建所述目标文章中的文章语句。

25、在其中一个实施例中,所述解码器包括输入层和预设数目个解码块;所述解码块包括特征加权层;所述通过所述解码器对针对所述目标文章的文章问题进行特征提取,得到文章问题向量,包括:

26、通过所述解码器中的所述输入层对所述目标文章的文章问题进行向量化处理,获得文章问题初始向量;

27、通过所述解码器中的第一个解码块的所述特征加权层对所述文章问题初始向量进行特征提取,获得文章问题向量。

28、在其中一个实施例中,所述通过所述质心匹配模块根据所述文章问题向量,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量,包括:

29、通过所述质心匹配模块根据所述文章问题向量以及各所述语句质心向量,计算所述文章问题向量分别与各所述语句质心向量的相关度;

30、通过所述质心匹配模块根据各所述语句质心向量对应的所述相关度,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量。

31、在其中一个实施例中,所述根据各所述语句质心向量对应的所述相关度,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量,包括:

32、将各所述语句质心向量中对应的所述相关度最高的语句质心向量,作为目标语句质心向量;或者,

33、针对任一所述语句质心向量,将对应的所述相关度大于预设阈值的语句质心向量,作为所述目标语句质心向量。

34、在其中一个实施例中,待训练的问答模型包括待训练的编码器、待训练的质心匹配模块、以及待训练的编码器;所述方法还包括:

35、针对任一样本文章,获取所述样本文章对应的至少一个样本文章语句、至少一个样本文章问题、以及各所述样本文章问题对应的目标问题答案;

36、通过所述待训练的编码器对各所述样本文章语句进行编码处理,得到所述样本文章对应的样本语句向量集,并向所述待训练的质心匹配模块输入所述样本语句向量集;所述样本语句向量集中包括各所述样本文章语句对应的样本语句向量;

37、通过所述待训练的解码器对所述样本文章问题进行特征提取,得到样本问题向量,并向所述待训练的质心匹配模块输入所述样本问题向量;

38、针对任一所述样本文章,通过所述待训练的质心匹配模块根据所述样本问题向量,从所述样本语句集的各所述样本语句向量中,确定所述样本文章问题向量对应的至少一个目标样本语句向量,并向所述待训练的解码器输入所述目标样本语句向量;

39、通过所述待训练的解码器对所述样本问题向量、以及所述样本问题向量对应的各所述目标样本语句向量进行解码处理,得到针对所述样本文章问题的预测答案;

40、根据各所述样本文章问题对应的所述预测答案、以及各所述样本文章问题对应的所述目标问题答案,对所述待训练的问答模型进行训练,得到所述问答模型。

41、第二方面,本技术还提供了一种文章知识问答装置。所述装置包括:

42、输入模块,用于向问答模型输入目标文章的文章数据和针对所述目标文章的文章问题,所述问答模型包括解码器和质心匹配模块,所述文章数据中包括所述目标文章的文章名;

43、第一获取模块,用于通过所述质心匹配模块根据目标文章的文章名,获取所述目标文章对应的语句匹配集;所述语句匹配集包括至少一个语句质心向量、以及所述语句质心向量对应的至少一个文章语句向量;所述文章语句向量是所述目标文章中的文章语句对应的向量;

44、第一特征提取模块,用于通过所述解码器对针对所述目标文章的文章问题进行特征提取,得到文章问题向量,并向所述质心匹配模块输入所述文章问题向量;

45、第一确定模块,用于通过所述质心匹配模块根据所述文章问题向量,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量,并将所述目标语句质心向量对应的各所述文章语句向量输入所述解码器;

46、第一解码模块,用于通过所述解码器对所述目标语句质心向量对应的各所述文章语句向量、及所述文章问题向量进行解码处理,得到针对所述文章问题的问题答案。

47、在其中一个实施例中,所述第一获取模块具体用于:

48、通过所述质心匹配模块根据目标文章的文章名,在质心数据库中查询语句匹配集,并在查询到所述文章名对应的语句匹配集的情况下,将所述语句匹配集作为所述目标文章对应的语句匹配集。

49、在其中一个实施例中,所述问答模型还包括编码器,所述文章数据包括至少一个文章语句;所述第一获取模块还用于:

50、在通过所述质心匹配模块未查询到所述文章名对应的语句匹配集的情况下,根据所述文章名,确定所述目标文章中的各文章语句;

51、通过所述编码器对各所述文章语句进行编码处理,得到所述目标文章对应的语句向量集,并向所述质心匹配模块输入所述语句向量集;所述语句向量集中包括各所述文章语句对应的文章语句向量;

52、通过所述质心匹配模块对所述语句向量集中各所述文章语句向量进行聚类处理,得到至少一个所述语句质心向量、以及所述语句质心向量对应的至少一个所述文章语句向量;

53、通过所述质心匹配模块基于各所述语句质心向量、以及各所述语句质心向量对应的各所述文章语句向量,构建所述目标文章对应的语句匹配集。

54、在其中一个实施例中,所述第一获取模块具体用于:

55、根据所述目标文章的文章名,查询所述目标文章的文章内容数据;

56、对所述文章内容数据进行分句处理,得到所述目标文章中的各文章语句。

57、在其中一个实施例中,所述第一获取模块具体用于:

58、根据预设无用内容类型,从所述文章内容数据中,匹配所述预设无用内容类型对应的无用内容数据;

59、对所述文章内容数据中的所述无用内容数据进行删除处理,得到待分句的文章内容数据;

60、对所述待分句的文章内容数据进行分句处理,得到所述目标文章中的各文章语句。

61、在其中一个实施例中,所述第一获取模块具体用于:

62、对所述待分句的文章内容数据进行分句处理,得到所述目标文章中的各初始文章语句;

63、针对所述目标文章中的任一所述初始文章语句,基于所述目标文章的文章名和所述初始文章语句,构建所述目标文章中的文章语句。

64、在其中一个实施例中,所述解码器包括输入层和预设数目个解码块;所述解码块包括特征加权层;所述第一特征提取模块具体用于:

65、通过所述解码器中的所述输入层对所述目标文章的文章问题进行向量化处理,获得文章问题初始向量;

66、通过所述解码器中的第一个解码块的所述特征加权层对所述文章问题初始向量进行特征提取,获得文章问题向量。

67、在其中一个实施例中,第一确定模块具体用于:

68、通过所述质心匹配模块根据所述文章问题向量以及各所述语句质心向量,计算所述文章问题向量分别与各所述语句质心向量的相关度;

69、通过所述质心匹配模块根据各所述语句质心向量对应的所述相关度,从各所述语句质心向量中确定与所述文章问题向量相匹配的目标语句质心向量。

70、在其中一个实施例中,第一确定模块具体用于:

71、将各所述语句质心向量中对应的所述相关度最高的语句质心向量,作为目标语句质心向量;或者,

72、针对任一所述语句质心向量,将对应的所述相关度大于预设阈值的语句质心向量,作为所述目标语句质心向量。

73、在其中一个实施例中,待训练的问答模型包括待训练的编码器、待训练的质心匹配模块、以及待训练的编码器;所述文章知识问答装置还包括:

74、第二获取模块,用于针对任一样本文章,获取所述样本文章对应的至少一个样本文章语句、至少一个样本文章问题、以及各所述样本文章问题对应的目标问题答案;

75、编码模块,用于通过所述待训练的编码器对各所述样本文章语句进行编码处理,得到所述样本文章对应的样本语句向量集,并向所述待训练的质心匹配模块输入所述样本语句向量集;所述样本语句向量集中包括各所述样本文章语句对应的样本语句向量;

76、第二特征提取模块,用于通过所述待训练的解码器对所述样本文章问题进行特征提取,得到样本问题向量,并向所述待训练的质心匹配模块输入所述样本问题向量;

77、第二确定模块,用于针对任一所述样本文章,通过所述待训练的质心匹配模块根据所述样本问题向量,从所述样本语句集的各所述样本语句向量中,确定所述样本文章问题向量对应的至少一个目标样本语句向量,并向所述待训练的解码器输入所述目标样本语句向量;

78、第二解码模块,用于通过所述待训练的解码器对所述样本问题向量、以及所述样本问题向量对应的各所述目标样本语句向量进行解码处理,得到针对所述样本文章问题的预测答案;

79、训练模块,用于根据各所述样本文章问题对应的所述预测答案、以及各所述样本文章问题对应的所述目标问题答案,对所述待训练的问答模型进行训练,得到所述问答模型。

80、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以第一方面所述的步骤。

81、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以第一方面所述的步骤。

82、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时以第一方面所述的步骤。

83、上述文章知识问答方法、装置、计算机设备、存储介质和计算机程序产品,通过向问答模型输入目标文章的文章数据和针对目标文章的文章问题,问答模型包括解码器和质心匹配模块,文章数据中包括目标文章的文章名;通过质心匹配模块根据目标文章的文章名,获取目标文章对应的语句匹配集;语句匹配集包括至少一个语句质心向量、以及语句质心向量对应的至少一个文章语句向量;文章语句向量是目标文章中的文章语句对应的向量;通过解码器对针对目标文章的文章问题进行特征提取,得到文章问题向量,并向质心匹配模块输入文章问题向量;通过质心匹配模块根据文章问题向量,从各语句质心向量中确定与文章问题向量相匹配的目标语句质心向量,并将目标语句质心向量对应的各文章语句向量输入解码器;通过解码器对目标语句质心向量对应的各文章语句向量、及文章问题向量进行解码处理,得到针对文章问题的问题答案。

84、上述方法中,问答模型包括解码器和质心匹配模块,具体的,通过解码器获取针对目标文章的文章问题对应的文章问题向量。通过质心匹配模块根据目标文章对应的文章问题向量、以及目标文章对应的语句匹配集,从该语句匹配集包括的各文章语句向量中,确定文章问题向量对应的至少一个文章语句向量。通过解码器根据文章问题向量、以及文章问题向量对应的各文章语句向量,确定针对该文章问题的问题答案。可以理解,相对于目标文章的所有文章内容,该文章问题向量对应的文章语句向量对应的数据量更少,从而减少问答模型对数据的处理量,进而提高对问题答案的预测效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1