融合知识图谱的对话知识点确定模型的生成方法及装置与流程

文档序号:29856599发布日期:2022-04-30 09:32阅读:111来源:国知局
融合知识图谱的对话知识点确定模型的生成方法及装置与流程

1.本技术涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能领域,具体涉及一种融合知识图谱的对话知识点确定模型的生成方法及装置。


背景技术:

2.随着科学技术的发展,生成式对话系统在生活中的应用越来越广泛,给人们的生活带来了极大的便利。若生成式对话系统生成的对话中涉及的知识点不准确,显然会影响用户体验。
3.因此,如何提高知识点的准确性是亟待解决的问题。


技术实现要素:

4.本技术提供了一种融合知识图谱的对话知识点确定模型的生成方法及装置。
5.根据本技术的一方面,提供了一种融合知识图谱的对话知识点确定模型的生成方法,包括:
6.获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本;
7.将所述对话文本中的历史对话文本输入初始语义模型中,以确定所述历史对话文本对应的第一语义向量;
8.将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
9.根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;
10.基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型。
11.根据本技术的另一方面,提供了一种对话的生成方法,包括:
12.获取历史对话文本;
13.将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如一方面实施例所述的方法生成的;
14.根据所述关联度,确定所述历史对话文本对应的目标知识点;
15.根据所述目标知识点及所述历史对话文本,生成答复语句。
16.根据本技术的另一方面,提供了一种融合知识图谱的对话知识点确定模型的生成装置,包括:
17.获取模块,用于获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本;
18.第一确定模块,用于将所述对话文本中的历史对话文本输入初始语义模型中,以
确定所述历史对话文本对应的第一语义向量;
19.第二确定模块,用于将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
20.第三确定模块,用于根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;
21.修正模块,用于基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型。
22.根据本技术的另一方面,提供了一种对话的生成装置,包括:
23.获取模块,用于获取历史对话文本;
24.第一确定模块,用于将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如上述一方面实施例所述的方法生成的;
25.第二确定模块,用于根据所述关联度,确定所述历史对话文本对应的目标知识点;
26.生成模块,用于根据所述目标知识点及所述历史对话文本,生成答复语句。
27.根据本技术的另一方面,提供了一种电子设备,包括:
28.至少一个处理器;以及
29.与所述至少一个处理器通信连接的存储器;其中,
30.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例所述的方法。
31.根据本技术的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述实施例所述的方法。
32.根据本技术的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述实施例所述方法的步骤。
33.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
34.附图用于更好地理解本方案,不构成对本技术的限定。其中:
35.图1为本技术一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
36.图2为本技术另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
37.图3为本技术另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
38.图4为本技术一实施例提供的对话知识点确定模型的训练示意图;
39.图5为本技术一实施例提供的对话的生成方法的流程示意图;
40.图6为本技术一实施例提供的对话生成过程示意图;
41.图7为本技术一实施例提供的融合知识图谱的对话知识点确定模型的生成装置的
结构示意图;
42.图8为本技术一实施例提供的对话的生成装置的结构示意图;
43.图9是用来实现本技术实施例的融合知识图谱的对话知识点确定模型的生成方法或对话的生成方法的电子设备的框图。
具体实施方式
44.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
45.下面参考附图描述本技术实施例的融合知识图谱的对话知识点确定模型的生成方法及装置。
46.人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术领域也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
47.nlp(natural language processing,自然语言处理)是计算机科学领域与人工智能领域中的一个重要方向,nlp研究的内容包括但不限于如下分支领域:文本分类、信息抽取、自动摘要、智能问答、话题推荐、机器翻译、主题词识别、知识库构建、深度文本表示、命名实体识别、文本生成、文本分析(词法、句法、语法等)、语音识别与合成等。
48.深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
49.图1为本技术一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
50.如图1所示,该融合知识图谱的对话知识点确定模型的生成方法包括:
51.步骤101,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
52.本技术的对话知识点确定模型的生成方法,可以应用于某领域的生成式对话系统,比如应用于机场服务的生成式对话系统、应用于银行服务的对话系统等,也可以应用于开放域对话系统。若应用于某领域的对话系统,训练预料集中的知识图谱可以是针对该领域的,也可以是包含各个领域的;若应用于开放域对话系统,训练预料集中的知识图谱是包含各个领域的。
53.本技术中,对话文本可以是从对话系统中获取的一轮对话,对话文本可以包括此轮对话中的历史对话文本和当前问询语句对应的答复语句。其中,历史对话文本可以包括至少一对问答语句。
54.可以理解的是,训练预料集中可以包括多个对话文本,每个对话文本属于同一轮对话。
55.步骤102,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
56.本技术中,可以将对话文本中的历史对话文本输入初始语义模型中,初始语义模型可以对历史对话文本中各个语句进行处理,获取各个语句的向量,并将各个语句的向量进行融合,得到历史对话文本对应的第一语义向量。在对每个语句进行处理时,可以考虑每个语句之前的历史语句,得到每个语句的向量,从而可以提高第一语义向量的准确性。
57.步骤103,将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
58.其中,正样本节点可以是知识图谱中与对话文本中的答复语句匹配的节点,负样本节点可以是与对话文本中的答复语句不匹配的节点,或者也可以是知识图谱中除正样本节点外的其他节点。
59.本技术中,正样本节点的数量可以是一个,也可以是多个,负样本节点的数量可以是一个,也可以是多个,本技术对此不作限定。
60.本技术中,可以将与答复语句对应的正样本节点和负样本节点分别输入到初始图网络中,初始图网络对正样本节点和负样本节点进行向量表示,以获取正样本节点对应的第二语义向量和负样本节点对应的第三语义向量。
61.步骤104,根据第一语义向量分别与第二语义向量及所述第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度。
62.本技术中,可以根据历史对话文本对应的第一语义向量、正样本节点对应的第二语义向量、负样本节点对应的第三语义向量,对历史对话文本和知识图谱进行联合表示训练。
63.在实现时,可以计算第一语义向量与第二语义向量之间的关联度,以及第一语义向量与第三语义向量之间的关联度,并根据第一语义向量与第二语义向量之间的关联度,及第一语义向量与第三语义向量之间的关联度,确定初始语义模型和初始图网络分别对应的修正梯度。
64.由于第一语义向量与第二语义向量之间的关联度越大,第一语义向量与第三语义向量之间的关联度越小,说明语义模型和图网络的准确性越高,因此,本技术中,可以将第一语义向量与第二语义向量之间的关联度越大,第一语义向量与第三语义向量之间的关联度越小,作为训练目标,进而根据关联度确定修正梯度。
65.可以理解的是,第一语义向量与第二语义向量之间的关联度越小,修正梯度越大;第一语义向量与第三语义向量之间的关联度越大,修正梯度越大。
66.步骤105,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
67.本技术中,可以根据初始语义模型对应的修正梯度,对初始语义模型的参数进行调整,根据初始图网络对应的修正梯度,对初始图网络的参数进行调整。在对初始语义模型和初始图网络修正后,继续利用训练预料集中的对话文本,对修正后的初始语义模型和初始图网络进行修正,直至语义模型和图网络满足训练结束条件,获取对话知识点确定模型。
68.在训练结束时,根据图网络可以获取知识图谱中各节点的语义向量。
69.本技术实施例中,通过利用知识图谱和对话文本,对初始语义模型和初始图网络进行联合训练,从而对对话文本和知识图谱进行联合建模,对对话文本和知识图谱上的节点进行向量化表示,得到对话知识点确定模型利用对话知识点模型推断知识点,从而提高了知识点的准确性。
70.为了便于说明,本技术的另一个实施例提供了一种融合知识图谱的对话知识点确定模型的生成方法。下面结合图2进行说明,图2为本技术另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
71.如图2所示,该融合知识图谱的对话知识点确定模型的生成方法,包括:
72.步骤201,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
73.本技术中,步骤201与上述步骤101类似,故在此不再赘述。
74.步骤202,确定对话文本中的答复语句中包含的实体。
75.本技术中,可以对对话文本中的答复语句进行分词处理,获取答复语句中包含的各个分词,并根据各个分词的词性,确定答复语句中包含的实体。
76.比如,答复语句为“今天天气晴”,可以将词性为名词的“天气”,确定为该答复语句中包含的实体。
77.步骤203,确定知识图谱中与实体对应的节点为与答复语句对应的正样本节点。
78.在获取答复语句中包含的实体后,可以将实体与知识图谱中的各个节点进行匹配,并根据实体与各节点之间的匹配度,确定正样本节点。比如,可以将知识图谱中与实体匹配度最高的节点,作为答复语句对应的正样本节点。
79.由此,从答复语句中抽取实体,将实体映射到知识图谱中,将与实体对应的节点作为正样本节点,从而可以从知识图谱中确定出可以作为答复语句中知识点的节点。
80.步骤204,将知识图谱中除正样本节点外的至少一个其余节点,确定为答复语句对应的负样本节点。
81.考虑到模型的训练效率,在确定正样本节点之后,可以从知识图谱中除正样本节点外的节点中随机选择一个或者多个节点,作为答复语句对应的负样本节点。从而,可以从知识图谱中确定出不能作为答复语句中知识的节点。
82.步骤205,确定正样本节点及负样本节点分别在知识图谱中的边关系及关联节点。
83.其中,关联节点可以是指所有一级邻居节点,或者关联度最高的预设数量的一级邻居节点,或者邻居节点也可以是多级邻居节点等。
84.本技术中,可以根据知识图谱中各节点的图谱信息,确定正样本节点的邻居节点及正样本节点与邻居节点之间的边关系,也就是确定正样本节点在知识图谱中的边关系及关联节点。同样地,可以采用类似方式,确定负样本节点在知识图谱中的边关系及关联节点。
85.步骤206,根据边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息。
86.本技术中,可以根据正样本节点对应的边关系及关联节点,确定正样本节点对应节点信息。其中,正样本节点对应的节点信息,可以包括正样本节点的节点信息、正样本节点的关联节点的信息、正样本节点与其关联节点之间边关系的属性信息等。
87.同样地,可以根据负样本节点对应的边关系及关联节点,确定负样本节点对应节
点信息。其中,负样本节点对应的节点信息,可以包括负样本节点的节点信息、负样本节点的关联节点的信息、负样本节点与其关联节点之间边关系的属性信息等。
88.步骤207,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
89.本技术中,步骤207与上述步骤102类似,故在此不再赘述。
90.需要说明的是,步骤202-步骤206也可以在步骤207之后执行,本技术对此不作限定。
91.步骤208,将节点信息,输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
92.本技术中,可以将正样本节点对应的节点信息输入到初始图网络中,初始图网络对节点信息进行语义表示,确定正样本节点对应的第二语义向量。同样地,可以将负样本节点对应的节点信息输入到初始图网络中,初始图网络对节点信息进行语义表示,确定负样本节点对应的第三语义向量。
93.本技术中,通过将根据边关系及关联节点,分别确定的正样本节点及负样本节点对应的节点信息,输入到初始图网络中,得到第二语义向量和第三语义向量,从而可以使得正样本节点和负样本节点聚合它们周围的子图信息,使每个节点不仅包含自身的文本信息,更聚合了整个知识图谱的关联信息,从而提高了语义向量的准确性,进而提高了模型的准确性。
94.步骤209,根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度。
95.步骤210,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
96.本技术中,步骤209-步骤210与上述步骤104-步骤105类似,故在此不再赘述。
97.本技术实施例中,通过根据对话文本中答复语句中包含的实体,从知识图谱中确定出答复语句对应的正样本节点和负样本节点,从而可以从知识图谱中确定出可以作为答复语句中知识点的节点,以及不能作为答复语句中知识的节点,并根据正样本节点及负样本节点分别在知识图谱中的边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息,根据节点信息,确定第二语义向量和第三语义向量,从而提高了语义向量的准确性。
98.为了便于说明,本技术的另一个实施例提供了一种融合知识图谱的对话知识点确定模型的生成方法。图3为本技术另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
99.如图3所示,该融合知识图谱的对话知识点确定模型的生成方法,包括:
100.步骤301,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
101.步骤302,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
102.步骤303,将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
103.本技术中,步骤301-步骤303与上述实施例中记载的内容类似,故在此不再赘述。
104.步骤304,确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度。
105.本技术中,可以计算第一语义向量与第二语义向量之间的距离,根据距离,确定第一关联度。其中,第一语义向量与第二语义向量之间的距离越小,说明第一关联度越大,第一语义向量与第二语义向量之间的距离越大,说明第一关联度越小。
106.同样地,可以计算第一语义向量与第三语义向量之间的距离,根据距离,确定第二关联度。
107.步骤305,根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。
108.由于第一关联度是历史对话文本与正样本节点的之间的关联度,第二关联度历史对话文本与负样本节点的之间关联度,因此,本技术中,可以将第一关联度大于第二关联度、且第一关联度与第二关联度之间的差值越小,作为训练目标,由此可以根据第一关联度与第二关联度间的差值,以及第一关联度与第二关联度之间的大小关系,确定初始语义模型对应的修正梯度和初始图网络对应的修正梯度。
109.比如,若第一关联度小于第二关联度,那么修正梯度越大,若第一关联度大于第二关联度且差值越小,修正梯度越小。
110.步骤306,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
111.本技术中,步骤306与上述步骤105类似,故在此不再赘述。
112.本技术实施例中,在根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度时,可以通过确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度,并根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。由此,在训练时考虑了负样本节点与历史对话文本之间的关联度,提高了模型的准确性。
113.上述实施例描述了,可以根据第一关联度与所述第二关联度间的差值及大小关系进行训练,在本技术的一个实施例中,还可以根据第一关联度和第二关联度与各自对应的阈值之间的差值,确定修正梯度,进而根据修正梯度修正模型。
114.在实现时,可以确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与所述第三语义向量间的第二关联度,方法与上述实施例中类似故在此不再赘述。之后,可以计算第一关联度与第一阈值之间的差值及第二关联度与第二阈值之间的差值,根据两个差值的和,确定初始语义模型对应的修正梯度及初始图网络对应的修正梯度,之后利用修正梯度调整初始语义模型和初始图网络。
115.其中,第一阈值大于第二阈值,第一阈值和第二阈值可以根据需要确定,本技术对此不作限定。
116.本技术中,两个差值的和越大,初始语义模型及初始图网络分别对应的修正梯度越大,两个差值的和越小,初始语义模型及初始图网络分别对应的修正梯度越小。
117.本技术实施例中,通过确定第一语义向量与第二语义向量间的第一关联度,及第
一语义向量与第三语义向量间的第二关联度;根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定初始语义模型及初始图网络分别对应的修正梯度。由此,通过根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定修正梯度,在训练时考虑了负样本节点与历史对话文本之间的关联度,提高了模型的准确性。
118.为了便于理解,下面结合图4进行说明,图4为本技术一实施例提供的对话知识点确定模型的训练示意图。
119.如图4所示,对话知识点确定模型可以分为输入层、表示层、匹配层,可以将transformer(前序编解码预测器)作为语义模型,将历史对话文本输入到transformer中,可以得到历史对话文本对应的语义向量,同时可以从对话答复中抽取实体,将实体映射到知识图谱中得到正样本节点(可以作为答复语句中的知识点的节点)和负样本节点(随机采样的不能作为答复语句中的知识点的节点)。
120.在获取正样本节点和负样本节点后,可以将正样本节点和负样本节点分别输入到图网络中,可以获取正样本节点对应的语义向量和负样本节点对应的语义向量。之后,可以计算历史对话文本的语义向量与正样本节点对应的语义向量之间的第一关联度,以及历史对话文本的语义向量与负样本节点对应的语义向量之间的第二关联度,可以根据第一关联度和第二关联度,确定损失函数,利用损失函数分别调整transformer和图网络的模型参数。
121.为了实现上述实施例,本技术实施例还提出一种对话的生成方法。图5为本技术一实施例提供的对话的生成方法的流程示意图。
122.如图5所示,该对话的生成方法包括:
123.步骤501,获取历史对话文本。
124.本技术中,可以获取本轮对话中之前的历史对话文本。其中,历史对话文本中可以一对或多对问答语句。
125.步骤502,将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度。
126.其中,预设的对话知识点确定模型可以是采用上述实施例中记载的方式生成的,在此不再赘述。
127.本技术中,可以将历史对话文本中输入对话知识点确定模型中,对话知识点确定模型可以利用语义模型,确定历史对话文本对应的语义向量,并将历史对话文本对应的语义向量与知识图谱中各节点的语义向量分别进行匹配,从而可以确定历史对话文本与各知识点间的关联度。其中,知识图谱中的一个节点可以看作是一个知识点。
128.步骤503,根据关联度,确定历史对话文本对应的目标知识点。
129.本技术中,可以将关联度最大的知识点,作为历史对话文本对应的目标知识点,或者也可以将各知识点与历史对话文本间的关联度按照从大到小的顺序排序,将前预设数量的知识点,作为目标知识点。从而,可以从知识图谱中检索到知识点。
130.步骤504,根据目标知识点及历史对话文本,生成答复语句。
131.本技术中,可以将目标知识点和历史对话文本,输入到预先训练的对话生成模型中,以获取答复语句。
132.比如,目标知识点为“宾馆”,历史对话文本是关于旅游的对话,用户输入的问题为“a景点附近住宿方便吗”,生成的答复语句为“距离a景点800米处有一家住宿环境不错的b宾馆”133.在训练对话生成模型时,可以使用预训练对话生成模型学习使用知识点生成包含知识点的答复语句。在训练过程中,可以使用相关技术中的对话预训练模型,利用带知识点的语料对对话预训练模型进行训练,其中,训练语料包对话文本和知识点。
134.为了让模型学到利用知识点的能力,训练预料中,知识点是从对话文本中的答复语句中抽取得到的,这样模型容易学到利用给定知识点生成回复。在训练中,可以将模型生成的答复语句与对话文本中的答复语句之间的差异,对模型参数进行更新。
135.本技术中,在训练对话生成模型时,可以采用深度学习的方式进行训练。
136.本技术实施例中,通过获取历史对话文本;将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用上述知识点确定模型方法生成的;根据关联度,确定历史对话文本对应的目标知识点;根据目标知识点及历史对话文本,生成答复语句。由此,通过利用历史对话文本和对话知识点确定模型,从知识图谱中检索到目标知识点,提高了知识点的准确性,那么基于目标知识点和历史对话文本生成答复语句,提高了答复语句的准确性。
137.为了便于理解,下面结合图6进行说明,图6为本技术一实施例提供的对话生成过程示意图。
138.如图6所示,对话生成过程可以分为两步,第一步是利用多轮对话历史和知识图谱,确定答复语句中应该出现的知识点;第二步是利用确定的知识点和多轮对话历史进行对话生成,得到答复语句。
139.为了实现上述实施例,本技术实施例还提出一种融合知识图谱的对话知识点确定模型的生成装置。图7为本技术一实施例提供的融合知识图谱的对话知识点确定模型的生成装置的结构示意图。
140.如图7所示,该融合知识图谱的对话知识点确定模型的生成装置700包括:
141.获取模块710,用于获取训练语料集,其中,训练语料集中包括知识图谱及对话文本;
142.第一确定模块720,用于将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量;
143.第二确定模块730,用于将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
144.第三确定模块740,用于根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度;
145.修正模块750,用于基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
146.在本技术实施例一种可能的实现方式中,该装置还可以包括:
147.第四确定模块,用于确定对话文本中的答复语句中包含的实体;
148.第五确定模块,用于确定知识图谱中与实体对应的节点为与答复语句对应的正样本节点;
149.第六确定模块,用于将知识图谱中除正样本节点外的至少一个其余节点,确定为答复语句对应的负样本节点。
150.在本技术实施例一种可能的实现方式中,第二确定模块730,用于:
151.确定正样本节点及负样本节点分别在知识图谱中的边关系及关联节点;
152.根据边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息;
153.将节点信息,输入初始图网络中。
154.在本技术实施例一种可能的实现方式中,第三确定模块740,用于:
155.确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度;
156.根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。
157.在本技术实施例一种可能的实现方式中,第三确定模块740,用于:
158.确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度;
159.根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定初始语义模型及初始图网络分别对应的修正梯度,其中,第一阈值大于第二阈值。
160.需要说明的是,前述融合知识图谱的对话知识点确定模型的生成方法实施例的解释说明,也适用于该实施例的融合知识图谱的对话知识点确定模型的生成装置,故在此不再赘述。
161.本技术实施例中,通过利用知识图谱和对话文本,对初始语义模型和初始图网络进行联合训练,从而对对话文本和知识图谱进行联合建模,对对话文本和知识图谱上的节点进行向量化表示,得到对话知识点确定模型利用对话知识点模型推断知识点,从而提高了知识点的准确性。
162.为了实现上述实施例,本技术实施例还提出一种对话的生成装置。图8为本技术一实施例提供的对话的生成装置的结构示意图。
163.如图8所示,该对话的生成装置800包括:
164.获取模块810,用于获取历史对话文本;
165.第一确定模块820,用于将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用如上述实施例所述的知识点确定方法生成的;
166.第二确定模块830,用于根据关联度,确定历史对话文本对应的目标知识点;
167.生成模块840,用于根据目标知识点及历史对话文本,生成答复语句。
168.需要说明的是,前述对话的生成方法实施例的解释说明,也适用于该实施例的对话的生成装置,故在此不再赘述。
169.本技术实施例中,通过获取历史对话文本;将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用上述知识点确定模型方法生成的;根据关联度,确定历史对话文本对应的目标知识点;根据目标知识点及历史对话文本,生成答复语句。由此,通过利用历史对话文本和对话知识点确定模型,从知识图谱中检索到目标知识点,提高了知识点的准确性,那么基于
目标知识点和历史对话文本生成答复语句,提高了答复语句的准确性。
170.根据本技术的实施例,本技术还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
171.图9示出了可以用来实施本技术的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
172.如图9所示,设备900包括计算单元901,其可以根据存储在rom(read-only memory,只读存储器)902中的计算机程序或者从存储单元908加载到ram(random access memory,随机访问/存取存储器)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元701、rom 902以及ram 903通过总线904彼此相连。i/o(input/output,输入/输出)接口905也连接至总线904。
173.设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
174.计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于cpu(central processing unit,中央处理单元)、gpu(graphic processing units,图形处理单元)、各种专用的ai(artificial intelligence,人工智能)计算芯片、各种运行机器学习模型算法的计算单元、dsp(digital signal processor,数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。例如,在一些实施例中,融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。
175.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、fpga(field programmable gate array,现场可编程门阵列)、asic(application-specific integrated circuit,专用集成电路)、assp(application specific standard product,专用标准产品)、soc(system on chip,芯片上系统的系统)、cpld(complex programmable logic device,复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可
编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
176.用于实施本技术的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
177.在本技术的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、ram、rom、eprom(electrically programmable read-only-memory,可擦除可编程只读存储器)或快闪存储器、光纤、cd-rom(compact disc read-only memory,便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
178.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(cathode-ray tube,阴极射线管)或者lcd(liquid crystal display,液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
179.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:lan(local area network,局域网)、wan(wide area network,广域网)、互联网和区块链网络。
180.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务(virtual private server,虚拟专用服务器)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
181.根据本技术的实施例,本技术还提供了一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行本技术上述实施例提出的融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。
182.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
183.上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1