问答系统的制作方法

文档序号:23674729发布日期:2021-01-23 07:17阅读:141来源:国知局
问答系统的制作方法

[0001]
本发明涉及问答系统(question answering)技术领域,具体是一种能根据使用者的提问输出较佳或最佳答案或提问的问答系统。


背景技术:

[0002]
传统的问答系统是将问题与答案相互配对建立成资料库,当使用者问什么问题,便到资料库中查询对应的答案而输出。此作法的缺点是需要持续扩充问答资料,而且没有一个判断准则来判断查询到的答案是否正确。并且,若查询不到相关的题目,便无法输出答案,问答方式死板。


技术实现要素:

[0003]
鉴于上述问题,本发明提出一种问答系统,介以解决先前技术存在之问题。
[0004]
在一实施例,问答系统包括:输入模块、解构模块、树状模型、评分模块及输出模块。输入模块供接收用户输入的提问信息。解构模块供拆分所述提问信息成多个词语。树状模型包括多个节点,此些节点包括一个根节点及自根节点多层延伸的多个叶节点。各个节点具有多个运算规则及一信息。评分模块将词语作为多个标签而由根节点输入,依照运算规则计算多个指标,并依据指标计算一评分。输出模块将对应于较佳或最佳的评分的节点的信息输出。
[0005]
依据一些实施例,运算规则包括一必要标签规则。
[0006]
依据一些实施例,运算规则包括一禁止标签规则。
[0007]
依据一些实施例,运算规则包括一逻辑运算规则,逻辑运算规则包括多个标示及一逻辑符。
[0008]
依据一些实施例,多个指标包括一有效度(validity)指标。标签包括至少一必要标签或/及至少一禁止标签。有效度指标根据末端的叶节点至根节点之间经过的每一节点的必要标签规则、禁止标签规则及逻辑运算规则的计算结果累计而成。若必要标签满足必要标签规则,则当前节点的计算结果为1。若禁止标签满足禁止标签规则,则当前节点的计算结果为0。其余情形则将必要标签代入逻辑运算规则作为计算结果。
[0009]
依据一些实施例,多个指标包括一信心值(confidence)指标。标签包括至少一必要标签或/及至少一禁止标签。信心值指标根据末端的叶节点至根节点之间经过的每一节点的必要标签规则、禁止标签规则及逻辑运算规则的计算结果累计而成。若必要标签满足必要标签规则,则当前节点的计算结果为1。若禁止标签满足禁止标签规则,则当前节点的计算结果为0。其余情形则将禁止标签代入逻辑运算规则作为计算结果。
[0010]
依据一些实施例,多个指标包括一精准度(precision)指标,系根据末端的叶节点至根节点之间经过的每一节点的逻辑运算规则的计算结果累计而成。逻辑符是反(not)逻辑时,将上一层节点累计结果转为一负数作为当前节点的计算结果。逻辑符是或(or)逻辑时,选择上一层节点累计结果中的最大值作为当前节点的计算结果。逻辑符是其他逻辑时,
将上一层节点累计结果和当前节点的标示数量相除作为当前节点的计算结果。
[0011]
依据一些实施例,多个指标包括一召回率(recall)指标,其中标签包括至少一必要标签或/及至少一禁止标签。召回率指标是(pi+ni)/(pi+ni+rpi+rni+pd),其中pi是必要标签和必要标签规则的交集,ni是禁止标签和禁止标签规则的交集,rpi是必要标签和禁止标签规则的交集,rni是禁止标签和必要标签规则的交集,pd是必要标签规则减必要标签。
[0012]
依据一些实施例,当最佳评分的节点不完全与所有输入的标签相对应时,还从其余的节点中选出对应剩余标签的最佳节点的对应信息来输出。
[0013]
综上,本发明提供一种问答系统,具有独特的评分方式,以输出较贴近的答案或进一步提问。
附图说明
[0014]
图1是本发明一实施例的问答系统的方块示意图。
[0015]
图2是本发明一实施例的树状模型的示意图。
具体实施方式
[0016]
为了使本发明的目的、特征及效果更容易理解,以下提供用于详细说明本发明的实施例及附图。
[0017]
请参阅图1,图1是本发明一实施例的问答系统100的方块示意图。问答系统100包括输入模块110、解构模块120、树状模型130、评分模块140、以及输出模块150。问答系统100可由如服务器、终端设备等计算装置实现,可远端或本地的供用户操作。
[0018]
输入模块110提供一交互介面(如以网页形式、应用程式形式呈现),而可接收用户输入的提问信息。在此,提问信息是一段文字,以医学应用为例,可以是描述身体不适的症状。
[0019]
解构模块120可对提问信息拆分成多个词语。举例而言,若用户输入「头痛、口渴、发热」的提问信息,将可拆分成三个词语,分别为「头痛」、「口渴」、及「发热」。在一些实施例中,解构模块120可以透过分词器(tokenizer)、词类标注系统(part of speech,pos)、命名实体识别(named entity recognition,ner)等方式实现。
[0020]
请参照图2,图2是本发明一实施例的树状模型130的示意图。树状模型130包括多个节点,此些节点包括一个根节点131以及自根节点131多层延伸的多个叶节点132。各个节点具有多个运算规则及对应的信息。所述信息可以是一个答案或是一个提问。有关运算规则的说明,请容后详述。本发明实施例不限制树状模型130的节点层数,末端的叶节点132至根节点131所经过的层数也不限制必然相同。
[0021]
评分模块140将所述多个词语作为多个标签而由根节点131输入,依照所述多个运算规则计算多个指标,并依据所述多个指标计算出评分。
[0022]
输出模块150和输入模块110共用同一个交互介面,或者输出模块150提供另一个交互介面,而将对应于较佳或最佳的评分的节点的信息输出。也就是说,输出模块150输出的信息可以是一个或多个。输出的信息可以是答案或是提问。因此,当用户提供的信息不够完整的时候,问答系统100会进一步提问,让用户透过输入模块110回答,再提供答案。
[0023]
所述运算规则包括必要标签规则、禁止标签规则、及逻辑运算规则。根据运算规则
可供计算出不同的指标,再根据这些指标综合评分。在一些实施例中,上述运算规则项目可视情形增减,不以此为限。
[0024]
其中一个指标是有效度(validity)指标,是根据末端的叶节点132至根节点131之间经过的每一节点的必要标签规则、禁止标签规则及逻辑运算规则的计算结果累计而成。经过解构模块120所拆分出的词语是由评分模块140作为多个标签输入至树状模型130中。此些标签可以包括正面表述的标签(后称「必要标签」),例如出现的病徵;也可以包括负面表述的标签(后称「禁止标签」),例如没有出现的病徵。在对于某一节点进行计算时,若必要标签满足此节点的必要标签规则,亦即此节点的必要标签规则所列出的所有标示都出现在必要标签之中,则当前节点的计算结果为1。例如,此节点的必要标签规则包括「发烧」和「头痛」两个标示,如前述之例,此两个标示出现在使用者输入的三个词语当中,因此当前节点的计算结果为1。相似地,若禁止标签满足此节点的禁止标签规则,亦即此节点的禁止标签规则所列出的所有标示都出现在禁止标签之中,则当前节点的计算结果为0。其余情形则将必要标签代入所述逻辑运算规则作为计算结果。假如必要标签规则中的某一标示与必要标签相符则该标示设为1,假如必要标签规则中的标示与禁止标签相符则该标示设为0,其余情况则该标示设为0.5。依此可计算出每一个节点的计算结果。末端的叶节点132作为输出节点,累计自身到根节点131中经过的每个节点的计算结果。也就是说,每一个输出节点都会计算出一个有效度指标,代表的含意是输出节点的对应信息的可信度。
[0025]
所述逻辑计算规则除了包括前述标示之外,还包括一个逻辑符。逻辑符可以包括但不限于与(and)逻辑、或(or)逻辑、非(not)逻辑等。所述逻辑计算规则是指一个邏輯符連結二个表达式,表达式可以为单独的标示,或者由另一个或更多的逻辑符连接多个标示所构成。例如:a and b;c or(a and b)。
[0026]
另一个指标是信心值(confidence)指标,和前述有效度指标相似,同样是根据末端的叶节点132至根节点131之间经过的每一节点的必要标签规则、禁止标签规则及逻辑运算规则的计算结果累计而成。对于满足必要标签规则和满足禁止标签规则的计算结果的判断也是和有效度指标相同的。也就是说,若必要标签满足此节点的必要标签规则,亦即此节点的必要标签规则所列出的所有标示都出现在必要标签之中,则当前节点的计算结果为1;若禁止标签满足此节点的禁止标签规则,亦即此节点的禁止标签规则所列出的所有标示都出现在禁止标签之中,则当前节点的计算结果为0。和有效度指标不同的是,其余情形是将禁止标签代入所述逻辑运算规则作为计算结果。依此可计算出每一个节点的计算结果。末端的叶节点132作为输出节点,累计自身到根节点131中经过的每个节点的计算结果。也就是说,每一个输出节点都会计算出一个信心值指标,代表的含意是输出节点的有效度指标的可信度。
[0027]
还有一个指标是精准度(precision)指标,有别于前述有效度指标和信心值指标是根据逻辑运算规则来计算得计算结果,精准度指标的计算会因节点的逻辑符类型而有所不同。精准度指标是根据末端的叶节点132至根节点131之间经过的每一节点的逻辑运算规则的计算结果累计而成。若当前节点的逻辑符是反逻辑,则将上一层节点的累计结果转为负数,作为当前节点的计算结果。若当前节点的逻辑符是或逻辑时,选择所连结到的上一层的多个节点的累计结果中的最大值作为当前节点的计算结果。对于其他的逻辑符,则是将上一层节点累计结果和当前节点的标示的数量相除,作为当前节点的计算结果。以前述的
例子而言,标示数量为三,则将上一层节点累计结果除以三。因此,每一个输出节点都会计算出一个精准度指标,代表的含意是输出节点的信息的精准度。若输出节点是通过较多的节点分支,则较不精准。
[0028]
再一个指标是召回率(recall)指标。召回率指标的计算式为(pi+ni)/(pi+ni+rpi+rni+pd),其中pi是必要标签和必要标签规则中的标示的交集,ni是禁止标签和禁止标签规则中的标示的交集,rpi是必要标签和禁止标签规则中的标示的交集,rni是禁止标签和必要标签规则中的标示的交集,pd是必要标签规则中的标示减必要标签。因此,每一个输出节点都会计算出一个召回率指标,所代表的含意是输出节点至根节点131的路径对于标签的满足程度。
[0029]
评分模块140最终会将上述有效度指标、信心值指标、精准度指标、及召回率指标综合成一分数。在一实施例中,所综合的分数是将此些指标相乘。依据综合出的分数予以排序,可获得最佳的一个节点所对应的信息,或较佳的几个节点所对应的信息,作为输出。在一些实施例中,输出的结果可以是复合的输出。当最佳评分的节点不完全与所有输入的标签相对应时,还从其余的节点中选出对应剩余标签的最佳节点的对应信息来输出。举例来说,若输入树状模型130的标签是a、b、c、d四项,最后获得的输出节点分别对应的信息是r1~rn,n为输出节点数量。其中最佳的信息是r1,但r1仅与a、b、c相应。而r1~rn中其余的信息中,与d相关的最佳信息ri将会与r1构成一个复合输出。在一些实施例中,r2~rn中对应节点的分数分別和r1的分数合并计算,计算结果中最佳的对应信息r1

会与r1构成一个复合输出。所述合并计算的计算式是((validity1+validity2)*(confidence1+confidence2)*(recall1+recall2)*(precision1+precision2))/2,其中validity1、confidence1、recall1、和precision1分别是r1对应节点的有效度指标、信心值指标、召回率指标、和精准度指标;validity2、confidence2、recall2、和precision2分别是r2~rn中的其中一个对应节点的有效度指标、信心值指标、召回率指标、和精准度指标。
[0030]
在一些实施例中,所述复合输出可以包括二个以上的节点所对应的信息,不以上述二个为限。
[0031]
在一些实施例中,合并计算的方式不以上述计算平均的方式为限,还可以有其他方式。例如,对第一个结果设定较高的权重,其余的结果的权重依次递减。
[0032]
综上,本发明提供一种问答系统,具有独特的评分方式,以输出较贴近的答案或进一步提问。
[0033]
虽然本发明的技术内容已经以较佳实施例揭露如上,然其并非用以限定本发明,任何熟习此技艺者,在不脱离本发明的精神所作些许的更动与润饰,皆应涵盖于本发明的范畴内,因此本发明的专利保护范围当以前列的权利范围所界定者为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1