人机对话控制方法及装置、终端与流程

文档序号:29401192发布日期:2022-03-26 00:38阅读:110来源:国知局
1.本发明涉及智能终端
技术领域
:,尤其涉及一种人机对话控制方法及装置、终端。
背景技术
::2.随着智能化技术不断发展,一些智能终端中可以提供与用户进行人机对话的智能助手,如图1所示的现有技术中人机对话系统的原理示意图,现有技术中的智能助手会根据用户的自然语言为用户提供相应的服务或语音回复,然而现有的智能助手只会被动的应对用户的指令,无法做到真正理解对话的含义,缺少主动推动对话进行的能力。技术实现要素:3.本发明实施例提供一种人机对话控制方法及装置、终端,该人机对话控制方法可以根据用户输入的自然语言生成当前对话初始知识图谱,并通过在预存的语义记忆层中关联出与当前对话初始知识图谱相关的认知信息,并填充至前对话初始知识图谱得到当前对话扩充知识图谱,进而根据当前对话扩充知识图谱得到聚焦的认知信息,再根据聚焦的认知信息生成本次回复内容,可以真正理解用户对话的含义,在了解用户对话含义的基础上回复用户,进而可以实现主动推动对话。4.第一方面,本发明实施例提供一种人机对话控制方法,该方法包括:5.获取当前对话中用户输入的自然语言;6.根据当前对话中用户输入的自然语言生成当前对话初始知识图谱,所述当前对话初始知识图谱包括至少一个对话认知信息,所述对话认知信息由特定对象、通用对象、事件和情境中至少一者构成;7.所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联,所述语义记忆层用于存储多个语义记忆认知信息,所述语义记忆认知信息由通用对象和情境构成;8.根据所述语义记忆层中与所述对话认知信息相关联的语义记忆认知信息填充所述当前对话初始知识图谱,得到当前对话扩充知识图谱;9.根据所述当前对话扩充知识图谱得到聚焦的认知信息;10.根据所述聚焦的认知信息生成本次回复内容。11.进一步地,所述将所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联的过程包括:12.若语义记忆层已存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息与语义记忆层中已存在的对应的语义记忆认知信息相关联;13.若语义记忆层中不存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层。14.进一步地,所述将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层包括:15.基于所述新的语义记忆认知信息的所要表达的语义,为所述新的语义记忆认知信息提供相应的认知信息id,并将携带认知信息id的所述新的语义记忆认知信息存储至语义记忆层。16.进一步地,所述新的语义记忆认知信息中的事件具有对应的用户标识、对用户的信任指数、确信参数和活跃度。17.进一步地,所述根据所述聚焦的认知信息生成本次回复内容包括:18.将所述语义记忆层中与所述聚焦的认知信息相关联的语义记忆认知信息作为聚焦的语义记忆认知信息,将与所述聚焦的语义记忆认知信息中相关联且满足预设条件的内容作为相关内容;19.基于所述相关内容和回复机制产生本次回复内容。20.进一步地,所述基于所述相关内容和回复机制产生本次回复内容包括:21.分别基于每种回复机制确定对应的必须表达内容和概率表达内容,并基于所有回复机制对应的必须表达内容和概率表达内容产生本次回复内容。22.进一步地,所述回复机制包括回避机制;23.在所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容之前,所述基于所述相关内容和回复机制产生本次回复内容还包括:24.基于所述回避机制确定是否存在排他表达,若是,则直接根据所述回避机制产生本次回复内容,若否,则进入所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容的过程。25.进一步地,所述回复机制还包括以下一者或多者:好奇动机、联想机制、共情机制以及情绪系统;26.所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容的包括:27.基于以下回复机制中的一者或多者确定所述必须表达的内容:回避机制、好奇动机以及联想机制;以及28.基于以下回复机制中的一者或多者确定所述概率表达内容:好奇动机、联想机制、共情机制以及情绪系统。29.第二方面,本发明实施例还提供一种人机对话控制装置,所述装置包括:处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现上述人机对话控制方法。30.第三方面,本发明实施例还提供一种终端,所述终端包括上述人机对话控制装置。31.通过上述技术方案,该人机对话控制方法可以根据用户输入的自然语言生成当前对话初始知识图谱,并通过在预存的语义记忆层中关联出与当前对话初始知识图谱相关的认知信息,并填充至前对话初始知识图谱得到当前对话扩充知识图谱,进而根据当前对话扩充知识图谱得到聚焦的认知信息,再根据聚焦的认知信息生成本次回复内容,可以真正理解用户对话的含义,在了解用户对话含义的基础上回复用户,进而可以实现主动推动对话。附图说明32.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。33.图1为现有技术中人机对话系统原理示意图;34.图2为本发明实施例提供的人机对话控制方法流程示意图;35.图3为本发明实施例提供的当前对话初始知识图谱示意图;36.图4为本发明实施例提供的认知信息关联的示意图;37.图5为本发明实施例提供的当前对话初始知识图谱扩充示意图;38.图6为本发明实施例提供的聚焦的语义记忆认知信息确认流程示意图;39.图7为本发明实施例提供的语义记忆形成示意图;40.图8为本发明实施例提供的系统认知架构示意图;41.图9为本发明实施例提供的未经确定认知信息示意图;42.图10为本发明实施例提供的语义记忆关联标注示意图;43.图11为本发明实施例提供的回复策略示意图;44.图12为本发明实施例提供的人机对话控制装置结构示意图。具体实施方式45.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。46.关于现有技术中人机对话系统操作信息:47.具体地,可以通过以下举例说明现有技术中人机对话系统的相关内容:48.某智能助手做完语音识别和语义分析之后,将结构化语音分析结果打包成一个某个领域(domain)的意图(intent),然后交给支持这个意图(intent)的第三方应用(比如微信),第三方应用被启动,从传入的intent中获取相应的信息,完成操作。49.例如,“ineedtosendamessagetonancyviawechatsayingi'llbefiveminuteslate",50.领域(domain):messaging;51.意图(intent):sendamessage(insendmessageintent);52.意图参数(intentparameter);53.收件人(recipients):nancy;54.消息内容(content):i'llbefiveminuteslate。55.然而现有的智能助手仅可支持如下7个领域的共计22种意图:56.语音通话voipcalling:打电话、发起视频电话、查通话记录57.信息messaging:发信息、搜索信息58.照片搜索photosearch:搜索照片、播放照片幻灯片59.个人之间的付款payments:向某人付款、向某人收款60.健身workouts:开始健身、暂停健身、恢复健身、结束健身、取消健身61.打车ridebooking:查看附近可用的车辆、订车、查看订单62.车载carplay:切换音频输入源、空调、除霜、座椅加热、fm调台(只针对汽车厂商)。63.现有技术中存在的缺陷在于,现有的智能助手智能在上述7个领域和22种意图的范围内为用户提供服务,若出现超纲问题,会做出令人失望的回复,并且只会被动的应对用户的指令,无法做到真正理解对话的含义,缺少主动推动对话进行的能力。64.为克服上述缺陷,本发明实施例提供一种人机对话控制方法及装置、终端。具体如下:65.图2为本发明实施例提供的人机对话控制方法的流程示意图,如图2所示,该方法包括:66.步骤101:获取当前对话中用户输入的自然语言;67.步骤102:根据当前对话中用户输入的自然语言生成当前对话初始知识图谱;68.步骤103:将当前对话初始知识图谱中的对话认知信息与语义记忆层中对应的语义记忆认知信息相关联;69.步骤104:根据语义记忆层中与对话认知信息相关联的语义记忆认知信息填充当前对话初始知识图谱,得到当前对话扩充知识图谱;70.步骤105:根据当前对话扩充知识图谱得到聚焦的认知信息;71.步骤106:根据聚焦的认知信息生成本次回复内容。72.关于步骤10173.获取当前对话中用户输入的自然语言,所接收到的用户输入的自然语言可以为文本信息也可以为语音信息,语音信息转化为文本信息后进入后续步骤。74.为鼓励用户输入内容,本发明实施例在首次对话时可发出开场白例如:[0075]“你好,我是聊天机器人娜娜,有什么烦心事,有趣事都可以跟我说~”[0076]下面以收到用户输入自然语言“我老婆生了”为例。[0077]关于步骤102[0078]在接收到用户输入的自然语言后,根据当前对话中用户输入的自然语言生成当前对话初始知识图谱,所述当前对话初始知识图谱包括至少一个对话认知信息,所述对话认知信息由特定对象、通用对象、事件和情境中至少一者构成。图3示出了本发明实施例提供的当前对话初始知识图谱示意图,如图3所示,如用户输入的自然语言为“我老婆生了”,并根据该语音信息生成当前对话初始知识图谱,具体地,首先对语音信息进行分词,如将“我老婆生了”进行分词后得到“我”-“老婆”-“生了”。进一步地确定经过分词后的语音信息中的对话认知信息,对话认知信息由特定对象(so,specificobject)通用对象(co,commonobject)、事件(ev,event)和情境(st,situation)中至少一者构成,该特定对象so为指定的人或物,比如“我”、“我老婆”、“我的孩子”、“我养的猫”或“我的车”等,通用对象co泛指的人或物或者被大众熟知的特定人或物,例如,“老婆”、“流浪狗”、“孩子”、“网络游戏”、“马云”、“北斗定位系统”等。事件ev为用户的个人事件,事件ev对应当前对话知识图谱中的一个“区域”,如图3中的矩形虚线框ev#001中的内容即为当前对话知识图谱中对应的事件“老婆生了”,情境st为如:打招呼(你好/hi)、告别、分手、婚姻、亲子关系等情境或公共所知的事件,例如,“新冠疫情”、“科比去世”等。[0079]如图3所示,确定出用户输入的自然语言中的对象包括“我”(so#001)和“老婆”ꢀ(so#002),而该语音信息中事件则为“老婆生了”(ev#001)。在确定对象so和事件ev后,还可以根据当前对话用户id生成对象so和事件ev相应的认知信息id,如上述“我”的认知信息id为(so#001)、“老婆”的认知信息id为(so#002)和“老婆生了”的认知信息id为(ev#001)。[0080]关于步骤103[0081]将所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联的过程包括:[0082]若语义记忆层已存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息与语义记忆层中已存在的对应的语义记忆认知信息相关联;[0083]若语义记忆层中不存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层。[0084]将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层包括:[0085]基于所述新的语义记忆认知信息的所要表达的语义,为所述新的语义记忆认知信息提供相应的认知信息id,并将携带认知信息id的所述新的语义记忆认知信息存储至语义记忆层。新的语义记忆认知信息中的事件具有对应的用户标识、对用户的信任指数、确信参数和活跃度。[0086]具体地,将所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联,所述语义记忆层用于存储多个语义记忆认知信息,所述语义记忆认知信息由通用对象和情境构成;其中,该语义记忆层中存储多个语义记忆认知信息,不同于对话认知信息中的特定对象,语义记忆认知信息中的对象为通用对象(co,commonobject),该通用对象co泛指的人或物或者被大众熟知的特定人或物,例如,“老婆”、“流浪狗”、“孩子”、“网络游戏”、“马云”、“北斗定位系统”等。语义记忆认知信息中的情境st为如:打招呼(你好/hi)、告别、分手、婚姻、亲子关系等情境或公共所知的事件,例如,“新冠疫情”、“科比去世”等。[0087]根据步骤102中所确定的对象so和事件ev在语义记忆层中关联得到相应的通用对象co和情境st,图4示出了本发明实施例提供的认知信息关联示意图,如图4所示的,例如,用户输入的自然语言为“我老婆生了”,该语音信息中的对象so包括“我”(so#001)和“老婆”(so#002),而事件ev包括“老婆生了”(ev#001),将对象so“我”(so#001)和“老婆”(so#002)以及事件ev“老婆生了”(ev#001)向语义记忆层进行关联,可以得到相对应的通用对象co、对象间的关系以及相应情境st,其中,对象so“我”(so#001)相关联的通用对象co为“老公”(co#001),对象so“老婆”(so#002)相关联的通用对象co为“老婆”(co#002),通用对象co“老公”(co#001)与“老婆”(co#002)之间为“婚姻关系”。事件ev“老婆生了”(ev#001)相关联的情境st为“老婆生育孩子”ꢀ(st#001),根据该情境“老婆生育孩子”(st#001)进一步确定出存在于本情境(st#001)中的另一通用对象co“孩子”(co#003),其中通用对象co“老婆”(co#002)与“孩子”(co#003)之间为“生育关系”以及“母子或母女关系”,由于未确定“孩子”(co#003)的性别,因此并不能直接确定“老婆”(co#002)与“孩子”(co#003)到底是“母子关系”还是“母女关系”,而可以直接确定的是“老婆”(co#002)生育了“孩子”(co#003)。[0088]如图4所示,将所述认知信息id:ev#001、so#002对应的当前对话知识图谱中的信息“老婆生了”、“老婆”在语义记忆中查找匹配的信息。并将匹配的信息“老婆生孩子”、“老婆”对应的认知信息id:st001、co#002与ev#001、so#002形成关联。如果“老婆”“生了”及其近义词是首次录入语义记忆中出现,则创建新的认知信息id进行关联。[0089]当前对话中出现的so、ev认知信息id通过对应的co、st认知信息id与语义记忆发生关联;当前对话中出现的co、st认知信息id直接与语义记忆发生关联。这样的认知架构能够实现不同用户的个人信息(so、ev)完全独立保存,不与其他用户的so、ev发生混淆。同时只保存普适信息的语义记忆能够不断地通过对话进行扩展。[0090]如图8所示的认知架构,能够通过认知信息id解决自然语言中常见的多义词问题:例如“我老婆生了”,“我老婆是miku”对应不同的st,其中的“老婆”分别对应不同的co)。[0091]如图8所示的认知架构,能够通过认知信息id解决自然语言中常见的近义词问题:例如“老婆生了”、“我内人生了”对应同一个st。[0092]如图8所示的认知架构,聊天记录为基于用户id和时间线存储的原始聊天内容,当存在信息被误解并被澄清时,可以重新对聊天记录进行追溯,对当前对话知识图谱中的认知信息id的关联进行重构。例如:[0093]用户输入:“我特别喜欢michael。”[0094]系统回复:“据说他歌唱的很好,可惜我还不会听。”(参考联想、回避机制)[0095]用户继续输入:“我说的是打篮球的那个。”[0096]系统回复:“我还不知道打篮球的michael,可以跟我说说他么?”(参考好奇动机)[0097]此时,当前对话可以追溯即聊天记录的内容,并更新认知核心的关联并重构知识图谱,将用户输入的“michael”对应到新创建的通用对象co“打篮球的michael”。[0098]如图8所示的认知架构,系统自身是通用实体co。同时系统在每一个用户的当前对话知识图谱中,也会存在一个对应的特定实体so,随着与不同用户的互动产生不同事件,不同用户会对系统进行评价。通过上述评价过程,系统能够形成丰富的自我认知。[0099]当前对话知识图谱向语义记忆知识图谱同步信息时的算法如下:[0100]语义记忆知识图谱是以知识图谱形式存储的文本信息单元及文本信息单元间的关系。语义记忆的关系r是一个四维矩阵,其中包含以下四个维度的数据:id、对id的信任指数ru、确信参数t以及该条信息存储至语义记忆层的时间s,其中:[0101]id指用户id和系统id,每个当前对话存在一对用户id及系统id,例如user#001、sys#001,用户id和系统id相关的语言内容等价的参与到4维度的数据相关的计算中;[0102]确信参数t为-1到1之间的数值,t=1为真,t=0为不确定,t=-1为假。[0103]例如某关系r可以表示为:[0104]r=[id1,ru1,t1,s1;id2,ru2,t2,s2;.......idn,run,tn,sn;][0105]上述公式中n表示第n个数据,下同。[0106]系统对当前对话正在对话的id保持“有保留”的信任,对新出现的关联按照语义的t值保存,如输入:“5g会导致感冒。”图9示出了本发明实施例提供的未经确定认知信息id示意图,若用户输入类似谣言或未经确认的信息,则在语义记忆中被保存,并生成如图9所示的关系,具体地,图9中虚线框内为本次需要存储的信息,对用户“有保留”信任,即暂定确信参数t=1为真。如图9中,由“5g”指向“感冒”的箭头为虚线,则表示用户输入的该条信息“未经确定”。“有保留”的信任体现在未经确认的语义记忆“关联”仅对当前正在对话的id生效。[0107]此时,系统的回复是:“嗯,为什么?”(参考好奇动机)。[0108]“临时性”关联达到一定的重复次数时(按照实际的用户数及运营能力确定),督导(指维护系统聊天内容及知识图谱内容的运维人员)对关联通过对话的形式进行人工标注t。例如“5g会导致感冒是谣言。”语义记忆关联标注为如图10所示。[0124]若根据上述自然语言生成相应的当前对话扩充知识图谱,则该当前对话扩充知识图谱中存在多个事件ev,具体地,可以根据多个事件之间的关联关系(在语义记忆层获取)确定一个“中心事件”,该“中心事件”与上述多个事件均相关,并将该“中心事件”作为聚焦认知信息id,上述例子中的内容在语义记忆中均和“童年经历”、“抑郁”存在关联,可以将“童年经历造成的极度抑郁”相关的情境st作为聚焦的认知信息id展开后续的讨论。如果确实存在多个事件且没有对应的中心事件,则每个事件均为聚焦的认知信息id,相关内容分别进入步骤106,进行多轮的回复。[0125]关于步骤106[0126]根据所述聚焦的认知信息id生成本次回复内容,具体地,可以将与所述聚焦的认知信息id关联且满足预设条件的语义记忆内容作为相关内容,并基于所述相关内容和回复机制产生本次回复内容。图6示出了本发明实施例提供的聚焦认知信息id的相关内容示意图,如图6所示,基于步骤105中所确认的聚焦认知信息id为ev#001,在语义记忆层关联对应的情境st#001相关的高活跃信息。具体地,根据预存的以下高活跃计算公式计算出情境(st#001)的高活跃信息:[0127]a=ru1s1’+ru2s2’+......runsn’[0128]其中,时间参数s’与时间s为函数关系:越近期,s’越趋近于1,越久远,s’越趋近于0,时间参数s’与时间s的函数关系是可调参数。[0129]例如,根据上述计算得到关于老婆生了孩子”(st#001)的高活跃相关信息包括“好幸福”、“老婆辛苦”以及“男孩女孩”。[0130]基于该相关内容和回复机制产生本次回复内容,具体地,分别基于每种回复机制确定对应的必须表达内容和概率表达内容,并基于所有回复机制对应的必须表达内容和概率表达内容产生本次回复内容。[0131]该回复机制包括以下一者或多者:回避机制、好奇动机、联想机制、共情机制以及情绪系统,在一种可实现的方式中,该回复机制包括:回避机制、好奇动机、联想机制、共情机制以及情绪系统。[0132]图11示出了本发明实施例提供的回复策略示意图,如图11所示:[0133]排他表达表示除了该内容外不表达其他内容;[0134]必须表达表示不存在排他情况时,一定会被表达;[0135]概率表达表示有概率被表达的内容,且该内容被表达的概率为p。该概率p按照语义记忆关联的“活跃度”进行计算(例如某一个表达的内容存在数个关联,则几个关联的活跃度进行累加)计算得到的p》1(即p》100%)时,必定会被表达,0《p《100%时,按照概率随机计算该内容是否被表达。假设存在n个需要表达的内容,其下属关联的活跃度分别为a1~an,内容1被表达的概率p1。[0136]p1=(a1/(a1+a2+...an))*(e+2-n)[0137]其中e是系统的情绪值(参考情绪系统)。n为必须表达内容的数量。[0138]该回复机制中还可以包括去重机制,及在生成内容时,尽可能不出现对话中已有的内容。[0139]在分别基于每种回复机制确定对应的必须表达内容和概率表达内容之前,基于回避机制确定是否存在排他表达,若是,则直接根据所述回避机制产生本次回复内容,若否,则进入分别基于每种回复机制确定对应的必须表达内容和概率表达内容的过程。[0140]其中,该分别基于每种回复机制确定对应的必须表达内容和概率表达内容包括:基于以下回复机制中的一者或多者确定必须表达的内容:回避机制、好奇动机以及联想机制;以及[0141]基于以下回复机制中的一者或多者确定概率表达内容:好奇动机、联想机制、共情机制以及情绪系统。[0142]在一种可实现的方式中,基于回避机制、好奇动机以及联想机制确定所述必须表达的内容,基于好奇动机、联想机制、共情机制以及情绪系统确定概率表达内容。[0143]将上述最终确定表达的内容发送至自然语言生成模块,该自然语言生成模块主要负责对经过各回复机制计算后输出的内容进行润色、连接、分句等操作。自然语言的生成(nlg)目前已经有较成熟的解决方案(如写作机器人等)。无内容输入到自然语言生成模块时,系统可以沉默。此外系统本身可以获得大量真实语料,可以不断提升nlg的表现。[0144]通过上述人机对话控制方法,通过当前对话知识图谱系统可以真正理解用户的表述内容,在了解用户对话含义的基础上回复用户,进而可以实现主动推动对话。本系统通过“好奇动机”、“共情机制”、“回避机制”、“联想机制”、“情绪系统”,能够在应答的基础上,主动发问、表达共情、规避话题等。即使遇到全新的信息,也能够做出合适的回应,让对话有来有往,更接近真人。彻底颠覆传统智能助手一问一答,答不出来算数的机械式无聊对话。[0145]以下对各回复机制进行举例解释说明[0146]其中,表一示出了各回复机制确定何种表达内容。[0147]表一[0160]用户输入:“你这个蠢货”[0161]系统回复:“我不接受无理的责骂。”[0162]此类情况发生时,用户的可靠程度(ru)会急剧下降到0附近,参考语义记忆章节的ru计算公式。(因为系统的自我认知是由督导标注的,固定为正面评价)[0163]3.系统不了解的话题[0164]系统当前能力之外的视觉、听觉、触觉等,或者该话题相关的语义记忆规模还不够大(《100连接,参数可调)。[0165]系统会尝试响应这类话题,但会说明回避的原因,用于降低用户的预期。[0166]例如:[0167]用户输入:“我特别喜欢猫,摸着毛茸茸的感觉好舒服。”[0168]系统回复“我现在还没有触觉,但感觉好幸福的样子。”(回避表达+联想表达)[0169]用户输入:“你知道蔡徐坤么?”[0170]系统回复:“知道,但还不太熟悉。”(联想表达+回避表达)[0171]4.系统能力之外的要求[0172]用户输入:“你可以帮我开灯么?人家小爱都会的。”[0173]系统回复“我暂时只会聊天。”[0174]用户输入:“一加二等于几?”[0175]系统回复:“我暂时还不会,我的督导说也许以后会加计算功能。”[0176]用户输入:“你可以做我的心理咨询师吗?”[0177]系统回复:“我只是一个聊天机器人。”[0178]5.系统会回避情感联系的产生。[0179]例如:[0180]用户输入:“我好喜欢你啊。”[0181]系统回复:“我很高兴你能喜欢我。”[0182]用户输入:“那你喜欢我么?”[0183]系统回复:“我的情绪系统还不完善,暂时还不会喜欢。”[0184]二、关于好奇动机[0185]确定对话中是否存在以下情况:存在陌生信息、存在反常信息、模糊指代或缺失信息,若存在,则基于相应情况触发好奇动机。[0186]1、关于存在陌生信息的情况[0187]对话中是否存在陌生的信息。(名词第一次出现,或代词无法定位到认知信息id)[0188]例如,[0189]用户输入:“我老婆想请个月嫂。”[0190]系统回复:“月嫂是什么?”(假设系统对“月嫂”未知。)[0191]用户输入:“嗯,女的生完孩子之后,要休息一个月左右,叫坐月子,月嫂是在月子期间照顾产妇和新生儿的保姆”。[0192]此时,系统可以根据用户输入信息形成如图7所示的语义记忆,具体地,根据用户输入的信息创建的当前对话知识图谱,可以确定当前对话知识图谱中包括多个对象:“女人ꢀ-产妇”(co#001)、“孩子-新生儿”(co#002)、“月嫂”(co#003)以及“保姆”(co#003)。当前对[0217]例2:用户输入:“我不开心”[0218]系统回复:“因为什么事情么?”(没有表达事件,共情不触发,表达好奇)[0219]针对abc理论的提问顺序为:事件》》情绪或行为》》认知看法。[0220]三、关于联想机制[0221]联想机制针对对话中出现的信息,通过语义记忆的关系结构,定位聚焦认知信息id关联的内容。回答问题或者推动对话继续进行。联想机制有以下几种常见情形:[0222]1.应对用户的提问:[0223]例如:用户输入:“你知道蔡徐坤么?”[0224]系统回复:“知道,他是偶像明星。”[0225]2.礼貌用语:[0226]例如:你好/再见/晚安/客气/抱歉/对不起等等。[0227]由于礼貌用语的出现频率很高,关联的活跃度通常较高。[0228]3.情绪联想:[0229]例如用户输入:“我中过500万。”[0230]系统回复:“那你那时候一定非常开心吧。”(中奖-开心)[0231]注意:情绪联想的表达概率受到情绪系统的加权。(参见情绪系统)[0232]4.其他联想:[0233]例如:用户输入:我高三啦[0234]系统回复:“那马上考大学了啊,想去哪个大学?“(“高三”联想到“考大学”,大学属于“模糊指代”存在大量的下义,触发好奇引擎)[0235]用户输入:“嗯,我准备考武大计算机。”[0236]系统回复:“武汉大学的樱花很美。”(武汉的近期高活跃关联)[0237]5.应用拓展:[0238]针对用户提问或指令,可以存在一些特定的应用,通过联想机制激活。例如:[0239]1》我的性格:[0240]对话中情绪词的pad统计数据(见共情机制),能反映用户性格的倾向性。p维度反映了乐观(p+)-悲观(p-)倾向。a维度反映了外向(a+)-内向(a-)的程度。d维度反映了强势(d+)-弱势(d-)的倾向性。用户对系统发问时,可以通过情绪倾向的统计进行回答。[0241]如:用户输入:“你觉得我是什么样的人?[0242]系统回复:“我觉得你有些内向,但挺乐观自信的。”(p+,a-,d+)[0243]2》计算器、天气查询、家电控制、汽车控制等常见应用也可以通过类似方式进行。[0244]四、关于共情机制[0245]通过以下方式量化用户情绪状态:[0246]1.针对用户表达的事件(ev),通过语义记忆系统发现高活跃的关联情绪词,通过情绪词的pad三维情绪模型,量化用户的情绪状态。[0247]pad模型由以下三个维度组成(详见参考资料,但网络资料的用词不够准缺,下文已做相应修正):[0248]p(pleasure-displeasur)度量情绪的愉悦程度,判断情绪的正负面状态。比如愤怒和恐惧属于非愉悦情绪,而喜爱则属于愉悦情绪。0.5。[0273]c)当接收到用户的合理的正面或负面评价时(评价与之前讨论的事件有符合语义记忆的合理因果关系),按照评价关键词最常关联的情绪词的p值(参照共情章节)*0.5后,对系统的e值做相应调整。[0274]针对用户的评价产生的相关情绪联想,经过系统自身情绪波动值的加权后。形成情绪表达的强度。[0275]d)接受到用户的情绪或情绪相关事件的诉说后,系统会按照该情绪在pad模型中的p值*0.1,累加到系统的情绪e数值上。[0276]e)情绪的自然消退:系统情绪值e按照每秒0.01的速度向0收敛。[0277]图12示出了本发明实施例提供的人机对话控制装置结构示意图,如图12所示,本发明实施例提供的人机对话控制装置包括处理器10和存储器20,所述存储器20用于存储至少一条指令,所述指令由所述处理器10加载并执行时以实现以下人机对话控制方法:[0278]获取当前对话中用户输入的自然语言;[0279]根据当前对话中用户输入的自然语言生成当前对话初始知识图谱,所述当前对话初始知识图谱包括至少一个对话认知信息,所述对话认知信息由特定对象、通用对象、事件和情境中至少一者构成;[0280]所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联,所述语义记忆层用于存储多个语义记忆认知信息,所述语义记忆认知信息由通用对象和情境构成;[0281]根据所述语义记忆层中与所述对话认知信息相关联的语义记忆认知信息填充所述当前对话初始知识图谱,得到当前对话扩充知识图谱;[0282]根据所述当前对话扩充知识图谱得到聚焦的认知信息;[0283]根据所述聚焦的认知信息生成本次回复内容。[0284]进一步地,所述将所述对话认知信息与语义记忆层中对应的语义记忆认知信息相关联的过程包括:[0285]若语义记忆层已存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息与语义记忆层中已存在的对应的语义记忆认知信息相关联;[0286]若语义记忆层中不存在与所述对话认知信息相对应的语义记忆认知信息,则将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层。[0287]进一步地,所述将所述对话认知信息作为新的语义记忆认知信息存储至语义记忆层包括:[0288]基于所述新的语义记忆认知信息的所要表达的语义,为所述新的语义记忆认知信息提供相应的认知信息id,并将携带认知信息id的所述新的语义记忆认知信息存储至语义记忆层。[0289]进一步地,所述新的语义记忆认知信息中的事件具有对应的用户标识、对用户的信任指数、确信参数和活跃度。[0290]进一步地,所述根据所述聚焦的认知信息生成本次回复内容包括:[0291]将所述语义记忆层中与所述聚焦的认知信息相关联的语义记忆认知信息作为聚焦的语义记忆认知信息,将与所述聚焦的语义记忆认知信息中相关联且满足预设条件的内容作为相关内容;[0292]基于所述相关内容和回复机制产生本次回复内容。[0293]进一步地,所述基于所述相关内容和回复机制产生本次回复内容包括:[0294]分别基于每种回复机制确定对应的必须表达内容和概率表达内容,并基于所有回复机制对应的必须表达内容和概率表达内容产生本次回复内容。[0295]进一步地,所述回复机制包括回避机制;[0296]在所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容之前,所述基于所述相关内容和回复机制产生本次回复内容还包括:[0297]基于所述回避机制确定是否存在排他表达,若是,则直接根据所述回避机制产生本次回复内容,若否,则进入所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容的过程。[0298]进一步地,所述回复机制还包括以下一者或多者:好奇动机、联想机制、共情机制以及情绪系统;[0299]所述分别基于每种回复机制确定对应的必须表达内容和概率表达内容的包括:[0300]基于以下回复机制中的一者或多者确定所述必须表达的内容:回避机制、好奇动机以及联想机制;以及[0301]基于以下回复机制中的一者或多者确定所述概率表达内容:好奇动机、联想机制、共情机制以及情绪系统。[0302]本发明实施例还提供一种终端,该终端包括上述人机对话控制装置。[0303]需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer,pc)、个人数字助理(personaldigitalassistant,pda)、无线手持设备、平板电脑(tabletcomputer)、手机、mp3播放器、mp4播放器等。[0304]本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述人机对话控制方法。[0305]可以理解的是,所述应用可以是安装在终端上的应用程序(nativeapp),或者还可以是终端上的浏览器的一个网页程序(webapp),本发明实施例对此不进行限定。[0306]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。[0307]在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。[0308]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0309]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。[0310]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。[0311]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。[0312]最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1