文字对话中基于话题侦测的用户画像建模方法及系统与流程

文档序号:11519802阅读:168来源:国知局
文字对话中基于话题侦测的用户画像建模方法及系统与流程

本发明涉及人工智能领域,尤其涉及人工智能对话领域。



背景技术:

现有的人工智能对话系统,是以用户的自身信息,例如性别、年龄、家乡、职业等对用户建模,并未将用户的个性,例如感兴趣的话题,视为形成用户画像的因素。在人与人的自然对话中,常聊的话题代表个人的兴趣。所以在人工智能对话系统中,用户有兴趣的话题,是重要的用户画像中的因素。

因此,现有技术中的技术缺陷是:现有的人机对话系统中,没有代表用户个性的对话话题因素加入到用户画像中,使人机对话过程中,不能根据用户的个性给出更智能的回答。



技术实现要素:

针对上述技术问题,本发明提供一种文字对话中基于话题侦测的用户画像建模方法及系统,将用户对话文本中的话题分成主要话题和次要话题,通过对主要话题和次要话题建立话题图谱,根据每次用户的对话内容中包含的话题对话题图谱进行更新,得到用户的用户画像,根据用户画像,在人机对话过程中,考虑到用户个性的因素,使人机对话更智能。

为解决上述技术问题,本发明提供的技术方案是:

第一方面,本发明提供一种文字对话中基于话题侦测的用户画像建模方法,包括:

步骤s1,通过话题识别系统获得用户输入的文本的多个话题,所述多个话题包括主要话题和次要话题;

步骤s2,将所述多个话题映射成一个图形结构的话题关系图,形成话题图谱;

步骤s3,通过逻辑规则或机器学习的方法,更新所述话题图谱,得到所述用户的用户画像。

本发明提供的文字对话中基于话题侦测的用户画像建模方法,其技术方案为:先通过话题识别系统获得用户输入的文本的多个话题,所述多个话题包括主要话题和次要话题;然后,将所述多个话题映射成一个图形结构的话题关系图,形成话题图谱;最后,通过逻辑规则或机器学习的方法,更新所述话题图谱,得到所述用户的用户画像。

本发明的文字对话中基于话题侦测的用户画像建模方法,将用户对话文本中的话题分成主要话题和次要话题,通过对主要话题和次要话题建立话题图谱,根据每次用户的对话内容中包含的话题对话题图谱进行更新,得到用户的用户画像,根据用户画像,在人机对话过程中,考虑到用户个性的因素,使人机对话更智能。

进一步地,所述步骤s1,具体为:

获得用户输入的文本;

根据所述用户输入的文本的内容,进行话题的检测,得到多个话题,所述多个话题包括主要话题和次要话题。

进一步地,所述步骤s2,具体为:

根据所述多个话题中包含的主要话题和次要话题,将所述主要话题和次要话题以点的形式表示,得到多个点,一个点代表一个主要话题或次要话题;

根据所述主要话题和次要话题之间的关联强度,将所述主要话题所在的点和所述次要话题所在的点之间进行连线,得到多个连线;

根据所述多个点和所述多个连线,形成话题图谱。

进一步地,所述步骤s3中,通过逻辑规则的方法,更新所述话题图谱,具体为:

计算所述多个话题中两两话题之间的话题图谱强度,所述话题图谱强度表示所述多个话题中两两话题之间的关联强度;

根据所述话题图谱强度,更新所述话题图谱。

进一步地,所述步骤s3中,通过机器学习的方法,更新所述话题图谱,具体为:

计算所述多个话题中两两话题之间共同出现的频率值;

根据所述频率值,更新所述话题图谱。

第二方面,本发明提供一种文字对话中基于话题侦测的用户画像建模系统,包括:

话题获取模块,用于通过话题识别系统获得用户输入的文本的多个话题,所述多个话题包括主要话题和次要话题;

话题图谱建立模块,用于将所述多个话题映射成一个图形结构的话题关系图,形成话题图谱;

用户画像模块,用于通过逻辑规则或机器学习的方法,更新所述话题图谱,得到所述用户的用户画像。

本发明提供的文字对话中基于话题侦测的用户画像建模系统,其技术方案为:先通过话题获取模块,用于通过话题识别系统获得用户输入的文本的多个话题,所述多个话题包括主要话题和次要话题;然后通过话题图谱建立模块,用于将所述多个话题映射成一个图形结构的话题关系图,形成话题图谱;最后通过用户画像模块,用于通过逻辑规则或机器学习的方法,更新所述话题图谱,得到所述用户的用户画像。

本发明的文字对话中基于话题侦测的用户画像建模系统,将用户对话文本中的话题分成主要话题和次要话题,通过对主要话题和次要话题建立话题图谱,根据每次用户的对话内容中包含的话题对话题图谱进行更新,得到用户的用户画像,根据用户画像,在人机对话过程中,考虑到用户个性的因素,使人机对话更智能。

进一步地,所述话题获取模块具体用于:

获得用户输入的文本;

根据所述用户输入的文本的内容,进行话题的检测,得到多个话题,所述多个话题包括主要话题和次要话题。

进一步地,所述话题图谱建立模块具体用于:

根据所述多个话题中包含的主要话题和次要话题,将所述主要话题和次要话题以点的形式表示,得到多个点,一个点代表一个主要话题或次要话题;

根据所述主要话题和次要话题之间的关联强度,将所述主要话题所在的点和所述次要话题所在的点之间进行连线,得到多个连线;

根据所述多个点和所述多个连线,形成话题图谱。

进一步地,所述用户画像模块具体用于:

计算所述多个话题中两两话题之间的话题图谱强度,所述话题图谱强度表示所述多个话题中两两话题之间的关联强度;

根据所述话题图谱强度,更新所述话题图谱。

进一步地,所述用户画像模块具体用于:

计算所述多个话题中两两话题之间共同出现的频率值;

根据所述频率值,更新所述话题图谱。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。

图1示出了本发明实施例所提供的一种文字对话中基于话题侦测的用户画像建模方法的流程图;

图2示出了本发明实施例所提供的一种文字对话中基于话题侦测的用户画像建模系统的示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

实施例一

图1示出了本发明第一实施例所提供的一种文字对话中基于话题侦测的用户画像建模方法的流程图;如图1所示,本发明实施例一提供的文字对话中基于话题侦测的用户画像建模方法,包括:

步骤s1,通过话题识别系统获得用户输入的文本的多个话题,多个话题包括主要话题和次要话题;

步骤s2,将多个话题映射成一个图形结构的话题关系图,形成话题图谱;

步骤s3,通过逻辑规则或机器学习的方法,更新话题图谱,得到用户的用户画像。

本发明提供的文字对话中基于话题侦测的用户画像建模方法,其技术方案为:先通过话题识别系统获得用户输入的文本的多个话题,多个话题包括主要话题和次要话题;然后,将多个话题映射成一个图形结构的话题关系图,形成话题图谱;最后,通过逻辑规则或机器学习的方法,更新话题图谱,得到用户的用户画像。

本发明的文字对话中基于话题侦测的用户画像建模方法,将用户对话文本中的话题分成主要话题和次要话题,通过对主要话题和次要话题建立话题图谱,根据每次用户的对话内容中包含的话题对话题图谱进行更新,得到用户的用户画像,根据用户画像,在人机对话过程中,考虑到用户个性的因素,让人工智能对话更像真人一样,理解用户有兴趣的话题,达到个人化,更自然的人机互动。

具体地,步骤s1,具体为:

获得用户输入的文本;

根据用户输入的文本的内容,进行话题的检测,得到多个话题,多个话题包括主要话题和次要话题。

主要话题是表示输入的文本的内容所属的大的范围,而次要话题表示相对于主要话题更小的范围,比如“我喜欢吃香蕉”,主要话题为“食物”,次要话题为“水果”,这样将文本的内容分成主要话题和次要话题,便于进行分类,建立关系。

优选地,通过逻辑规则及机器学习的方法进行话题的检测。

按照一定的逻辑规则或机器学习的方法进行话题的检测,可增加检测的速度和准确性。

具体地,步骤s2,具体为:

根据多个话题中包含的主要话题和次要话题,将主要话题和次要话题以点的形式表示,得到多个点,一个点代表一个主要话题或次要话题;

根据主要话题和次要话题之间的关联强度,将主要话题所在的点和次要话题所在的点之间进行连线,得到多个连线;

根据多个点和多个连线,形成话题图谱。

用点的形式代表话题本身,点与点之间的连线表示两个话题间的关联程度,表现形式简单明了,更容易理解;比如话题“食物”与话题“水果”之间的关联程度大,话题“树木”和话题“银杏树”关联程度大,而话题“水果”与话题“银杏树”之间的关联程度小,这样根据主要话题和次要话题之间的关系,再结合话题之间的关联程度,可快速地对文本内容中包含的话题进行搜索,更新,得到更有个性化的用户图谱。

具体地,步骤s3中,通过逻辑规则的方法,更新话题图谱,具体为:

计算多个话题中两两话题之间的话题图谱强度,话题图谱强度表示多个话题中两两话题之间的关联强度;

根据话题图谱强度,更新话题图谱。

话题图谱强度为预先定义的,表示多个话题中两两话题之间的关联强度,具体地,可根据两个话题在用户一段对话中是否同时出现,例如话题a与话题b同时出现在用户一段对话中,则话题a与话题b的强度最高,若话题a与话题c分别出现在用户几段对话中,则话题a与话题c的强度为某个固定值;之后根据强度进行话题图谱的更新。

具体地,本实施例中举例对话题图谱的更新:

a:例如,话题a与话题b若出现在n轮对话之中,则更新这两个话题的强度i等于原始强度乘以大于1的值,再取max(1,i),提高两话题之间的强度。其余与话题a相连的话题点则乘以小于1的值,降低强度。

通过计算两两话题间的强度进行话题图谱的更新,可优化话题图谱,使机器人给出的回答更准确,更符合用户的个人特点。

具体地,步骤s3中,通过机器学习的方法,更新话题图谱,具体为:

计算多个话题中两两话题之间共同出现的频率值;

根据频率值,更新话题图谱。

其中,多个话题中两两话题之间共同出现的频率值是指从所有用户数据中发掘话题之间共同出现的频率,例如讲到a话题之后有多少机率会再讲到b话题,依据与a话题同共出现的机率由大到小排序,机率越大给予越高的强度加乘。

透过所有用户聊天的大数据,可以自动算出两两话题之间共同出现的频率,以此为更新话题图的依据。通过上述方法进行话题图谱的更新,可优化话题图谱,使机器人给出的回答更准确,更符合用户的个人特点。

图2示出了本发明实施例所提供的一种文字对话中基于话题侦测的用户画像建模系统的示意图;如图2所示,本发明实施例提供的文字对话中基于话题侦测的用户画像建模系统10,包括:

话题获取模块101,用于通过话题识别系统获得用户输入的文本的多个话题,多个话题包括主要话题和次要话题;

话题图谱建立模块102,用于将多个话题映射成一个图形结构的话题关系图,形成话题图谱;

用户画像模块103,用于通过逻辑规则或机器学习的方法,更新话题图谱,得到用户的用户画像。

本发明提供的文字对话中基于话题侦测的用户画像建模系统10,其技术方案为:先通过话题获取模块101,用于通过话题识别系统获得用户输入的文本的多个话题,多个话题包括主要话题和次要话题;然后通过话题图谱建立模块102,用于将多个话题映射成一个图形结构的话题关系图,形成话题图谱;最后通过用户画像模块103,用于通过逻辑规则或机器学习的方法,更新话题图谱,得到用户的用户画像。

本发明的文字对话中基于话题侦测的用户画像建模系统10,将用户对话文本中的话题分成主要话题和次要话题,通过对主要话题和次要话题建立话题图谱,根据每次用户的对话内容中包含的话题对话题图谱进行更新,得到用户的用户画像,根据用户画像,在人机对话过程中,考虑到用户个性的因素,让人工智能对话更像真人一样,理解用户有兴趣的话题,达到个人化,更自然的人机互动。

具体地,话题获取模块101具体用于:

获得用户输入的文本;

根据用户输入的文本的内容,进行话题的检测,得到多个话题,多个话题包括主要话题和次要话题。

主要话题是表示输入的文本的内容所属的大的范围,而次要话题表示相对于主要话题更小的范围,比如“我喜欢吃香蕉”,主要话题为“食物”,次要话题为“水果”,这样将文本的内容分成主要话题和次要话题,便于进行分类,建立关系。

优选地,通过逻辑规则及机器学习的方法进行话题的检测。

按照一定的逻辑规则或机器学习的方法进行话题的检测,可增加检测的速度和准确性。

具体地,话题图谱建立模块102具体用于:

根据多个话题中包含的主要话题和次要话题,将主要话题和次要话题以点的形式表示,得到多个点,一个点代表一个主要话题或次要话题;

根据主要话题和次要话题之间的关联强度,将主要话题所在的点和次要话题所在的点之间进行连线,得到多个连线;

根据多个点和多个连线,形成话题图谱。

用点的形式代表话题本身,点与点之间的连线表示两个话题间的关联程度,表现形式简单明了,更容易理解;比如话题“食物”与话题“水果”之间的关联程度大,话题“树木”和话题“银杏树”关联程度大,而话题“水果”与话题“银杏树”之间的关联程度小,这样根据主要话题和次要话题之间的关系,再结合话题之间的关联程度,可快速地对文本内容中包含的话题进行搜索,更新,得到更有个性化的用户图谱。

具体地,用户画像模块103具体用于:

计算多个话题中两两话题之间的话题图谱强度,话题图谱强度表示多个话题中两两话题之间的关联强度;

根据话题图谱强度,更新话题图谱。

话题图谱强度为预先定义的,表示多个话题中两两话题之间的关联强度,具体地,可根据两个话题在用户一段对话中是否同时出现,例如话题a与话题b同时出现在用户一段对话中,则话题a与话题b的强度最高,若话题a与话题c分别出现在用户几段对话中,则话题a与话题c的强度为某个固定值;之后根据强度进行话题图谱的更新。

具体地,本实施例中举例对话题图谱的更新:

a:例如,话题a与话题b若出现在n轮对话之中,则更新这两个话题的强度i等于原始强度乘以大于1的值,再取max(1,i),提高两话题之间的强度。其余与话题a相连的话题点则乘以小于1的值,降低强度。

通过计算两两话题间的强度进行话题图谱的更新,可优化话题图谱,使机器人给出的回答更准确,更符合用户的个人特点。

具体地,用户画像模块103具体用于:

计算多个话题中两两话题之间共同出现的频率值;

根据频率值,更新话题图谱。

其中,多个话题中两两话题之间共同出现的频率值是指从所有用户数据中发掘话题之间共同出现的频率,例如讲到a话题之后有多少机率会再讲到b话题,依据与a话题同共出现的机率由大到小排序,机率越大给予越高的强度加乘。

透过所有用户聊天的大数据,可以自动算出两两话题之间共同出现的频率,以此为更新话题图的依据。通过上述方法进行话题图谱的更新,可优化话题图谱,使机器人给出的回答更准确,更符合用户的个人特点。

实施例二

基于本发明实施例一提供的文字对话中基于话题侦测的用户画像建模方法,及文字对话中基于话题侦测的用户画像建模系统10,应用于人机对话系统中,具体过程为:

用户输入文字句子,例如:有没有王菲的新闻?

由话题识别系统,侦测用户谈论的这句话中的话题,例如,上句话中的主要话题是“艺人”,次要话题是“歌手”;

将主要话题“艺人”和次要话题“歌手”映射到话题图谱中;

根据逻辑规则或机器学习算法,更新个人化图谱(话题图谱),通过话题图谱可知道个人对于不同话题的喜好程度,给出智能的回答。

通过本发明的文字对话中基于话题侦测的用户画像建模方法及系统,根据用户画像,在人机对话过程中,考虑到用户个性的因素,让人工智能对话更像真人一样,理解用户有兴趣的话题,达到个人化,更自然的人机互动。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1