一种心理咨询聊天机器人的回答体贴度检测方法及系统

文档序号：30708192发布日期：2022-07-10 01:14阅读：96来源：国知局

1.本发明涉及机器学习技术和自然语言处理技术领域，尤其涉及一种心理咨询聊天机器人的回答体贴度检测方法及系统。

背景技术：

2.焦虑是一种不健康的心理状况，随着生活中各种压力的增大，各个年龄段的人都会或多或少地产生焦虑情绪。据统计，现在全球有超过3亿的抑郁症等心理疾病患者，也就是说大约每20人中就有一个人患有严重的焦虑症，其中只有不到10％的患者接受过正规的治疗和帮助。聊天机器人的出现给解决这些问题带来了巨大的潜力，聊天机器人可以有效缓解心理治疗医生数量的严重不足，并且大幅减少治疗费用，显著增加了患者接受治疗的机会。
3.聊天机器人是一种人机交互系统，允许用户通过自然语言与电子设备进行交互。随着语音识别技术的发展，聊天机器人已经在许多领域取代了一部分人类工作，如电子商务中的客户服务和信息检索系统中的人机交互。近几十年内陆续出现了许多著名的心理治疗聊天机器人，它们在真实的心理治疗中被证明是有用的，并且每周产生上千万对谈话数据。随着人工神经网络和深度学习的发展，聊天机器人在意图识别、语义分析和响应生成等方面都有了更好的表现。因此，心理治疗聊天机器人可以用于更广泛的场景，并具有巨大的潜在好处。
4.目前市面上的心理咨询聊天机器人并没有考虑到回答的体贴度这一要素，仅有个别聊天机器人对对话过程的积极消极性进行了检测，这就导致在问答过程中产生的一些回答过于尖锐，这样会对用户造成进一步的刺激和伤害。

技术实现要素：

5.本发明的目的是提供一种可以快速、准确、便于记录分析结果的心理咨询聊天机器人的回答体贴度检测方法及系统。
6.本发明为实现上述发明目的采用如下技术方案：
7.本发明提供了一种心理咨询聊天机器人的回答体贴度检测方法，包括：
8.获取用户提交的文本数据，并对文本数据进行预处理；
9.对预处理后的数据通过基于rcnn改进的网络模型进行前向传播，计算出文本序列的阶段性输出；
10.对前向传播得到的阶段性输出进行新的计算预测，以得到所有体贴程度的输出概率，并从中选择最大值作为最终输出，即为心理咨询聊天机器人回答的体贴程度。
11.进一步地，对文本数据进行预处理的方法包括：
12.获取文本数据中的每个单词；
13.采用词嵌入的方式对用户提交的文本数据进行词向量编码，得到文本序列的词嵌入矩阵x。
14.基于rcnn改进的网络模型的改进方法包括：
15.将基于rcnn的网络模型中的双向循环神经网络替换成双向长短期记忆网络；
16.将基于rcnn的网络模型中的全连接神经网络的激活函数tanh换成relu函数；
17.基于rcnn的网络模型中的池化层采用max pooling。
18.进一步地，对预处理后的数据通过基于rcnn改进的网络模型进行前向传播，计算文本序列的阶段性输出的方法包括：
19.将得到的词嵌入矩阵x输入双向长短期记忆网络，计算得到向量c1和cr。
20.将向量c1、cr、x拼接成新的向量，输入至用relu作为激活函数的全连接神经网络进行整合；
21.将经过全连接神经网络整合的结果输入到池化层，用max pooling进行池化操作，压缩数据和参数量，得到阶段性输出。
22.进一步地，对前向传播得到的阶段性输出进行新的计算预测，以得到所有体贴程度的输出概率，并从中选择最大值作为最终输出的方法包括：
23.将池化操作后的数据输入全连接分类器，通过softmax函数计算得到不同体贴程度的概率：
24.pi＝p(yi|w)
25.其中，w表示系统的输入文本序列；yi表示第i个分类；pi＝p(yi|w)表示给定序列下第i个分类的概率；
26.从softmax函数的输出概率中选择最大值作为最终输出。
27.本发明提供了一种心理咨询聊天机器人的回答体贴度检测系统，包括：
28.数据预处理模块，用于对用户提交的文本数据进行预处理；
29.上下文编码模块，用于对预处理后的数据通过基于rcnn改进的网络模型进行前向传播，计算出文本序列的阶段性输出；
30.文本体贴程度分类模块，对前向传播得到的阶段性输出进行新的计算预测，以得到所有体贴程度的输出概率，并从中选择最大值作为最终输出。
31.本发明的有益效果如下：
32.和传统的仅局限于积极或是消极的情感分析相比，本发明提供的心理咨询聊天机器人回答体贴度检测，可以对文本的体贴程度进行检测，在对话中，有些对话可能是积极但不体贴或是消极但体贴的，在这种情况下普通的情感分析方法就无法准确判断回答是体贴/不体贴。
33.现有的心理咨询聊天机器人均未对聊天机器人的回答体贴度进行检测，在与用户的沟通过程中常常会产生不够体贴甚至具有刺激性、攻击性的回答，而心理咨询的患者内心往往更为敏感脆弱。对心理咨询聊天机器人的回答体贴度进行检测有利于后续对聊天机器人的对话、治疗效果进行优化提升，也有利于提高用户满意度。
附图说明
34.图1为根据本发明实施例提供的一种心理咨询聊天机器人的回答体贴度检测系统的结构框图；
35.图2为根据本发明实施例提供的一种心理咨询聊天机器人的回答体贴度检测方法
的流程图；
36.图3为根据本发明实施例提供的一种心理咨询聊天机器人的回答体贴度检测方法中rcnn网络结构示意图。
具体实施方式
37.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
38.本发明设计了一种心理咨询聊天机器人回答体贴度检测方法，该方法将对话文本作为输入，通过对数据预处理、转换以及推理，最终准确地检测出对话文本的体贴程度。
39.如图2、3所示，根据上述系统，本发明还提出一种心理咨询聊天机器人回答体贴度检测方法，主要包括以下步骤：
40.步骤1，数据预处理：对心理咨询聊天机器人的回答进行预处理，转化成系统能够识别和处理的数据格式，主要包括以下步骤：
41.步骤1.1，将文本w中的每个单词wi作为系统的主要输入，采用词嵌入的方式对用户提交的数据文件进行编码，得到文本序列的词嵌入矩阵x，即xi表示序列中第i个单词的词嵌入向量。为了能够快速的对文本数据进行向量化编码，增强该模型的可移植性，本发明首先在预处理阶段采用词嵌入的方式对用户提交的数据文件进行编码，并使用用搜狗新闻训练的预训练模型，这样可以尽可能的区分出两个单词之间的差异性。
42.步骤1.2，将词嵌入矩阵x作为下一步步骤2中网络的输入。
43.步骤2，对预处理后的数据利用设计好的网络进行前向传播，计算序列的阶段性输出，主要包括以下步骤：
44.步骤2.1，将步骤1中的词嵌入矩阵x作为双向长短期记忆神经网络的输入，双向长短期记忆网络可以更大程度地记录上下文信息。计算得到向量c1和cr，将词嵌入矩阵x和向量c1和cr进行拼接得到新的向量作为下一层的输入。
45.步骤2.2，将上一层拼接好的向量输入全连接层进行整合，用relu函数作为激活函数，增加神经网络各层之间的非线性关系，可以节省整个过程的计算量，并且使网络具有稀疏性，同时减少参数的相互依存关系，缓解过拟合问题的发生。
46.步骤2.3，将全连接层的输出输入池化层进行max pooling(最大池化)，自动获得哪些特征在文本分类过程中起到更重要的作用，提高文本体贴度检测的准确率。
47.步骤3，体贴程度分类检测：对心理咨询聊天机器人的回答体贴程度进行预测。将上述网络的最终输出作为最后一层全连接分类器的输入，通过softmax激活函数得到每个分类的条件概率pi，pi＝p(yi|w)，具体如下：
48.p(y|w)＝softmax(wzz+bz)
[0049][0050]
其中，w表示系统的输入文本序列，y表示所有分类，yi表示第i个分类，p(y|w)是给定序列下所有分类的条件概率，则pi＝p(yi|w)表示给定序列下第i个分类的条件概率；
是权重矩阵和偏置向量，z是所有时间步的上下文向量，r是所有的分类数量；是预测输出分类。
[0051]
预测出分类结果后，心理咨询聊天机器人的开发者就可以对聊天机器人的回答数据进行统计分析，不断调整优化聊天机器人的回答策略，提高聊天机器人的回答体贴程度，增加用户满意度。
[0052]
本发明的体贴度检测所用的是基于rcnn的网络模型，与传统的网络模型cnn和rnn不同的是，rcnn使用双向长短期记忆网络来尽可能多的获取上下文信息，比传统的基于窗口的神经网络更能减少噪声，而且在学习文本表达时能大范围的保留词序，其次使用max pooling获取文本的重要部分，自动判断哪个特征在文本分类过程中起更重要的作用。
[0053]
综上所述，本发明公开了一种心理咨询聊天机器人回答体贴度检测方法，可以根据对用户和心理咨询聊天机器人对话过程中心理咨询聊天机器人的回复的体贴程度进行检测。设计了一种基于rcnn的网络结构，来预先决定单词之间的互相决策重要程度并充分利用文本中给出的语义关系和它们的潜在类型。整个过程基于端到端的处理方式，无需用户手动输入数据特征，能很方便地对文本的体贴程度进行检测。
[0054]
如图1所示，本发明涉及一种基于rcnn网络模型的心理咨询聊天机器人回答体贴度检测系统包括：
[0055]
数据预处理模块，用于对用户提交的文本数据进行预处理；
[0056]
上下文编码模块，用于对预处理后的数据通过基于rcnn改进的网络模型进行前向传播，计算出文本序列的阶段性输出；
[0057]
文本体贴程度分类模块，对前向传播得到的阶段性输出进行新的计算预测，以得到所有体贴程度的输出概率，并从中选择最大值作为最终输出。
[0058]
其中，基于rcnn的神经网络模型包括一个embedding层用于将网络中的节点表示成低维、实值、稠密的向量形式，使得得到的向量形式可以在向量空间中具有表示以及推理的能力，同时可方便地作为模型的输入、还包括一个作为子网络的双向长短期记忆网络用于记录更长范围的上下文信息、一个最大池化层用于消除非极大值降低计算复杂度，一个全连接神经网络用于获取条件概率。
[0059]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胥备庄子源
技术所有人：南京邮电大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。