人工智能情感分析方法及其系统与流程

文档序号:25900775发布日期:2021-07-16 20:43阅读:355来源:国知局
人工智能情感分析方法及其系统与流程

1.本发明涉及人工智能技术领域,尤其涉及一种人工智能情感分析方法及其系统。


背景技术:

2.目前市场中的情感分析方案多采用基于规则词典或纯模型方式,针对的是文本整体的情感而不是针对目标的情感。这种方式存在正确率不高的问题。


技术实现要素:

3.本发明的目的在于提供一种人工智能情感分析方法及其系统,能实现较好地判断文本对于目标对象的情感。
4.为实现上述目的,第一方面,本发明提供了一种人工智能情感分析方法,包括以下步骤:
5.获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本;
6.对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理;
7.对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据;
8.对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率。
9.其中,对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理,包括:
10.利用插值法将设定的符号插入所述分析目标的首末位置;
11.对所述待分析样本进行切词处理,并对得到的多个切词结果进行特征提取,将未被提取出的所述切词结果进行删除。
12.其中,对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据,包括:
13.对预处理后的所述切词结果输入word2vec算法得到对应的词向量,并删除小于设定长度阈值的所述词向量,得到分析向量;
14.对所述分析向量进行聚类和特征点划分,得到对应的行为数据。
15.其中,对所述分析向量进行聚类和特征点划分,得到对应的行为数据,包括:
16.基于k

means算法对所述分析向量进行聚类,并利用预设行为特征分析算法获取聚类得到的聚类中心点中所有所述分析向量的残差;
17.基于所述残差,利用最小二乘法计算出对应的损失函数值,并根据所述损失函数值对应的特征点,对所述分析向量进行特征提取,得到对应的行为数据。
18.其中,对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据之后,所述方法还包括:
19.对得到的所述行为数据添加一个包括三个情感级别的情感类型维度,并利用所述
词向量中相应情感级别的预设情感分数值调整所述行为数据;所述情感级别包括正面情感级别、负面情感级别、和中性情感级别。
20.其中,对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率,包括:
21.对得到的所述行为数据进行离散化处理,并结合标记后的所述分析目标,将离散化后的所述行为行为数据输入情感分析模型,计算得到所述行为数据对所述分析目标的情感倾向概率。
22.第二方面,本发明提供了一种人工智能情感分析系统,适用于如第一方面所述的一种人工智能情感分析方法,所述人工智能情感分析系统包括数据获取模块、预处理模块、数据训练模块和情感倾向计算模块,所述数据获取模块、所述预处理模块、所述数据训练模块和所述情感倾向计算模块依次连接;
23.所述数据获取模块,用于获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本;
24.所述预处理模块,用于对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理;
25.所述数据训练模块,用于对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据;
26.所述情感倾向计算模块,用于对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率。
27.本发明的一种人工智能情感分析方法及其系统,获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本;对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理;对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据;对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率,能实现较好地判断文本对于目标对象的情感。
附图说明
28.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1是本发明提供的一种人工智能情感分析方法的步骤示意图。
30.图2是本发明提供的一种人工智能情感分析系统的结构示意图。
[0031]1‑
数据获取模块、2

预处理模块、3

数据训练模块、4

情感倾向计算模块。
具体实施方式
[0032]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0033]
在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0034]
请参阅图1,本发明提供一种人工智能情感分析方法,包括以下步骤:
[0035]
s101、获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本。
[0036]
具体的,可以利用网络爬虫技术等从网络上获取需要进行情感分析的待分析样本集,可采用bert+bilstm

crf

ner模型在上述样本集中提取目标对象,将待分析的文本内容输入预先训练好的bert+bilstm

crf

ner模型(实体识别模型),bert+bilstm

crf

ner模型的one

hot vector层(独热编码向量)将对应的多个字符通过look

up layer(查找层)对应预训练编码x1、x2、x3、x4,forward ltsm(前向长短期记忆网络)层和backward lstm(后向长短期记忆网络)层分别按照从前往后的顺序和从后往前的顺序输送各字符向量到模型,得到各字符对每个可能标注的概率,最后结合crf layer(条件随机场)的对相邻序列关系的规则综合得到最终每个字符最可能的标注。得到字符标注后,将设定位置标注作为确认的目标词的开头,与其后紧接的多个标注一起连接为一个完整分析目标,然后根据所述分析目标,选取设定长度下的字符串长度,得到对应的待分析样本。
[0037]
s102、对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理。
[0038]
具体的,为了保证能够得到准确的,且方便后续识别的所述分析目标,利用插值法将设定的符号插入所述分析目标的首末位置处,即在所述分析目标的第一字符前和所述分析目标的最后字符的后面分别插入所述设定字符,便于对所述分析目标进行限定,减少后续使用过程中,分析目标的使用错误。
[0039]
为了减少计算工作量,需要将所述待分析样本进行切词处理,使用的是目前常用的切词技术,可以得到多个对应的切词结果,利用设定的提取字符长度对所有的所述切词结果进行特征提取,即提取出字符长度大于所述设定的提取字符长度,将未被提取出来的所述切词结果进行删除,可以减少切词结果中国没有情感色彩的连接词等增加计算量。
[0040]
s103、对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据。
[0041]
具体的,对预处理后的所述切词结果输入word2vec算法得到对应的词向量,并删除小于设定长度阈值的所述词向量,得到分析向量进一步减少计算量,对所述分析向量进行聚类和特征点划分,得到对应的行为数据,即为:基于k

means算法对所述分析向量进行聚类,并利用预设行为特征分析算法(梯度迭代决策树算法)获取聚类得到的聚类中心点中所有所述分析向量的残差,基于所述残差,利用最小二乘法计算出对应的损失函数值,并根据所述损失函数值对应的特征点,对所述分析向量进行特征提取,得到对应的行为数据,其中,所述特征点对应的所述损失函数值为最小残差对应的所述聚类中心点。对得到的所述行为数据添加一个包括三个情感级别的情感类型维度,并利用所述词向量中相应情感级别的预设情感分数值调整所述行为数据;所述情感级别包括正面情感级别、负面情感级别、和中性情感级别,例如,可将正面情感级别对应的情感分数值设为1,将负面情感级别的情感分数值设为

1,将中性情感级别的情感分数值设为0;获取词向量对于目标对象的情感级别,并确定情感分数值,采用情感分数值优化所述词向量。需要说明的是,本实施例在给目标对象添加标识,并给词向量加一个包括三个情感级别的情感类型维度,实际上,本实施例中采用的是202维的情感分析(基于200维的词向量上假设一维标识和一维情感类型维度),
增加了对文本内容进行情感分析的维度,可以更灵活更全面地实现情感分析,使情感分析结果更为准确。
[0042]
s104、对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率。
[0043]
具体的,为了更好的反映出所述情感特征行为数据中的特征值,本发明对所述行为数据进行离散化处理,例如所述情感特征行为数据为:“暴跳如雷”,则进行离散化处理得到的目标情感特征行为数据可以为“怒”,将带有标记后的所述分析目标和包括情感类型维度的离散化后的所述行为数据输入bilstm分类模型,bilstm分类模型通过lstm(长短期记忆网络)计算每个分词对标识的情感倾向概率,并通过output layer(输出层)输出情感倾向概率。情感倾向概率值越大,表示对应的数据对标识的情感倾向性越强。具体地,当bilstm分类模型输出的结果在(0.6,1]之间时,表示对标识的情感为正面情感,当结果在[0,0.4)之间时表示对标识的情感为负面情感,结果在[0.4,0.6]之间时表示对标识的情感为中性情感。需要说明的是,本发明并不对情感的具体概率划分区间做限定,其数值划分区间根据实际情况可在一定范围内进行调整,只需满足体现情感差别即可,能实现较好地判断文本对于目标对象的情感。
[0044]
请参阅图2,本发明提供一种人工智能情感分析系统,适用于所述的一种人工智能情感分析方法,所述人工智能情感分析系统包括数据获取模块1、预处理模块2、数据训练模块3和情感倾向计算模块4,所述数据获取模块1、所述预处理模块2、所述数据训练模块3和所述情感倾向计算模块4依次连接;
[0045]
所述数据获取模块1,用于获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本;
[0046]
所述预处理模块2,用于对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理;
[0047]
所述数据训练模块3,用于对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据;
[0048]
所述情感倾向计算模块4,用于对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率。
[0049]
在本实施方式中,关于一种人工智能情感分析系统的具体限定可以参见上文中对于一种人工智能情感分析方法的限定,在此不再赘述。上述一种人工智能情感分析系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0050]
本发明的一种人工智能情感分析方法及其系统,获取待分析样本集,并根据所述样本集提取出对应的分析目标和待分析样本;对所述分析目标进行标记,并对所述待分析样本进行切词处理及预处理;对预处理后的切词结果进行训练,并基于训练后得到的分析向量获取对应的行为数据;对所述行为数据进行离散化处理,并结合标记后的所述分析目标输入构建的分析模型中,得到对应的情感倾向概率,能实现较好地判断文本对于目标对象的情感。
[0051]
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权
利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1