1.本公开属于产品评价预测技术领域,具体涉及一种多特征融合产品的情感趋势预测模型、建立方法及预测方法。
背景技术:2.随着移动互联网与电子商务的发展,用户在网上购买产品并体验后,一般会在平台上写下对该产品的体验感受,对商品做出评价,分享使用体验。产品在线评论能够给其它消费者提供意见和建议,进而做出合理的购买决策。以企业的角度来说,面对海量的评论数据,不能很好地掌控市场对于产品的多样化需求,无法提前预测分析出市场对于新产品的评价情感趋势走向,使其转化为设计要求,这将成为企业开发与改进产品的关键。为了获取消费者的体验感受,研究者设计了语义分化(sd)问卷来记录受访者的感受,但这种方法为了消除个体差异,往往会对大量消费者进行调查,需要漫长的时间才可以完成。
技术实现要素:3.本公开提供了一种多特征融合产品的情感趋势预测模型、建立方法及预测方法,旨在解决现有技术中面对海量的评论数据,很难提前预测分析出市场对于新产品的评价情感趋势走向的技术问题,以及现有技术对新产品的评价情感趋势预测精度较低的问题。
4.为了解决上述技术问题,本公开所采用的技术方案为:一种多特征融合产品的情感趋势预测模型建立方法,包括以下步骤:
5.s101、爬取电商网站上产品的评论数据以及产品属性特征数据;
6.s102、对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集;
7.s201、搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型;
8.s301、采用训练数据集中的数据对情感趋势预测模型进行训练,并采用测试数据集对情感趋势预测模型进行测试,直到获得测试合格的情感趋势预测模型。
9.进一步改进的方案:在步骤s102中,
10.对爬取的数据进行数据清洗时,去除重复、无效、系统默认或字数少于设定字数的评论;
11.在对清洗后的评论数据进行情感分析获得评论数据的情感值时,对评论数据进行情感分析,计算每条评论的情感值,通过计算产品所有评论数据的情感值均值得到产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型训练数据。
12.进一步改进的方案:多特征融合产品的情感趋势预测模型建立方法,还包括利用遗传算法优化训练好的情感趋势预测模型的步骤,将情感趋势预测模型中需要优化的参数
编码成遗传算法中个体染色体的基因,具体包括:
13.s401、利用随机值初始化遗传算法的第一代种群,种群的每一个个体即代表了一种可能的最优网络模型结构;
14.s402、通过对适应度函数的计算来评价个体的适应度,适应度越大,被保留下来的概率也越大;
15.s403、被保留下来的个体被随机选择成为父代,通过染色体交叉、基因突变生成下一代理论上更优的个体,并共同组成新一代种群;
16.重复s402和s403步骤,直到达到设定的遗传算法的结束条件,从中选择适应度最大的个体,该个体表示了一种理论上最优的网络模型结构。
17.通过遗传算法对多层模型结构进行全局寻优,突出各层的学习优势,消除各层之间独立学习的壁垒,从而提高对产品评价满意度的预测精度,因此,提出了采用遗传算法对网络结构进行优化,由遗传算法在一系列决策规则下自学习地对模型确切结构进行优化。由于情感趋势预测模型中可调节的参数过多,采用遗传优化算法对整个模型的结构进行优化以提升收敛速度,获得最佳网络结构进行预测。
18.进一步改进的方案:在步骤s101中,采用python的beautiful soup爬虫框架爬取电商网站上产品的评论数据;在步骤s102中,利用正则表达式对评论数据进行数据清洗。
19.第二方面,本发明还提供了一种多特征融合产品的情感趋势预测模型,所述模型由上述任一方案所述的一种多特征融合产品的情感趋势预测模型建立方法建立。
20.第三方面,本发明还提供了一种基于多层神经网络的多特征融合产品评价预测方法,包括:输入产品属性特征数据至上述的一种多特征融合产品的情感趋势预测模型中,得到产品评价情感值的预测数据。
21.本公开的有益效果为:
22.(1)本发明将情感分析与多层神经网络相结合,将设计评价任务转化为服装分类任务,能够利用训练好的产品评价预测模型实现对大量产品评价的有效预测,提高预测效率。
23.(2)本发明根据网络上爬取大量的真实数据作为研究数据,所建立的模型具有较高的可信度,从而进一步提高其可行性,不仅可以科学地预测消费者对产品的感性形象评价,而且可以为产品设计提供合理的数据支持。
24.(3)本发明在情感趋势预测模型训练中通过引入卷积注意力层,在通道和空间维度上实现多维度分离特征注意力策略,通过通道注意力机制分析浅层特征通道与空间上的重要性,由重要性的不同进而分配多特征上不同的权重,进一步解决深度学习模型训练过程中重要特征丢失的问题,从而大幅提高预测的准确度。
25.(4)本发明提出同时包含堆叠深度可分离卷积特征提取层(dscnn)、卷积注意力层(cbam)、双向长短期记忆网络预测层(bilstm/双向lstm 模型)和全连接层(dense)的预测模型,由于网络中可调节的参数过多使预测问题变得相当复杂,这种复杂性不仅关系到每一层中传入数据的形式,还关系到神经网络确切结构的选择。采用现有的经典预测算法只能提取浅层特征,对多变量特征预测问题缺少深层次信息的分析,导致长期预测问题中精度偏低;本发明提出的情感趋势预测模型,首先利用深度可分离卷积代替经典卷积提取数据多维度多特征的信息,再添加卷积模块的注意力机制,结合注意力机制优化bilstm网络
学习性能,强化对一次特征提取后序列中局部重要信息的关注程度;最后利用bilstm网络对训练数据实现前向与后向双向分析,实现二次特征的提取,进一步解决重要特征丢失与模型超参数过多等问题,从而大幅提高预测的准确度。
26.(5)本发明通过情感分析代替传统感性工学对产品进行打分,结合深度学习技术,在改变现有产品某些参数的情况下,用来预测新产品的情感倾向走势,给企业设计生产提供科学的指导。
附图说明
27.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简要介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关附图。
28.图1是本发明中情感趋势预测模型建立方法流程图。
29.图2是本发明中情感趋势预测模型构建流程示意图。
具体实施方式
30.下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚完整的描述。应当理解,此处所描述的具体实施例仅仅用于解释本公开,并不用于限定本公开。基于本公开的实施例,本领域技术人员在没有创造性劳动的前提下所获得的所有其他实施例,都属于本公开的保护范围。
31.本发明中,情感分析目的是从在线评论中获得用户的意见,包括对产品质量、外观、使用体验方面等产品属性特征的感受,从用户发布的所有在线评论中进行句子级的情感分析,通过百度ai自然语言处理平台对句子进行情感极性判断,分析出文本属于积极、消极的概率,以此作为文本的情感指数,得到用户综合体验的情感值序列数据,再建立基于多层深度学习的预测模型以实现对新产品的评价预测。因此,本发明作为一种将情感分析与深度学习相结合的方法,基于网上大量在线评论,构建出多层神经网络的多特征融合产品评价预测模型,科学地分析产品网络评论文本数据,使其转化为设计要求,为企业设计生产具有十分重要的指导意义。
32.实施例一:
33.参阅图1和图2,一种多特征融合产品的情感趋势预测模型建立方法,包括以下步骤:
34.s101、爬取电商网站上产品的评论数据以及产品属性特征数据;具体的:
35.通过python的beautiful soup爬虫框架爬取电商网站中用户发表的在线评论,之后对评论采用jieba工具进行分词、去重与去停用词,通过python进行词频统计与可视化,找出并爬取消费者最关注的产品属性特征,如价格、颜色等。
36.s102、对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集。
37.在对清洗后的评论数据进行情感分析获得评论数据的情感值时,对评论数据进行
情感分析,计算每条评论的情感值,通过计算产品所有评论数据的情感值均值得到产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据集。对爬取的数据进行数据清洗时:利用正则表达式对文本评论数据进行数据清洗,剔除去除重复、无效、系统默认或字数少于设定字数的评论,再利用引入百度ai开放平台的自然语言处理技术,对清洗后的评论数据进行情感分析,计算每条评论的情感值;之后对采集的产品参数特征进行缺失值处理与校正以保证数据的真实、可靠性。
38.数据整合与划分:由爬取的产品参数特征与对应产品的产品情感值共同组成原始数据集,其中评价的产品情感值列作为预测目标。同时为构造bilstm 层数据输入形式,对原始数据集进行时间窗口划分,以多步序列预测下一步,其中产品情感值既是输入也是输出;之后,对原始数据集的数据进行归一化处理以提高神经网络的训练效率,最后将原始数据集的80%作为训练数据,20%作为测试数据。
39.s201、搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层(cbam)、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型。
40.其中,深度可分离卷积(dscnn)特征提取层利用深度可分离卷积代替经典卷积操作,深度可分离卷积主要是在网络结构上进行优化,由深度卷积 (depthwise convolution,dwc)和逐点卷积(pointwiseconvolution,pwc) 两个过程组成;dscnn在不改变最终生成的特征图大小的情况下,完成了空间与通道两个维度的分离卷积操作,从训练数据集中提取一次时空互联特征;这种做法不仅符合多维表特征提取规律,而且相对于标准卷积,其模型表征能力能够自如调节。
41.其中,因卷积操作将每个通道以及空间位置中所蕴含的信息视为同等重要,若重要的特征与一般特征的权重是相同的,重要的特征会因为经过多层隐藏层的训练而丢失,从而丧失了预测的精确性;本发明采用了一种轻量化的注意力模块cbam,其包含两个独立的子模块,分别为通道注意力模块(cam)与空间注意力模块(sam),实现了在通道与空间维度上分离的注意力机制,自学习地对多维度上多特征分配不同的权重,获取注意力特征图,权重越大则表示该特征越重要,从而强化对一次时空互联特征中重要的特征的关注,剔除冗余特征的影响。
42.其中,由cbam注意力机制优化bilstm学习性能,bilstm是对rnn、 lstm的改进,为解决梯度消失与梯度爆炸问题,并可以同时处理前后双向序列的组合特征,由此获取对训练数据的二次深层分析的特征图。
43.s301、采用训练数据集中的数据对情感趋势预测模型进行训练,并采用测试数据集对情感趋势预测模型进行测试,直到获得测试合格的情感趋势预测模型。
44.多特征融合产品的情感趋势预测模型建立方法,还包括利用遗传算法优化训练好的情感趋势预测模型的步骤,将情感趋势预测模型中需要优化的参数编码成遗传算法中个体染色体的基因,具体包括:
45.s401、利用随机值初始化遗传算法的第一代种群,种群的每一个个体即代表了一种可能的最优网络模型结构;
46.s402、通过对适应度函数的计算来评价个体的适应度,适应度越大,被保留下来的概率也越大;
47.s403、被保留下来的个体被随机选择成为父代,通过染色体交叉、基因突变生成下
一代理论上更优的个体,并共同组成新一代种群;
48.重复s402和s403步骤,直到达到设定的遗传算法的结束条件,从中选择适应度最大的个体,该个体表示了一种理论上最优的网络模型结构。
49.因此,提出了采用遗传算法对网络结构进行优化,由遗传算法在一系列决策规则下自学习地对模型确切结构进行优化。
50.遗传算法的优化目的是为了确定深度可分离卷积(dscnn)特征提取层、双向长短期记忆网络预测层和全连接层的层数以及每层上的神经元个数。若设置每层神经网络最大不超过三层,则模型最多需要优化的属性共有12个,那么个体的染色体就可以实例化成含有12个数的列表。上述编码完成即形成一个个体的基因型,也就是使模型达到最优解的一个可能值。
51.对于本发明提出同时包含bilstm、dscnn、dense层的预测模型,可调节的参数过多使问题变得相当复杂,这种复杂性不仅关系到每一层中传入数据的形式,还关系到神经网络确切结构的选择。因此,本发明使用遗传算法来优化模型结构,它是根据自然界生物进化论演变而来,目标是在一定的约束条件下,以一定的顺序执行使得目标函数取得最优解。使用遗传算法优化本发明模型结构之前,需要做如下几项工作以保证遗传算法的正常执行:
52.1)首先,确定需要优化的模型结构,其中包括深度卷积层层数、bilstm 层的层数与全连接层的层数,以及上述每层中的神经元个数。
53.2)其次,还需要设定遗传算法的参数(如表1所示),其中population表示种群中个体数量,nc为父代染色体基因重组的概率,nm为基因突变的概率,e
p
表示遗传算法进化的代数。遗传算法中染色体的长度设置为12,前三位分别表示卷积层层数、bilstm层的层数与全连接层的层数,每个模型层数最多为三层。若每层层数达到最多时,4-6位为每层dscnn层的神经元个数,7-9位为 bilstm层的神经元个数,10-12位为dense层神经元个数。
54.表1遗传算法参数表
[0055][0056][0057]
3)下一步是创建神经网络的第一个种群,每个神经网络都用描述属性的随机组合初始化。在本发明中,将需要优化的参数放进列表中并用整数编码,模型需要优化的属性共有12个,那么种群中个体的染色体就可以实例化成含有 12个整数的列表。上述编码完成即形成一个个体的基因型,也就是使模型达到最优解的一个可能值。遗传算法中population的大小表示了该种群含有的个体数量,用0至64中随机值对所有个体的染色体上每一位进行随机赋值,此时第一代种群共存在10类不同的个体,即包含十种结构不同的模型,每一个个体都代表了一种可能的最优解。
[0058]
4)初始化形成第一代种群后,下一步是用本发明训练数据集对十种模型进行训练,训练过程中的损失函数是均方误差(mse),优化器是adam,目标是最小化mse;而其他用来评估模型性能的指标都是在训练完成以后,用来评估其在测试集上的表现,由这些性能指标的一种作为遗传算法的适应度函数,用来评估该模型的优劣。
[0059]
5)对种群中所有个体进行评估,适应度越高的个体,被选择保留下来作为父代的概率也越大;对上一代留下来的父代以nc概率下进行两两染色体交叉,nm概率下发生基因突变并产生下一代,最后组成一个新的种群;当产生第二十个种群后即代表遗传算法迭代结束,从中选取适应度最高的个体作为最优模型结构,从而输出预测结果。
[0060]
本实施例公开的一种的利用遗传算法优化融合注意力机制的情感趋势预测模型,旨在预测用户对某产品的满意程度/产品情感值,其主要结论如下:
[0061]
(1)基于深度可分离卷积的一次浅层特征提取模型,是从两个维度上充分提取产品与评价满意度数据之间的关联特征,有效解决了经典卷积网络的特征提取能力不足问题。
[0062]
(2)嵌入注意力机制后的二次深层特征提取模型,采用cbam注意力分配特征权重来强化bilstm深层特征分析的能力,提高算法的自学习能力,有效解决了长期训练过程的重要特征丢失问题。
[0063]
(3)基于遗传算法对深度可分离卷积层、bilstm层与dense层的层数与每层的神经元个数进行优化,通过计算适应度函数值对模型参数再训练、优化,从而获得模型的最佳网络结构。
[0064]
(4)从用户体验后发表的在线评论中分析得到用户对该产品的满意程度,综合显示器一些重要影响因素,旨在分析产品某些重要属性,例如价格、分辨率等的改变等对用户满意程度的波动,对企业在研发新产品,设计产品时提供参考意见。
[0065]
实施例二:
[0066]
本实施例提供了一种多特征融合产品的情感趋势预测模型,所述模型由实施例一任一方案所述的一种多特征融合产品的情感趋势预测模型建立方法建立。
[0067]
实施例三:
[0068]
本实施例提供了一种基于多层神经网络的多特征融合产品评价预测方法,包括:输入产品属性特征数据至实施例二所述的一种多特征融合产品的情感趋势预测模型中,得到产品评价情感值的预测数据。
[0069]
本公开不局限于上述可选实施方式,任何人在本公开的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本公开权利要求界定范围内的技术方案,均落在本公开的保护范围之内。