基于大数据文本分析的互联网用户评论分析方法及系统与流程

文档序号:24658684发布日期:2021-04-13 22:06阅读:274来源:国知局
基于大数据文本分析的互联网用户评论分析方法及系统与流程

1.本发明涉及数据分析技术领域,具体而言,涉及一种基于大数据文本分析的互联网用户评论分析方法及系统。


背景技术:

2.对于app运营单位来说,用户使用体验至关重要,然而,互联网运营单位获取用户对产品意见及建议的途径有限,多数情况只能通过搜索引擎、微信公众号调查问卷、app内置“意见与建议”功能模块获取,并且对于用户评论的分析也只局限于电子表格结合人工梳理的方式实现,这样的方式存在如下缺陷:
3.一、分析样本数量严重不足,导致分析结论不尽精准。
4.二、分析样本来源本身具备一定的局限性,输出结果只能侧重某一方面。
5.三、效率低下,分析结果严谨性不足。
6.四、占用大量人力资源。


技术实现要素:

7.为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于大数据文本分析的互联网用户评论分析方法及系统,可帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略;可有效提高分析效率高和精确度。
8.本发明的实施例是这样实现的:
9.第一方面,本发明实施例提供一种基于大数据文本分析的互联网用户评论分析方法,包括以下步骤:
10.获取并发送用户评价信息;
11.对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;
12.提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告;
13.使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据;
14.对分词文本数据进行词向量化操作,去除干扰信息,以得到向量化的词;
15.利用朴素贝叶斯算法对向量化的词进行运算,输出并展示运算结果。
16.为了更好的帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,进而帮助运营单位改进运营方法,优化运营策略。首先,获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息,上述数据清洗处理的方法是指有效去除数据中的无用信息及低价值信息、重复信息,将可靠的目标纯净文本信息移送数据库,以供文本大数据系统开展分析操作;得到目标纯净文本信息后,提取目标纯净文本信息中的用户情
感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果,该运算结果包括关键词云、词频占比图表、用户情感倾向分析等信息。
17.本方法通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。可同时获取各渠道采集的数据,数据样本数量大,分析结果更为精准,可参考性更强;多种分析来源,即可多渠道信息综合分析,也可针对单一渠道信息进行分析,输出结果涵盖多个方向,并可依照实际需求定向输出分析结果;分析结果较为精准,分析效率高,可在极短的时间内出具各维度分析结果及优化结论;大大节约了人力资源成本。
18.基于第一方面,在本发明的一些实施例中,上述获取并发送用户评价信息的方法包括以下步骤:
19.通过第三方移动推广数据分析平台对应信息导出、使用第三方舆情采集工具、使用数据抓取工具和第三方sdk读取信息内容其中一种或多种方式获取并发送线上用户评价信息。
20.基于第一方面,在本发明的一些实施例中,上述获取并发送用户评价信息的方法还包括以下步骤:
21.获取并发送线下用户评价信息;
22.对线下用户评价信息进行数字化处理,以得到目标补充用户评价信息。
23.基于第一方面,在本发明的一些实施例中,上述对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息的方法包括以下步骤:
24.去除用户评价信息中的无用数据、低价值数据和重复数据,以得到并发送目标纯净文本信息。
25.基于第一方面,在本发明的一些实施例中,上述提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告的方法包括以下步骤:
26.提取目标纯净文本信息中的用户情感数据;
27.通过情感词典及机器学习的方式对用户情感数据进行分析,按照既定的规则将用户情感数据进行分类,生成并发送分类报告。
28.第二方面,本发明实施例一种基于大数据文本分析的互联网用户评论分析系统,包括评价获取模块、数据清洗模块、情感分类模块、分词处理模块、向量化模块以及结果输出模块,其中:
29.评价获取模块,用于获取并发送用户评价信息;
30.数据清洗模块,用于对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;
31.情感分类模块,用于提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告;
32.分词处理模块,用于使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据;
33.向量化模块,用于对分词文本数据进行词向量化操作,去除干扰信息,以得到向量化的词;
34.结果输出模块,用于利用朴素贝叶斯算法对向量化的词进行运算,输出并展示运算结果。
35.为了更好的帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,进而帮助运营单位改进运营方法,优化运营策略。首先,通过评价获取模块获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后通过数据清洗模块对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息,上述数据清洗处理的方法是指有效去除数据中的无用信息及低价值信息、重复信息,将可靠的目标纯净文本信息移送数据库,以供文本大数据系统开展分析操作;得到目标纯净文本信息后,通过情感分类模块提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,分词处理模块使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,通过向量化模块对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后通过结果输出模块利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果,该运算结果包括关键词云、词频占比图表、用户情感倾向分析等信息。
36.本系统法通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。可同时获取各渠道采集的数据,数据样本数量大,分析结果更为精准,可参考性更强;多种分析来源,即可多渠道信息综合分析,也可针对单一渠道信息进行分析,输出结果涵盖多个方向,并可依照实际需求定向输出分析结果;分析结果较为精准,分析效率高,可在极短的时间内出具各维度分析结果及优化结论;大大节约了人力资源成本。
37.基于第二方面,在本发明的一些实施例中,上述评价获取模块包括线上子模块,用于通过第三方移动推广数据分析平台对应信息导出、使用第三方舆情采集工具、使用数据抓取工具和第三方sdk读取信息内容其中一种或多种方式获取并发送线上用户评价信息。
38.基于第二方面,在本发明的一些实施例中,上述评价获取模块还包括线下信息子
模块和数字处理子模块,其中:
39.线下信息子模块,用于获取并发送线下用户评价信息;
40.数字处理子模块,用于对线下用户评价信息进行数字化处理,以得到目标补充用户评价信息。
41.基于第二方面,在本发明的一些实施例中,上述数据清洗模块包括冗余去除子模块,用于去除用户评价信息中的无用数据、低价值数据和重复数据,以得到并发送目标纯净文本信息。
42.基于第二方面,在本发明的一些实施例中,上述情感分类模块包括提取子模块和分类子模块,其中:
43.提取子模块,用于提取目标纯净文本信息中的用户情感数据;
44.分类子模块,用于通过情感词典及机器学习的方式对用户情感数据进行分析,按照既定的规则将用户情感数据进行分类,生成并发送分类报告。
45.本发明实施例至少具有如下优点或有益效果:
46.本发明实施例提供一种基于大数据文本分析的互联网用户评论分析方法,首先,获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;得到目标纯净文本信息后,提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果。本方法通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。
47.本发明实施例还提供一种基于大数据文本分析的互联网用户评论分析系统,通过评价获取模块获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后通过数据清洗模块对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;得到目标纯净文本信息后,通过情感分类模块提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,分词处理模块使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,通过向量化模块对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后通过结果输出模块利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果。本系统法通过自动信息采集辅以人工整理的方式获取全
渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。
附图说明
48.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
49.图1为本发明实施例一种基于大数据文本分析的互联网用户评论分析方法的流程图;
50.图2为本发明实施例一种基于大数据文本分析的互联网用户评论分析系统的原理框图。
51.图标:100、评价获取模块;110、线上子模块;120、线下信息子模块;130、数字处理子模块;200、数据清洗模块;210、冗余去除子模块;300、情感分类模块;310、提取子模块;320、分类子模块;400、分词处理模块;500、向量化模块;600、结果输出模块。
具体实施方式
52.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
53.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
55.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。
56.实施例
57.如图1所示,第一方面,本发明实施例提供一种基于大数据文本分析的互联网用户
评论分析方法,包括以下步骤:
58.s1、获取并发送用户评价信息;
59.s2、对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;
60.s3、提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告;
61.s4、使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据;
62.s5、对分词文本数据进行词向量化操作,去除干扰信息,以得到向量化的词;
63.s6、利用朴素贝叶斯算法对向量化的词进行运算,输出并展示运算结果。
64.为了更好的帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,进而帮助运营单位改进运营方法,优化运营策略。首先,获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息,上述数据清洗处理的方法是指有效去除数据中的无用信息及低价值信息、重复信息,将可靠的目标纯净文本信息移送数据库,以供文本大数据系统开展分析操作;得到目标纯净文本信息后,提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果,该运算结果包括关键词云、词频占比图表、用户情感倾向分析等信息。
65.本方法通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。可同时获取各渠道采集的数据,数据样本数量大,分析结果更为精准,可参考性更强;多种分析来源,即可多渠道信息综合分析,也可针对单一渠道信息进行分析,输出结果涵盖多个方向,并可依照实际需求定向输出分析结果;分析结果较为精准,分析效率高,可在极短的时间内出具各维度分析结果及优化结论;大大节约了人力资源成本。
66.基于第一方面,在本发明的一些实施例中,上述获取并发送用户评价信息的方法包括以下步骤:
67.通过第三方移动推广数据分析平台对应信息导出、使用第三方舆情采集工具、使用数据抓取工具和第三方sdk读取信息内容其中一种或多种方式获取并发送线上用户评价信息。
68.获取的用户评价信息包含线上用户评价信息和线下用户评价信息,在获取线上用户评价信息时,采用上述一种或多种数据获取方式去获取数据,提高数据获取的效率以及
准确性。
69.基于第一方面,在本发明的一些实施例中,上述获取并发送用户评价信息的方法还包括以下步骤:
70.获取并发送线下用户评价信息;
71.对线下用户评价信息进行数字化处理,以得到目标补充用户评价信息。
72.获取的用户评价信息包含线上用户评价信息和线下用户评价信息,以保证数据的全面性。获取到线下用户评价信息后,要对其进行数字化处理,该数字化处理是指将线下用户评价信息转换成计算机可读取的数字化数据,以得到目标补充用户评价信息,以便进行后续操作,作为线上用户评价信息内容的有益补充。
73.基于第一方面,在本发明的一些实施例中,上述对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息的方法包括以下步骤:
74.去除用户评价信息中的无用数据、低价值数据和重复数据,以得到并发送目标纯净文本信息。
75.为了保证后续数据处理的效率,减小数据处理负荷量,在获取到用户评价信息后,对用户评价信息进行数据清洗处理,去除用户评价信息中的无用数据、低价值数据和重复数据等干扰信息,以得到并发送目标纯净文本信息,以供文本大数据系统开展分析操作。
76.基于第一方面,在本发明的一些实施例中,上述提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告的方法包括以下步骤:
77.提取目标纯净文本信息中的用户情感数据;
78.通过情感词典及机器学习的方式对用户情感数据进行分析,按照既定的规则将用户情感数据进行分类,生成并发送分类报告。
79.为了及时有效的了解到用户对app使用情感态度情况,对用户情感进行分析,以便app运营单位及时掌握用户反馈,进而调整运营策略。首先,提取目标纯净文本信息中的用户情感数据,然后通过情感词典及机器学习的方式针对用户情感数据对用户情感进行分析,该分析方法是指按照既定的规则将用户情感数据进行分类,生成并发送分类报告,上述既定的规则是指根据现有的情感词语表示的情感态度设定好的规则。
80.如图2所示,第二方面,本发明实施例一种基于大数据文本分析的互联网用户评论分析系统,包括评价获取模块100、数据清洗模块200、情感分类模块300、分词处理模块400、向量化模块500以及结果输出模块600,其中:
81.评价获取模块100,用于获取并发送用户评价信息;
82.数据清洗模块200,用于对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息;
83.情感分类模块300,用于提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告;
84.分词处理模块400,用于使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据;
85.向量化模块500,用于对分词文本数据进行词向量化操作,去除干扰信息,以得到向量化的词;
86.结果输出模块600,用于利用朴素贝叶斯算法对向量化的词进行运算,输出并展示运算结果。
87.为了更好的帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,进而帮助运营单位改进运营方法,优化运营策略。首先,通过评价获取模块100获取并发送用户评价信息,该用户评价信息包含线上数据和线下数据,保证数据的全面性;然后通过数据清洗模块200对用户评价信息进行数据清洗处理,以得到并发送目标纯净文本信息,上述数据清洗处理的方法是指有效去除数据中的无用信息及低价值信息、重复信息,将可靠的目标纯净文本信息移送数据库,以供文本大数据系统开展分析操作;得到目标纯净文本信息后,通过情感分类模块300提取目标纯净文本信息中的用户情感数据,按照既定的规则将用户情感数据进行分类,生成并发送分类报告,对用户情感进行分析,及时有效的了解用户情感情绪信息,即满意度情况信息;然后,分词处理模块400使用中文分词框架对分类报告中的文本信息进行分词操作,以得到并发送分词文本数据,便于后续开展对停用词、词向量的计算;对文本信息进行分词操作后,通过向量化模块500对分词文本数据进行词向量化操作,去除停用词及其它干扰信息,以得到向量化的词;然后通过结果输出模块600利用朴素贝叶斯算法对向量化的词进行运算,生成并输出运算结果,然后通过可视化工具展示运算结果,该运算结果包括关键词云、词频占比图表、用户情感倾向分析等信息。
88.本系统法通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。可同时获取各渠道采集的数据,数据样本数量大,分析结果更为精准,可参考性更强;多种分析来源,即可多渠道信息综合分析,也可针对单一渠道信息进行分析,输出结果涵盖多个方向,并可依照实际需求定向输出分析结果;分析结果较为精准,分析效率高,可在极短的时间内出具各维度分析结果及优化结论;大大节约了人力资源成本。
89.基于第二方面,如图2所示,在本发明的一些实施例中,上述评价获取模块100包括线上子模块110,用于通过第三方移动推广数据分析平台对应信息导出、使用第三方舆情采集工具、使用数据抓取工具和第三方sdk读取信息内容其中一种或多种方式获取并发送线上用户评价信息。
90.获取的用户评价信息包含线上用户评价信息和线下用户评价信息,在获取线上用户评价信息时,通过线上子模块110采用上述一种或多种数据获取方式去获取数据,提高数据获取的效率以及准确性。
91.基于第二方面,如图2所示,在本发明的一些实施例中,上述评价获取模块100还包括线下信息子模块120和数字处理子模块130,其中:
92.线下信息子模块120,用于获取并发送线下用户评价信息;
93.数字处理子模块130,用于对线下用户评价信息进行数字化处理,以得到目标补充用户评价信息。
94.获取的用户评价信息包含线上用户评价信息和线下用户评价信息,以保证数据的
全面性。通过线下信息子模块120获取到线下用户评价信息后,要通过数字处理子模块130对其进行数字化处理,该数字化处理是指将线下用户评价信息转换成计算机可读取的数字化数据,以得到目标补充用户评价信息,以便进行后续操作,作为线上用户评价信息内容的有益补充。
95.基于第二方面,如图2所示,在本发明的一些实施例中,上述数据清洗模块200包括冗余去除子模块210,用于去除用户评价信息中的无用数据、低价值数据和重复数据,以得到并发送目标纯净文本信息。
96.为了保证后续数据处理的效率,减小数据处理负荷量,在获取到用户评价信息后,通过冗余去除子模块210对用户评价信息进行数据清洗处理,去除用户评价信息中的无用数据、低价值数据和重复数据等干扰信息,以得到并发送目标纯净文本信息,以供文本大数据系统开展分析操作。
97.基于第二方面,如图2所示,在本发明的一些实施例中,上述情感分类模块300包括提取子模块310和分类子模块320,其中:
98.提取子模块310,用于提取目标纯净文本信息中的用户情感数据;
99.分类子模块320,用于通过情感词典及机器学习的方式对用户情感数据进行分析,按照既定的规则将用户情感数据进行分类,生成并发送分类报告。
100.为了及时有效的了解到用户对app使用情感态度情况,对用户情感进行分析,以便app运营单位及时掌握用户反馈,进而调整运营策略。首先,通过提取子模块310提取目标纯净文本信息中的用户情感数据,然后分类子模块320通过情感词典及机器学习的方式针对用户情感数据对用户情感进行分析,该分析方法是指按照既定的规则将用户情感数据进行分类,生成并发送分类报告,上述既定的规则是指根据现有的情感词语表示的情感态度设定好的规则。
101.综上,本发明的实施例提供一种基于大数据文本分析的互联网用户评论分析方法及系统,通过自动信息采集辅以人工整理的方式获取全渠道的用户评论信息,对数据进行清洗后,由大数据信息系统对用户评论文本进行分析,从情感分析、机器学习、知识图谱、数据萃取等方面进行多维度文本分析,最终按照app运营方指定的方式输出各类分析结果,总结分析结论,输出分析图表,以帮助app运营单位灵活、快速地掌握运营成果,及时了解用户意见、建议,改进运营方法,优化运营策略,最大程度地满足用户的使用需求,并为运营单位带来持续可发展的经济效益及社会效益。可同时获取各渠道采集的数据,数据样本数量大,分析结果更为精准,可参考性更强;多种分析来源,即可多渠道信息综合分析,也可针对单一渠道信息进行分析,输出结果涵盖多个方向,并可依照实际需求定向输出分析结果;分析结果较为精准,分析效率高,可在极短的时间内出具各维度分析结果及优化结论;大大节约了人力资源成本。
102.以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
103.对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权
利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1