一种数据统计分析系统的制作方法

文档序号:20164417发布日期:2020-03-24 21:20阅读:来源:国知局

技术特征:

1.一种数据统计分析系统,包括电子商务交易模块、数据存储模块和数据分析模块,其特征在于:所述数据分析模块用于对数据存储模块内的数据进行分析,所述数据存储模块用于对电子商务交易模块统计的数据进行存储;

所述数据存储模块包括计算机和信息输入单元,所述信息输入单元包括键盘、鼠标、电子书写板,所述信息输出接口支持如下接口之一或组合:通用串行接口、计算机串口、计算机并口、pcmcia接口、ps/2接口、无线通讯接口、红外通讯接口;

所述数据分析模块包括可视化分析单元、数据挖掘单元、预测性分析单元、语义分析引擎单元和数据质量管理单元,所述可视化分析单元是对数据进行可视化处理,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,所述数据挖掘单元是用于预测性分析的独立产品,可以对统计存储的数据进行演算从而提供预测性智能。

2.根据权利要求1所述的一种数据统计分析系统,其特征在于:所述数据可视化单元的数据可视包括两个主要的组成部分:统计图形和主题图,数据可视化可以利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。

3.根据权利要求1所述的一种数据统计分析系统,其特征在于:所述数据挖掘单元不仅可为用户提供直观的流式建模、拖拽式操作和流程化、可视化的建模界面,还提供了大量的数据预处理操作,数据挖掘单元还内置了多种实用的、经典的机器学习算法,这些算法配置简单降低了机器学习的使用门槛,节省了企业成本,并支持标准的pmml模型输出,可以将模型发送到统一平台,与商业智能平台实现了完美整合。

4.根据权利要求1所述的一种数据统计分析系统,其特征在于:所述预测分析单元涵盖了各种统计学技术,包括利用预测模型,机器学习,数据挖掘等技术来分析当前及历史数据,从而对未来,或其他不确定的事件进行预测,预测性分析是一种数据驱动的处理模式,预测性分析算法能够实现数据挖掘模式的自动化。

5.根据权利要求1所述的一种数据统计分析系统,其特征在于:所述语义分析引擎单元包括文本纠错、情感倾向分析、评论观点抽取、对话情绪识别、文章标签、文章分类以及新闻摘要,依次可以识别文本中的错误片段,进行错误提示并给出,对含有主管信息的文本进行情感急性判断,自动分析用户评论,输出评论观点与情感极性,自动检测用户日常对话文本中蕴含的情绪特征,对文章按照内容类型进行自动分类,对文章进行核心关键词分析,自动抽取新闻文本中的关键信息。

6.根据权利要求1所述的一种数据统计分析系统,其特征在于:所述数据质量管理单元是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高,针对数据的改善和管理,主要包括数据分析、数据评估、数据清洗、数据监控、错误预警等内容;针对组织的改善和管理,主要包括确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果等多个环节。

7.根据权利要求3所述的一种数据统计分析系统,其特征在于:所述pmml是一种基于xml的标准语言,用于表达数据挖掘模型,可以用来在不同的应用程序中交换模型,其步骤为:

s1、数据词典,进入数据分析阶段,用于识别和定义哪些输入数据字段对于解决眼前的问题是最有用的,可以包括数值、顺序和分类字段;

s2、挖掘架构,用于定义处理缺少值和离群值的策略当将模型应用于实践时,所需的输入数据字段可能为空或者被误呈现;

s3、数据转换,用于定义将原始输入数据预处理至派生字段所需的计算;

s4、模型定义,用于定义用于构建模型的结构和参数;

s5、输出,用于定义预期模型输出;

s6、目标,用于定义应用于模型输出的后处理步骤,此步骤支持将输出转变为人们很容易就可以理解的分数;

s7、模型解释,用于定义将测试数据传递至模型时获得的性能度量标准;

s8、模型验证,用于定义一个包含输入数据记录和预期模型输出的示例集。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1