一种数据统计分析系统的制作方法

文档序号:20164417发布日期:2020-03-24 21:20阅读:415来源:国知局
一种数据统计分析系统的制作方法

本发明属于电子商务平台技术领域,具体涉及一种数据统计分析系统。



背景技术:

电子商务是指以信息网络技术为手段,以商品交换为中心的商务活动;也可理解为在互联网、企业内部网和增值网上以电子交易方式进行交易活动和相关服务的活动,是传统商业活动各环节的电子化、网络化、信息化;以互联网为媒介的商业行为均属于电子商务的范畴。电子商务包括哪些电子商务内容一般来说,电子商务是指在广泛的商业贸易活动中,在互联网环境下,基于浏览器或服务器应用程序,买方和卖方不见面地进行各种商业活动,实现消贵者的网购、商户间的在线交易和在线支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。

随着电子商务的不断推广,虽然极大的方便了经营者与消费者之间的交易活动,提高了交易效率,但在进行交易过程中,因消费者群体不同,会涉及多种电子商务领域,因此如何对服务内容复杂,服务交易量大的电子商务活动信息进行采集和监控,成为了当前电子商务服务水平提高的总要因素,而针对这一问题,当前尚缺乏一种专业有效的数据监控平台,从而导致了当前对多领域电子商务活动信息监控存在严重的漏洞和缺失。

为此,我们提出一种数据统计分析系统来解决现有技术中存在的问题,首先利用信息输入单元的多种输入模块对交易模块内输出的数据进行规整存储,将可视化分析、数据挖掘、预测性分析、语义分析引擎和数据质量管理统一设置为数据分析模块,利用图形化手段配合数据挖掘,再结合预测分析和语义分析引擎,对统计存储的数据进行全方位延展性的处理后,可对多领域电子商务活动信息进行有效的信息监控,提高数据分析的透明度。



技术实现要素:

本发明的目的在于提供一种数据统计分析系统,以解决上述背景技术中提出现有技术中尚缺乏一种专业有效的数据监控平台,从而导致了当前对多领域电子商务活动信息监控存在严重的漏洞和缺失的问题。

为实现上述目的,本发明采用了如下技术方案:一种数据统计分析系统,包括电子商务交易模块、数据存储模块和数据分析模块,所述数据分析模块用于对数据存储模块内的数据进行分析,所述数据存储模块用于对电子商务交易模块统计的数据进行存储;

所述数据存储模块包括计算机和信息输入单元,所述信息输入单元包括键盘、鼠标、电子书写板,所述信息输出接口支持如下接口之一或组合:通用串行接口、计算机串口、计算机并口、pcmcia接口、ps/2接口、无线通讯接口、红外通讯接口;

所述数据分析模块包括可视化分析单元、数据挖掘单元、预测性分析单元、语义分析引擎单元和数据质量管理单元,所述可视化分析单元是对数据进行可视化处理,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,所述数据挖掘单元是用于预测性分析的独立产品,可以对统计存储的数据进行演算从而提供预测性智能。

优选的,所述数据可视化单元的数据可视包括两个主要的组成部分:统计图形和主题图,数据可视化可以利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。

优选的,所述数据挖掘单元不仅可为用户提供直观的流式建模、拖拽式操作和流程化、可视化的建模界面,还提供了大量的数据预处理操作,数据挖掘单元还内置了多种实用的、经典的机器学习算法,这些算法配置简单降低了机器学习的使用门槛,节省了企业成本,并支持标准的pmml模型输出,可以将模型发送到统一平台,与商业智能平台实现了完美整合。

优选的,所述预测分析单元涵盖了各种统计学技术,包括利用预测模型,机器学习,数据挖掘等技术来分析当前及历史数据,从而对未来,或其他不确定的事件进行预测,预测性分析是一种数据驱动的处理模式,预测性分析算法能够实现数据挖掘模式的自动化。

优选的,所述语义分析引擎单元包括文本纠错、情感倾向分析、评论观点抽取、对话情绪识别、文章标签、文章分类以及新闻摘要,依次可以识别文本中的错误片段,进行错误提示并给出,对含有主管信息的文本进行情感急性判断,自动分析用户评论,输出评论观点与情感极性,自动检测用户日常对话文本中蕴含的情绪特征,对文章按照内容类型进行自动分类,对文章进行核心关键词分析,自动抽取新闻文本中的关键信息。

优选的,所述数据质量管理单元是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高,针对数据的改善和管理,主要包括数据分析、数据评估、数据清洗、数据监控、错误预警等内容;针对组织的改善和管理,主要包括确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果等多个环节。

优选的,所述pmml是一种基于xml的标准语言,用于表达数据挖掘模型,可以用来在不同的应用程序中交换模型,其步骤为:

s1、数据词典,进入数据分析阶段,用于识别和定义哪些输入数据字段对于解决眼前的问题是最有用的,可以包括数值、顺序和分类字段;

s2、挖掘架构,用于定义处理缺少值和离群值的策略当将模型应用于实践时,所需的输入数据字段可能为空或者被误呈现;

s3、数据转换,用于定义将原始输入数据预处理至派生字段所需的计算;

s4、模型定义,用于定义用于构建模型的结构和参数;

s5、输出,用于定义预期模型输出;

s6、目标,用于定义应用于模型输出的后处理步骤,此步骤支持将输出转变为人们很容易就可以理解的分数;

s7、模型解释用于定义将测试数据传递至模型时获得的性能度量标准;

s8、模型验证,用于定义一个包含输入数据记录和预期模型输出的示例集。

本发明的技术效果和优点:本发明提出的一种数据统计分析系统,与现有技术相比,具有以下优点:

本发明首先利用信息输入单元的多种输入模块对交易模块内输出的数据进行规整存储,将可视化分析、数据挖掘、预测性分析、语义分析引擎和数据质量管理统一设置为数据分析模块,利用图形化手段配合数据挖掘,再结合预测分析和语义分析引擎,对统计存储的数据进行全方位延展性的处理后,可对多领域电子商务活动信息进行有效的信息监控,提高数据分析的透明度。

附图说明

图1为本发明的数据统计分析系统框图;

图2为本发明的数据挖掘单元步骤执行框图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了如图1-2所示的一种数据统计分析系统,包括电子商务交易模块、数据存储模块和数据分析模块,所述数据分析模块用于对数据存储模块内的数据进行分析,所述数据存储模块用于对电子商务交易模块统计的数据进行存储;

所述数据存储模块包括计算机和信息输入单元,所述信息输入单元包括键盘、鼠标、电子书写板,所述信息输出接口支持如下接口之一或组合:通用串行接口、计算机串口、计算机并口、pcmcia接口、ps/2接口、无线通讯接口、红外通讯接口;

所述数据分析模块包括可视化分析单元、数据挖掘单元、预测性分析单元、语义分析引擎单元和数据质量管理单元,所述可视化分析单元是对数据进行可视化处理,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,所述数据挖掘单元是用于预测性分析的独立产品,可以对统计存储的数据进行演算从而提供预测性智能。

所述数据可视化单元的数据可视包括两个主要的组成部分:统计图形和主题图,数据可视化可以利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。

所述数据挖掘单元不仅可为用户提供直观的流式建模、拖拽式操作和流程化、可视化的建模界面,还提供了大量的数据预处理操作,数据挖掘单元还内置了多种实用的、经典的机器学习算法,这些算法配置简单降低了机器学习的使用门槛,节省了企业成本,并支持标准的pmml模型输出,可以将模型发送到统一平台,与商业智能平台实现了完美整合。

所述预测分析单元涵盖了各种统计学技术,包括利用预测模型,机器学习,数据挖掘等技术来分析当前及历史数据,从而对未来,或其他不确定的事件进行预测,预测性分析是一种数据驱动的处理模式,预测性分析算法能够实现数据挖掘模式的自动化。

所述语义分析引擎单元包括文本纠错、情感倾向分析、评论观点抽取、对话情绪识别、文章标签、文章分类以及新闻摘要,依次可以识别文本中的错误片段,进行错误提示并给出,对含有主管信息的文本进行情感急性判断,自动分析用户评论,输出评论观点与情感极性,自动检测用户日常对话文本中蕴含的情绪特征,对文章按照内容类型进行自动分类,对文章进行核心关键词分析,自动抽取新闻文本中的关键信息。

所述数据质量管理单元是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高,针对数据的改善和管理,主要包括数据分析、数据评估、数据清洗、数据监控、错误预警等内容;针对组织的改善和管理,主要包括确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果等多个环节。

所述pmml是一种基于xml的标准语言,用于表达数据挖掘模型,可以用来在不同的应用程序中交换模型,其步骤为:

s1、数据词典,进入数据分析阶段,用于识别和定义哪些输入数据字段对于解决眼前的问题是最有用的,可以包括数值、顺序和分类字段;

s2、挖掘架构,用于定义处理缺少值和离群值的策略当将模型应用于实践时,所需的输入数据字段可能为空或者被误呈现;

s3、数据转换,用于定义将原始输入数据预处理至派生字段所需的计算;

s4、模型定义,用于定义用于构建模型的结构和参数;

s5、输出,用于定义预期模型输出;

s6、目标,用于定义应用于模型输出的后处理步骤,此步骤支持将输出转变为人们很容易就可以理解的分数;

s7、模型解释用于定义将测试数据传递至模型时获得的性能度量标准;

s8、模型验证,用于定义一个包含输入数据记录和预期模型输出的示例集。

工作原理:本发明首先利用信息输入单元的多种输入模块对交易模块内输出的数据进行规整存储,将可视化分析、数据挖掘、预测性分析、语义分析引擎和数据质量管理统一设置为数据分析模块,利用图形化手段配合数据挖掘,再结合预测分析和语义分析引擎,对统计存储的数据进行全方位延展性的处理后,可对多领域电子商务活动信息进行有效的信息监控,提高数据分析的透明度。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1