一种云计算数据自动分类统计的方法和系统的制作方法

文档序号:6622582阅读:254来源:国知局
一种云计算数据自动分类统计的方法和系统的制作方法
【专利摘要】本发明公开了一种云计算数据自动分类统计的方法,该方法包括:云存储设备接收数据,分析数据的注册信息;云存储设备向数据统计中心发送所述数据及所述数据的注册信息;数据统计中心接收所述数据及注册信息,并根据所述注册信息对所述数据进行分类;数据统计中心将分类后的数据传回云存储设备进行分类存储。本发明的方法能对数据实时发送、实时分析、实时统计,当有新数据类型出现时,可以自动添加数据种类,无需用户等待数据统计结果出来后再添加新数据种类再次进行分类;当用户需要数据统计输出时,只须将注册的数据结果实时输出即可;采用本发明的方法进行数据分类统计,快速、高效,提升用户体验,降低统计出错,降低数据维护成本。
【专利说明】 一种云计算数据自动分类统计的方法和系统

【技术领域】
[0001]本发明涉及云计算领域,具体地涉及一种云计算数据自动分类统计的方法和系统。

【背景技术】
[0002]当前云计算存储的应用方向为大数据存储方向,其中,数据存储的最大用处就是对大数据进行分析,辅助云计算环境下的运营决策。在当前数据大爆炸的时代,如何对云计算上拥有的海量数据进行快速和实时的提取,显得十分重要。分类技术研究是云计算环境下数据分析与管理的重要研究领域。当前数据分析都采用分类整理的方式,即首先对数据进行收集,然后人工划分数据类型对数据进行整理。上述分类整理的数据分析方式,虽然被广泛采用,但是存在如下几个问题:
[0003]1、收集后再进行整理,数据量积累过多,会导致数据计算和分析时间过长,用户体验不佳;
[0004]2、人工划分数据类型,会导致数据分类不够精确,只能在固定的范围内粗略的估计。
[0005]因此急需一种数据实时发送、实时分析、实时统计的数据分类统计的方法,当有新数据类型出现时,可以自动添加数据种类,且无需用户等待数据统计结果。


【发明内容】

[0006]鉴于上述的技术问题,本发明的目的是提供一种能对数据实时发送、实时分析、实时统计的云计算数据自动分类统计的方法,当有新数据类型出现时,可以自动添加数据种类,且无需用户等待数据统计结果。
[0007]为达到上述目的,本发明的技术方案是:
[0008]一种云计算数据自动分类统计的方法,所述方法包括以下步骤:
[0009]云存储设备接收数据,分析数据的注册信息;
[0010]云存储设备向数据统计中心发送所述数据及所述数据的注册信息;
[0011]数据统计中心接收所述数据及注册信息,并根据所述注册信息对所述数据进行分类;
[0012]数据统计中心将分类后的数据传回云存储设备进行分类存储;其中,所述注册信息至少包括数据类型、关键字和数据大小。
[0013]进一步的,所述根据所述注册信息对所述数据进行分类的步骤进一步包括根据所述注册信息对所述数据按多级分类法进行分类。
[0014]进一步的,所述多级分类法包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
[0015]进一步的,所述多级分类法进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
[0016]进一步的,所述次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类的步骤进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
[0017]进一步的,所述方法进一步包括:云存储设备将分类存储的数据进行分类输出。
[0018]本发明还提供了一种云计算数据自动分类统计的系统,所述系统包括:
[0019]云存储设备,用于接收数据,并分析数据的注册信息;还用于向数据统计中心发送所述数据及所述数据的注册信息;
[0020]数据统计中心,用于接收云存储设备所发送的所述数据及注册信息,并根据所述注册信息对所述数据进行分类;并用于将分类后的数据传回云存储设备进行分类存储;[0021 ] 其中,所述注册信息至少包括数据类型、关键字和数据大小。
[0022]进一步的,所述数据统计中心,还执行下述操作:根据所述注册信息对所述数据按多级分类法进行分类。
[0023]进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
[0024]进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
[0025]进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
[0026]进一步的,所述云存储设备将分类存储的数据进行分类输出。。
[0027]本发明方法的有益效果是:本发明的方法能对数据实时发送、实时分析、实时统计,当有新数据类型出现时,可以自动添加数据种类,无需用户等待数据统计结果出来后再添加新数据种类再次进行分类;当用户需要数据统计输出时,只须将注册的数据结果实时输出即可;采用本发明的方法进行数据分类统计,快速、高效,提升用户体验,降低统计出错,降低了数据维护的成本。

【专利附图】

【附图说明】
[0028]图1是本发明优选实施例的云计算数据自动分类统计的方法的流程示意图;
[0029]图2是本发明另一优选实施例的云计算数据自动分类统计的方法的流程示意图;
[0030]图3是本发明云计算数据自动分类统计的系统的结构框图。

【具体实施方式】
[0031]为使本发明的目的、技术方案和优点更加清楚明了,下面结合【具体实施方式】并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
[0032]图1是本发明优选实施例的云计算数据自动分类统计的方法的流程示意图。
[0033]如图1所示,本发明的云计算数据自动分类统计的方法包括下述步骤:
[0034]步骤Sll:云存储设备接收数据,分析数据的注册信息;
[0035]云存储设备能实时的接收数据,并同时对接收的数据分析其注册信息。所述注册信息包括数据类型、关键字、数据大小、应用、使用者计数等信息。云存储设备根据所接收数据的类型数,对自身进行存储分区,如果所接收的是新的类型,则在存储区中自动添加一个区域,用于存放新类型的数据。在每个类型的数据存储区中,再进行同样的次级分区。例如,所接收的数据类型为文本类型和图片类型,则云存储设备将自己的存储区域分为两个区域;当接收的数据为文本类型和图片类型以外的数据类型,如语音类型时,云存储设备中自动添加一个区域用于存储语音类型的数据,从而实现动态存储。
[0036]步骤S12:向数据统计中心发送所述数据及所述数据的注册信息;
[0037]云存储设备在分析数据的注册信息之后,向数据统计中心发送数据和及该数据的注册信息。
[0038]步骤S13:数据统计中心接收所述数据及注册信息,并根据所述注册信息对所述数据进行分类;
[0039]当数据统计中心接收到注册信息以后,记录当前接收到该数据及注册信息的时间,对接收到的数据进行数据分类,其中对数据的分类采用多级分类法。
[0040]多级分类法具体包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。首级分类完成后,进行了次级分类。具体的,当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。步骤S14:数据统计中心将分类后的数据传回云存储设备进行分类存储。
[0041]云存储设备按分类的种数开辟不同的存储区域,然后将分类的数据进行分类存储。另外,对分类存储在云设备上的数据,可以根据用户需要进行分类输出。
[0042]图2是本发明另一优选实施例的云计算数据自动分类统计的方法的流程示意图。
[0043]图2中步骤S21-S23与图1中步骤S11-S13内容一致,这里不再赘述,其不同之处在于:增加了步骤S24-S28。
[0044]步骤S24:判断数据是否为压缩类型,如果是压缩类型则进行步骤S25,对其进行三级分类,如果不是压缩类型,则进行步骤S26,对其进行二级分类。
[0045]步骤S25:由于压缩类型的数据一般都比较大,因此有必要对其更进一步进行分类,可以对其进行三级分类。按其压缩文件内的各文件类型的次级分类进行三次分类。具体的:次级分类中为压缩类型时,首先对压缩文件内容进行扫描,然后按压缩文件中包含的数据类型进行分类的步骤进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
[0046]步骤S26:对数据进行二级分类。
[0047]步骤S27:为了简化分类,可以对数据按不同的类型和等级进行编号。
[0048]例如首级分类,按数据类型的分类,将文本类型标记为1,图片类型标记为2,压缩类型标记为3,语音类型标记为4,视频类型标记为5。
[0049]次级分类,文本类型按关键字分类标记为1.1,图片类型按其大小分类标记为
2.1,图片类型按其应用分类标记为2.2,压缩类型,压缩文件中的文本类型标记为3.1,压缩文件中的图片类型标记为3.2,压缩文件中的压缩类型标记为3.3,压缩文件中的语音类型标记为3.4,压缩文件中的视频类型标记为3.5,语音类型和视频类型按其中的使用者计数统计分别标记为4.1和5.1。
[0050]三级分类,压缩文件中的文本类型按关键字分类标记为3.1.1,压缩文件中的图片类型按大小分类标记为3.2.1,压缩文件中的图片按应用分类标记为3.2.2,压缩文件中的语音类型按关键字使用者计数统计分类标记为3.4.1,压缩文件中的视频类型按使用者计数统计分类标记为3.5.1。
[0051]步骤S28:数据统计中心将数据传回云存储设备进行分类存储。
[0052]云设备按分类的种数开辟不同的存储区域,然后将分类的数据进行分类存储。另夕卜,对归类存储在云设备上的数据,可以根据用户需要进行归类输出。
[0053]对数据按照类型和等级进行分类,使得简化处理过程,操作更简便,由于每种文件类型在文件中都有标记的,所以根据获得的数据就可以知道其类型,当有新类型的文件出现时,就动态增加新的类型,这样可以根据不同类型的数据进行自动的增加或者减少种类。
[0054]图3是本发明云计算数据自动分类统计的系统的结构框图。该系统包括:
[0055]云存储设备,用于接收数据,并分析数据的注册信息;还用于向数据统计中心发送所述数据及所述数据的注册信息;还可以对存储的数据进行分类输出。
[0056]数据统计中心,用于接收云存储设备所发送的所述数据及注册信息,并根据所述注册信息对所述数据进行分类(可以为单级分类也可以为多级分类);并用于将分类后的数据传回云存储设备进行分类存储。
[0057]应当理解的是,本发明的上述【具体实施方式】仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
【权利要求】
1.一种云计算数据自动分类统计的方法,其特征在于,所述方法包括以下步骤: 云存储设备接收数据,分析数据的注册信息; 云存储设备向数据统计中心发送所述数据及所述数据的注册信息; 数据统计中心接收所述数据及注册信息,并根据所述注册信息对所述数据进行分类; 数据统计中心将分类后的数据传回云存储设备进行分类存储;其中,所述注册信息至少包括数据类型、关键字和数据大小。
2.根据权利要求1所述的云计算数据自动分类统计的方法,其特征在于,所述根据所述注册信息对所述数据进行分类的步骤进一步包括根据所述注册信息对所述数据按多级分类法进行分类。
3.根据权利要求2所述的云计算数据自动分类统计的方法,其特征在于,所述多级分类法包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
4.根据权利要求3所述的云计算数据自动分类统计的方法,其特征在于,所述多级分类法进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
5.根据权利要求4所述的云计算数据自动分类统计的方法,其特征在于,所述次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类的步骤进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
6.一种云计算数据自动分类统计的系统,其特征在于,所述系统包括: 云存储设备,用于接收数据,并分析数据的注册信息;还用于向数据统计中心发送所述数据及所述数据的注册信息; 数据统计中心,用于接收云存储设备所发送的所述数据及注册信息,并根据所述注册信息对所述数据进行分类;并用于将分类后的数据传回云存储设备进行分类存储; 其中,所述注册信息至少包括数据类型、关键字和数据大小。
7.根据权利要求6所述的系统,其特征在于,所述数据统计中心,还执行下述操作:根据所述注册信息对所述数据按多级分类法进行分类。
8.根据权利要求7所述的系统,其特征在于,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
9.根据权利要求8所述的系统,其特征在于,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
10.根据权利要求9所述的系统,其特征在于,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
【文档编号】G06F17/30GK104133907SQ201410382816
【公开日】2014年11月5日 申请日期:2014年8月6日 优先权日:2014年8月6日
【发明者】康暖 申请人:汉柏科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1