一种大数据分类系统的制作方法

文档序号：6640704阅读：296来源：国知局

一种大数据分类系统的制作方法
【专利摘要】本发明公开了一种大数据分类系统，由数据源，数据分类单元，数据编号单元，云数据库依次连接构成，所述数据编号单元还包括：数据位置编号，数据时间编号，数据容量编号；所述数据分类单元有效地将所属数据源进行类别的分类，在不同的类别数据下，采用所述数据编号单元，对不同类别的相同类型数据进行数据位置，数据时间，数据容量的类别进行分类，并存入云数据库中，实现树状型分类结构分类存储，大大减少了需要处理的数据，在短时间内迅速、准确的实现数据的分类，从而有效提高了数据分类流程的执行效率，降低了对相关数据管理的复杂度，也减轻了系统的运算负荷。
【专利说明】一种大数据分类系统

【技术领域】
[0001]本发明涉及一种大数据分类系统。

【背景技术】
[0002]随着计算机技术的飞速发展，各行各领域数据的呈几何级快速增长。这些数据来自方面，从搜集天气情况的感测器、数码图片、在线的视频资料，到网络购物的交易记录、手机的全球定位系统信号等应有尽有。伴随数据规模的急剧膨胀，各行业累积的数据量越来越巨大，数据类型也越来越多、数据结构越来越复杂，已经超越了传统数据分类系统、处理模式的能力范围，传统的串行数据库系统已经难以适应这种飞速增长的应用需求，在生产实践中表现出明显的能力不足，无法满足大数据时代的数据分类需求。

【发明内容】

[0003]本发明所要解决的技术问题是提供一种大数据分类系统，用以在短时间内迅速、准确的实现数据的分类，提高了数据分类流程的执行效率。
[0004]本发明解决上述技术问题的技术方案如下:一种大数据分类系统，由数据源，数据分类单元，数据编号单元，云数据库依次连接构成，所述数据编号单元还包括:数据位置编号，数据时间编号，数据容量编号；所述数据分类单元有效地将所属数据源进行类别的分类，在不同的类别数据下，采用所述数据编号单元，对不同类别的相同类型数据进行数据位置，数据时间，数据容量的类别进行分类，并将分类出地数据存储在云数据库中，从而实现树状型结构分类系统。
[0005]进一步地，对数据进行类别分类以后，根据划分结果，调整各类别的权重取值。
[0006]优选的，分类序列相同的相关数据进行合并后，包括:
[0007]分别计算任意两类数据编号序列的相似度；
[0008]将获得的任意两类数据编号序列的相似度，分别与设定阈值进行比较，将编号的相似度达到设定阈值的两类相关数据进行合并。
[0009]本发明的有益效果是:在短时间内迅速、准确的实现数据的分类，从而有效提高了数据分类流程的执行效率，降低了对相关数据管理的复杂度，也减轻了系统的运算负荷。

【专利附图】

【附图说明】
[0010]图1为本发明整体结构示意图；

【具体实施方式】
[0011]以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。
[0012]如图1所示，一种大数据分类系统，由数据源，数据分类单元，数据编号单元，云数据库依次连接构成，所述数据编号单元还包括:数据位置编号，数据时间编号，数据容量编号；所述数据分类单元有效地将所属数据源进行类别的分类，在不同的类别数据下，采用所述数据编号单元，对不同类别的相同类型数据进行数据位置，数据时间，数据容量的类别进行分类，并将分类出地数据存储在云数据库中，从而实现树状型结构分类系统。
[0013]进一步地，对数据进行类别分类以后，根据划分结果，调整各类别的权重取值。
[0014]优选的，分类序列相同的相关数据进行合并后，包括:
[0015]1、分别计算任意两类数据编号序列的相似度；
[0016]2、将获得的任意两类数据编号序列的相似度，分别与设定阈值进行比较，将编号的相似度达到设定阈值的两类相关数据进行合并。
[0017]与现有技术相比，本发明的优点在于，在短时间内迅速、准确的实现数据的分类，从而有效提高了数据分类流程的执行效率，降低了对相关数据管理的复杂度，也减轻了系统的运算负荷。
[0018]以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【权利要求】
1.一种大数据分类系统，其特征在于，由数据源，数据分类单元，数据编号单元，云数据库依次连接构成，所述数据编号单元还包括:数据位置编号，数据时间编号，数据容量编号；所述数据分类单元有效地将所属数据源进行类别的分类，在不同的类别数据下，采用所述数据编号单元，对不同类别的相同类型数据进行数据位置，数据时间，数据容量的类别进行分类，并将分类出的数据存入云数据库，从而实现树状型结构分类系统。
2.根据权利要求1所述的大数据分类系统，其特征在于，对数据进行类别分类以后，根据划分结果，调整各类别的权重取值。
3.根据权利要求1所述的大数据分类系统，其特征在于，分类序列相同的相关数据进行合并后，包括: 分别计算任意两类数据编号序列的相似度；将获得的任意两类数据编号序列的相似度，分别与设定阈值进行比较，将编号的相似度达到设定阈值的两类相关数据进行合并。
【文档编号】G06F17/30GK104462585SQ201410843978
【公开日】2015年3月25日申请日期:2014年12月29日优先权日:2014年12月29日
【发明者】赵迪, 刘焰龙申请人:芜湖乐锐思信息咨询有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵迪;刘焰龙;
技术所有人：芜湖乐锐思信息咨询有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。