一种大数据分类系统的制作方法
【专利摘要】本发明公开了一种大数据分类系统,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并存入云数据库中,实现树状型分类结构分类存储,大大减少了需要处理的数据,在短时间内迅速、准确的实现数据的分类,从而有效提高了数据分类流程的执行效率,降低了对相关数据管理的复杂度,也减轻了系统的运算负荷。
【专利说明】 一种大数据分类系统
【技术领域】
[0001]本发明涉及一种大数据分类系统。
【背景技术】
[0002]随着计算机技术的飞速发展,各行各领域数据的呈几何级快速增长。这些数据来自方面,从搜集天气情况的感测器、数码图片、在线的视频资料,到网络购物的交易记录、手机的全球定位系统信号等应有尽有。伴随数据规模的急剧膨胀,各行业累积的数据量越来越巨大,数据类型也越来越多、数据结构越来越复杂,已经超越了传统数据分类系统、处理模式的能力范围,传统的串行数据库系统已经难以适应这种飞速增长的应用需求,在生产实践中表现出明显的能力不足,无法满足大数据时代的数据分类需求。
【发明内容】
[0003]本发明所要解决的技术问题是提供一种大数据分类系统,用以在短时间内迅速、准确的实现数据的分类,提高了数据分类流程的执行效率。
[0004]本发明解决上述技术问题的技术方案如下:一种大数据分类系统,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出地数据存储在云数据库中,从而实现树状型结构分类系统。
[0005]进一步地,对数据进行类别分类以后,根据划分结果,调整各类别的权重取值。
[0006]优选的,分类序列相同的相关数据进行合并后,包括:
[0007]分别计算任意两类数据编号序列的相似度;
[0008]将获得的任意两类数据编号序列的相似度,分别与设定阈值进行比较,将编号的相似度达到设定阈值的两类相关数据进行合并。
[0009]本发明的有益效果是:在短时间内迅速、准确的实现数据的分类,从而有效提高了数据分类流程的执行效率,降低了对相关数据管理的复杂度,也减轻了系统的运算负荷。
【专利附图】
【附图说明】
[0010]图1为本发明整体结构示意图;
【具体实施方式】
[0011]以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0012]如图1所示,一种大数据分类系统,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出地数据存储在云数据库中,从而实现树状型结构分类系统。
[0013]进一步地,对数据进行类别分类以后,根据划分结果,调整各类别的权重取值。
[0014]优选的,分类序列相同的相关数据进行合并后,包括:
[0015]1、分别计算任意两类数据编号序列的相似度;
[0016]2、将获得的任意两类数据编号序列的相似度,分别与设定阈值进行比较,将编号的相似度达到设定阈值的两类相关数据进行合并。
[0017]与现有技术相比,本发明的优点在于,在短时间内迅速、准确的实现数据的分类,从而有效提高了数据分类流程的执行效率,降低了对相关数据管理的复杂度,也减轻了系统的运算负荷。
[0018]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种大数据分类系统,其特征在于,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出的数据存入云数据库,从而实现树状型结构分类系统。
2.根据权利要求1所述的大数据分类系统,其特征在于,对数据进行类别分类以后,根据划分结果,调整各类别的权重取值。
3.根据权利要求1所述的大数据分类系统,其特征在于,分类序列相同的相关数据进行合并后,包括: 分别计算任意两类数据编号序列的相似度; 将获得的任意两类数据编号序列的相似度,分别与设定阈值进行比较,将编号的相似度达到设定阈值的两类相关数据进行合并。
【文档编号】G06F17/30GK104462585SQ201410843978
【公开日】2015年3月25日 申请日期:2014年12月29日 优先权日:2014年12月29日
【发明者】赵迪, 刘焰龙 申请人:芜湖乐锐思信息咨询有限公司