基于关联规则的并行数据挖掘机群系统的制作方法

文档序号:7933741阅读:291来源:国知局
专利名称:基于关联规则的并行数据挖掘机群系统的制作方法
技术领域
本实用新型涉及信息数据处理系统,具体为基于关联规则的并行数据挖掘 机群系统。
背景技术
近年来,随着科学技术的发展,各个领域的数据量迅猛增长,例如超级市
场上的POS系统每天都要存储上万笔的顾客购买数据,各种同步卫星每天传回 地球的遥感图像数据已经达到50TB。面对这些以指数级速度增长的数据,人们 感到困惑和迷茫,要在数据海洋中寻求有价值的信息如同大海捞针。如何才能 不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢 要 想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和 战略发展服务。否则,大量的数据只能成为包袱,甚至成为垃圾。因此,面对 "人们被数据信息淹没,却饥饿于知识"的两难境遇,急需一种自动的数据驱 动技术来提取有用的知识。
各项技术的进步产生了海量有价值的科学数据,其产生的速度之快己远远 超出人工分析这些数据的能力。例如,运行于高性能计算机上的计算模拟程序 数小时内可以产生数以千兆字节的数据,而人工分析这些数据要花费几周甚至 更长的时间才能从中提取有用的信息。数据挖掘技术在自动分析这些模拟程序 所产生的数据方面将大有作为。但是要处理的数据规模太大,使得数据挖掘的 串行算法与普通的处理机对数据的处理能力显得力不从心。而并行计算利用多个处理机并行地处理数据,是进行大规模计算的有效方法。于是在很大程度上 与高性能并行计算结合的并行数据挖掘技术成为解决串行算法处理能力受限问 题的有效手段,是今后数据挖掘技术发展的一个趋势。
发明内容
本实用新型的目的在于针对以上技术问题,提供一种利用现有设备,高效 发掘信息数据的基于关联规则的并行数据挖掘机群系统。
本实用新型的具体技术方案如下-
基于关联规则的并行数据挖掘机群系统,由计算结点机l、交换机2、数字 储存通道3、共享存储器4组成,其特征在于计算结点机1通过交换机2与数 字储存通道3、共享存储器4相连接。
计算结点机1之间并联。
计算结点机1之间通过PVM协议或MPI协议通讯。
机群系统是利用高速通用网络将一组高性能工作站或高档PC机,按某种结 构连接起来,在并行程序设计以及可视化人机交互集成开发环境支持下,统一 调度,协调处理,实现高效并行处理的系统。从结构和结点间的通信方式来看, 它属于分布存储系统,主要利用消息传递方式实现各主机之间的通信,由建立 在一般操作系统之上的并行编程环境完成系统的资源管理及相互协作,同时也 屏蔽工作站及网络的异构性。
本实用新型的优势在于移植性好、功能强大、效率高;相对于巨型机来 说成本极其低廉。

图l为实用新型的结构示意图。
其中,1——计算结点机、2——交换机、3——数字储存通道、4——共享存储 器。
具体实施方式
下面结合具体实施方式
对本实用新型作进一步说明本实用新型。 基于关联规则的并行数据挖掘机群系统,由计算结点机l、交换机2、数字 储存通道3、共享存储器4组成,计算结点机1通过交换机2与数字储存通道3、 共享存储器4相连接。10台单核32位处理器作为计算结点机1,千兆铜缆连接 以太网,每个结点计算结点机1安装的操作系统为Redhat企业版Linux9.0。 机群的搭建过程中,安装和配置Linux系统,配置中要注意三个方面(l)把SSH 选为信赖的服务(2)IP地址的配置(3)将所有结点名字及其IP地址填入每台机器 的/etc/hosts文件。
修改7. bash_profile文件,设置MPICH的安装目录;配置用户使用SSH公 钥认证;这一步对MPI程序是必须的,它让用户可以不需要密码登录到其他结 点;安装MPICH。
计算结点机l之间并联。
计算结点机1之间通过MPI协议通讯。
权利要求1、基于关联规则的并行数据挖掘机群系统,由计算结点机(1)、交换机(2)、数字储存通道(3)、共享存储器(4)组成,其特征在于计算结点机(1)通过交换机(2)与数字储存通道(3)、共享存储器(4)相连接。
2、 根据权利要求1所述的基于关联规则的并行数据挖掘机群系统,其特征在 于所述的计算结点机(1)之间并联。
3、 根据权利要求1所述的基于关联规则的并行数据挖掘机群系统,其特征在 于所述的计算结点机(1)之间通过PVM协议或MPI协议进行通讯。
专利摘要本实用新型涉及信息数据处理系统,具体为基于关联规则的并行数据挖掘机群系统。基于关联规则的并行数据挖掘机群系统,由计算结点机1、交换机2、数字储存通道3、共享存储器4组成,其特征在于计算结点机1通过交换机2与数字储存通道3、共享存储器4相连接。本实用新型利用现有设备,高效发掘信息数据。
文档编号H04L29/08GK201274503SQ20082014049
公开日2009年7月15日 申请日期2008年9月25日 优先权日2008年9月25日
发明者爽 吕, 安俊秀, 鹏 王, 王春圃, 王永丽, 陈高云 申请人:陈高云
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1