1.本发明涉及图数据库领域,尤其涉及一种图数据库中稠密子图挖掘技术框架的应用。
背景技术:2.随着计算机硬件的发展以及数据总量的增加,数据挖掘算法在许多领域都得到了应用,而在这些庞大且复杂的数据如网页超链接拓扑图中,有相当一部分可以以图的形式自然的呈现出来,这些图往往都展现出一种类似社群的基础结构,社群是一种稠密的,由连接紧密的节点构成的子图,d-core作为有向图上社群的一种表现形式,在如在社群搜索,角色识别,垃圾邮件检测等领域中得到了广泛的应用。
3.d-core是最近的网络研究中提出的一种稠密子图模型,尽管有许多现有的稠密子图模型如k-core,k-truss和k-clique等,代表着稠密的子图,找到它,也就找到了联系紧密的社群,在子图中,每条边都至少在k个三角形中,而即为所有中最大的那一个子图,在子图中,每个顶点至少有k个邻居,而即为所有中最大的那一个子图。
4.这些模型都只适用于无向图,这些无向图中模型忽略了点与点之间的不对称关系以及边的有向性,如在网页超链接拓扑图中,引用了许多的网页的网页,与被许多其他网页引用的网页显然时不同的,前者类似门户网站,而后者是权威性较高的网站,因此,d-core模型在网页超链接拓扑图的分析中是有必要的, d-core模型同时考虑的每个顶点的传入边以及传出边,并分别赋予他们一个限制,在d-core,也就是(k,l)-core中,子图内每个点都有至少k个传入邻居以及l个传出邻居,并且这个子图是极大的,也就是说它不被包含在另一个拥有同样k,l值的d-core中,这样的网页集合中,网页kmax值代表了此网页的权威度,而lmax值代表了此网页的参与度。
5.因此,有必要提供一种图数据库中稠密子图挖掘技术框架的应用解决上述技术问题。
技术实现要素:6.本发明提供一种图数据库中稠密子图挖掘技术框架的应用,解决了现有技术中k-core,k-truss和k-clique等模型都只适用于无向图,这些无向图中模型忽略了点与点之间的不对称关系以及边的有向性的问题。
7.为解决上述技术问题,本发明提供的一种图数据库中稠密子图挖掘技术框架的应用,其特征在于,包括以下步骤:s1:在网页超链接拓扑图分析中,在现有d-core分解算法的基础上,利用d-core的分层结构性质逐树,逐层构建一个d-forest,又分为top-down方法和bottom方法;
8.s2:对于一个(k1,l1)-core,它一定被包含在那些k值小于等k1,且l 值小于等于l1的(k,l)-core中,利用这一性质,我们对于每个k值,构造一棵k树,树中的每个节点都是一个网页的集合,其中包括一个或者多个网页,且拥有一个l值,集合中每个网页都至少引
用了l个其他网页,集合中的网页是连通的,并且都属于一个(k,l)-core,且不属于(k,l+1)-core,对与相互包含的关系,树中利用父子结构来表示;
9.s3:根据这样的定义,每个子树都是一个连接的(k,l)-core,因为子树中的网页都至少有根节点l值个传出邻居,并且他们互相连接,而所有k树所组成的森林被称作d-forest;
10.s4:构造d-forest的方法具体包括top-down和bottom-up;
11.s5:在计算了所有网页所在的所有d-core后,可以简化此信息得到如下数据:如节点a在(0,1)-core,(1,0)-core,(1,1)-core,(1,2)-core, (2,1)-core中,可以根据d-core的分层性质将其简化为(1,2)-core,(2, 1)-core,本方法讲这些点称为skyline-points,将skyline-points放入xy平面,并连接起来可以得skyline的图像;
12.s6:把这个图像的面积定义为skyline-area;skyline-area是指此图像与x, y轴所围成的面积,可以看到,对于skyline-area大的网页,它一定被包含在更多的core中,因此,本方法提出了一个基于skyline-area的查询方法,利用此查询方法,所返回的子图中,每个节点的skyline-area都大于给定的参数;
13.s7:还包括计算skyline-area的方法,对于每一个skyline-point所对应的坐标(ki,li)首先计算ki乘li,由于skyline-points的性质,k值大点l值一定小,否则他就被包含在另一个skyline-point下了,所以重叠的面积自然就是 ki乘li-1,依据此方法,遍历完顶点的skyline-points就可以计算出其skyline-area。
14.优选的,所述步骤s4中网页超链接拓扑图上d-forest的top-down构造的具体步骤如下:s411:利用d-core分解计算出kmax;s412:对于从0到kmax 的k;s413:使用d-core分解计算在k树中,每个网页的lmax;s414:根据网页的lmax把他们分为不同的集合vl;s415:对于从0到lmax的l;s416:在cuf结构中,利用vl里的网页构造k树的第l层;s417:创建一个空节点作为此k树的根节点,并添加到d-forest中。
15.优选的,所述步骤s4中网页拓扑图分析中的bottom-up构造算法如下: s421:利用d-core分解计算出kmax;s422:对于从kmax到0的k;s423:使用d-core分解计算在k树中,每个网页的lmax;s424:根据网页的lmax 把他们分为不同的集合vl;s425:对于从lmax到0的l;s426:在cuf结构中,利用vl里的网页构造k树的第l层;s427:创建一个空节点作为此k树的根节点,并添加到d-forest中。
16.优选的,所述图数据库中稠密子图挖掘技术框架的应用在实际使用时用于处理器中,所述处理器包括外框,所述外框的内部设置有算力板,所述外框内壁的顶部和底部且位于算力板的一侧分别设置有第一散热扇和第二散热扇,所述第一散热扇和第二散热扇相对的一侧之间固定连接有电机框,所述电机框的内部设置有电机,所述电机输出轴的一端固定连接有蜗杆,所述蜗杆的表面啮合有蜗轮,所述蜗轮的顶部和底部均固定连接有转动杆,所述转动杆的一端固定连接有散热组件。
17.优选的,所述散热组件包括散热框,所述散热框的顶部固定连接于所述外框内壁的顶部,所述散热框内壁的顶部转动连接有螺纹杆,所述螺纹杆的一端与所述转动杆的顶端固定连接,所述螺纹杆的表面螺纹连接有螺纹块,所述螺纹块的一侧转动连接有挡板,所述挡板的一侧转动连接有滑块,所述滑块的底部滑动连接有滑槽,所述滑槽的一侧固定连接于所述散热框内壁的一侧。
18.优选的,所述外框内壁的顶部固定连接有控制箱,所述控制箱的内部分别设置有处理器、温控模块和输入模块,所述外框内壁的顶部固定连接有温度检测模块。
19.优选的,所述处理器的输出端分别与所述第一散热扇和第二散热扇的输入端连接,所述处理器的输出端与所述电机的输入端连接,所述温控模块、温度检测模块和输入模块的输出端均与所述处理器的输入端连接。
20.优选的,所述外框的右侧设置有两个防护网。
21.优选的,所述散热组件设置有两组,其中每一组的散热组件中挡板的数量均为十四个。
22.优选的,所述外框的右侧开设有与所述防护网相适配的通风槽。
23.与相关技术相比较,本发明提供的图数据库中稠密子图挖掘技术框架的应用具有如下有益效果:
24.本发明提供一种图数据库中稠密子图挖掘技术框架的应用,充分挖掘了有向图上顶点的拓扑信息以及有向图特有的性质,结合现有的图计算方法,将查询强相关网页集合的时间至少降低一个数量级,同时,本方法提出的指标kmax 以及skyline-area被证实与网页的参与度呈较强的正相关关系。
附图说明
25.图1为本发明提供的图数据库中稠密子图挖掘技术框架的服务器结构示意图;
26.图2为图1所示的散热组件的结构示意图;
27.图3为图1所示服务器散热状态时的示意图;
28.图4为图1所示服务器的系统原理框图。
29.图中标号:1、外框,2、算力板,3、第一散热扇,4、第二散热扇,5、电机框,6、电机,7、蜗杆,8、蜗轮,9、转动杆,10、散热组件,101、散热框,102、螺纹杆,103、螺纹块,104、挡板,105、滑块,106、滑槽,11、防护网,12、控制箱,13、处理器,14、温控模块,15、输入模块,16、温度检测模块。
具体实施方式
30.下面结合附图和实施方式对本发明作进一步说明。
31.一种图数据库中稠密子图挖掘技术框架的应用,其特征在于,包括以下步骤:s1:在网页超链接拓扑图分析中,在现有d-core分解算法的基础上,利用d-core的分层结构性质逐树,逐层构建一个d-forest,又分为top-down方法和bottom方法;
32.s2:对于一个(k1,l1)-core,它一定被包含在那些k值小于等k1,且l 值小于等于l1的(k,l)-core中,利用这一性质,我们对于每个k值,构造一棵k树,树中的每个节点都是一个网页的集合,其中包括一个或者多个网页,且拥有一个l值,集合中每个网页都至少引用了l个其他网页,集合中的网页是连通的,并且都属于一个(k,l)-core,且不属于(k,l+1)-core,对与相互包含的关系,树中利用父子结构来表示;
33.s3:根据这样的定义,每个子树都是一个连接的(k,l)-core,因为子树中的网页都至少有根节点l值个传出邻居,并且他们互相连接,而所有k树所组成的森林被称作d-forest;
34.s4:构造d-forest的方法具体包括top-down和bottom-up;
35.s5:在计算了所有网页所在的所有d-core后,可以简化此信息得到如下数据:如节点a在(0,1)-core,(1,0)-core,(1,1)-core,(1,2)-core, (2,1)-core中,可以根据d-core的分层性质将其简化为(1,2)-core,(2, 1)-core,本方法讲这些点称为skyline-points,将skyline-points放入xy平面,并连接起来可以得skyline的图像;
36.s6:把这个图像的面积定义为skyline-area;skyline-area是指此图像与x, y轴所围成的面积,可以看到,对于skyline-area大的网页,它一定被包含在更多的core中,因此,本方法提出了一个基于skyline-area的查询方法,利用此查询方法,所返回的子图中,每个节点的skyline-area都大于给定的参数;
37.s7:还包括计算skyline-area的方法,对于每一个skyline-point所对应的坐标(ki,li)首先计算ki乘li,由于skyline-points的性质,k值大点l值一定小,否则他就被包含在另一个skyline-point下了,所以重叠的面积自然就是 ki乘li-1,依据此方法,遍历完顶点的skyline-points就可以计算出其skyline-area。
38.所述步骤s4中网页超链接拓扑图上d-forest的top-down构造的具体步骤如下:s411:利用d-core分解计算出kmax;s412:对于从0到kmax的k; s413:使用d-core分解计算在k树中,每个网页的lmax;s414:根据网页的 lmax把他们分为不同的集合vl;s415:对于从0到lmax的l;s416:在cuf 结构中,利用vl里的网页构造k树的第l层;s417:创建一个空节点作为此k 树的根节点,并添加到d-forest中。
39.所述步骤s4中网页拓扑图分析中的bottom-up构造算法如下:s421:利用d-core分解计算出kmax;s422:对于从kmax到0的k;s423:使用d-core 分解计算在k树中,每个网页的lmax;s424:根据网页的lmax把他们分为不同的集合vl;s425:对于从lmax到0的l;s426:在cuf结构中,利用vl 里的网页构造k树的第l层;s427:创建一个空节点作为此k树的根节点,并添加到d-forest中。
40.第二实施例:
41.请结合参阅图1、图2、图3和图4,其中,图1为本发明提供的图数据库中稠密子图挖掘技术框架的服务器结构示意图;图2为图1所示的散热组件的结构示意图;图3为图1所示服务器散热状态时的示意图;图4为图1所示服务器的系统原理框图,所述图数据库中稠密子图挖掘技术框架的应用在实际使用时用于服务器中,所述服务器包括外框1,所述外框1的内部设置有算力板2,所述外框1内壁的顶部和底部且位于算力板2的一侧分别设置有第一散热扇3和第二散热扇4,所述第一散热扇3和第二散热扇4相对的一侧之间固定连接有电机框5,所述电机框5的内部设置有电机6,所述电机6输出轴的一端固定连接有蜗杆7,所述蜗杆7的表面啮合有蜗轮8,所述蜗轮8的顶部和底部均固定连接有转动杆9,所述转动杆9的一端固定连接有散热组件10。
42.所述散热组件10包括散热框101,所述散热框101的顶部固定连接于所述外框1内壁的顶部,所述散热框101内壁的顶部转动连接有螺纹杆102,所述螺纹杆102的一端与所述转动杆9的顶端固定连接,所述螺纹杆102的表面螺纹连接有螺纹块103,所述螺纹块103的一侧转动连接有挡板104,所述挡板104的一侧转动连接有滑块105,所述滑块105的底部滑动连接有滑槽106,所述滑槽106的一侧固定连接于所述散热框101内壁的一侧。
43.所述外框1内壁的顶部固定连接有控制箱12,所述控制箱12的内部分别设置有处
理器13、温控模块14和输入模块15,所述外框1内壁的顶部固定连接有温度检测模块16。
44.所述处理器13的输出端分别与所述第一散热扇3和第二散热扇4的输入端连接,所述处理器13的输出端与所述电机6的输入端连接,所述温控模块14、温度检测模块16和输入模块15的输出端均与所述处理器13的输入端连接。
45.所述外框1的右侧设置有两个防护网11。
46.所述散热组件10设置有两组,其中每一组的散热组件10中挡板104的数量均为十四个。
47.所述外框1的右侧开设有与所述防护网11相适配的通风槽。
48.本发明提供的图数据库中稠密子图挖掘技术框架的应用的工作原理如下:
49.当服务器关闭时,挡板处于关闭状态,防止灰尘进入服务器外框1的内部,当服务器工作时,电机6启动带动蜗杆7转动,带动蜗轮8转动,带动转动杆 9转动,带动螺纹杆102转动,带动螺纹块103移动,从而带动挡板104移动,实现挡板104的打开,实现对服务器外框1内部进行散热,其中温度检测模块 16始终对外框1的内部温度进行检测,如果发现温度偏高,温度检测模块16 将型号传输给温控模块14,温控模块14通过处理器13控制第一散热扇3启动,开始散热,当温度过高时,温度检测模块16将型号传输给温控模块14,温控模块14通过处理器13控制第二散热扇4同步启动,开始散热,实现了不同温度下不同程度的散热。
50.与相关技术相比较,本发明提供的图数据库中稠密子图挖掘技术框架的应用具有如下有益效果:相较于传统的散热模式,本技术文件采用根据温度不同的散热模式,并且可以在不工作时防止灰尘的进入。
51.以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。