一种用于数据聚类的相似性网络融合快速方法
【专利摘要】本发明提供一种用于数据聚类的相似性网络融合快速方法,所述方法包括:相似性网络提前训练存储,相似性网络的快速融合;其中:所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络,对于这一过程中得到的网络进行存储,用来做之后对新样本所进行的相似性网络的快速融合。本发明通过构建相似性网络为不同类型的数据相似性网络,有效地将这些网络进行融合,根据融合后的网络和部分标定的样本,有效地快速地预测新目标的类别;通过矩阵划分与预处理,有效地减少了在线预测中的时间复杂度,同时精确率只受到少量的损失;可以应用于视频,以较快的速度与较高的准确率实现在线目标分类。
【专利说明】一种用于数据聚类的相似性网络融合快速方法
【技术领域】
[0001] 本发明涉及的是一种数据融合方法,具体地说,涉及的是一种用于数据聚类的相 似性网络融合快速方法。
【背景技术】
[0002] 目前,智能监控视频由于其广阔的应用范围吸引了大量的关注。在智能视频技术 中,自动目标检测与分类已经成为智能监控系统的一项主要任务。由于运动的复杂性,交错 的背景,物体位置与视角的变化等原因,监控视频目标分类成为一个具有挑战性的任务。同 时,实际监控系统常常需要进行实时在线目标分类。
[0003] 现有的目标分类方法之中,一些方法使用形状与运动信息进行分类,这类方法的 速度相对较快,但是,其鲁棒性也受到限制,因为目标在视频中的形状会随着视角而发生变 化。另一类方法考虑得标定的数据与大量未标定的数据,半监督学习法在目标分类领域有 着更大广泛的使用。
[0004]现有研究中,王波博士等在论文《Similarity network fusion for aggregating data types on a genomic scale》提出一种新的基于图的数据融合方法,相似性网络融合。 相似性网络融合方法计算并融合从不同特征数据中获得到相似性网络,充分发挥不同特征 之间的互补性,用于半监督学习。该相似性网络融合方法具有以下优点:1.基于较少量的 标定样本;2.在不同尺度、噪声的情况下都有良好的表现;3.可充分发挥不同类型特征数 据之间的互补性。
[0005] 尽管相似性网络融合方法有诸多优点,但由于其对于单一新样本的分类速度相当 缓慢,因而不适用于目标在线分类。考虑到相似性融合方法的这些限制,本发明提出一种基 于相似性网络融合的快速方法。
【发明内容】
[0006] 本发明针对现有技术中存在的上述技术问题,提供一种用于数据聚类的相似性网 络融合快速方法,在上述王波博士提出的方法上做了改进,大大提升了原方法对单一新样 本的相似性网络融合速度,能够适用于实时在线目标检测。
[0007] 本发明提供一种用于数据聚类的相似性网络融合快速方法,用于视频中目标的在 线分类。通过构建相似性网络,为不同类型数据基于相似性进行聚类,有效地将这些网络进 行融合。根据融合后的网络和部分标定的样本,可以有效地快速地预测新目标的类别。该 方法是一种相似性网络融合快速方法,通过矩阵划分与预处理,有效地减少了在线预测中 的时间复杂度,同时精确率只受到少量的损失。
[0008] 为实现上述目的,本发明所述的用于数据聚类的相似性网络融合快速方法包括两 个部分:相似性网络提前训练存储,相似性网络的快速融合。其中:
[0009] 所述相似性网络提前训练存储是指:利用样本间的距离计算样本的不同特征的相 似性网络,对于这一过程中得到的网络进行存储,用来之后对新样本所进行的相似性网络 的快速融合。
[0010] 所述相似性网络的快速融合是指:对于特征网络进行有效的划分存储,在分类时 进行快速分类。
[0011] 以下对两个部分进行详细说明:
[0012] 1、相似性网络提前训练存储
[0013] 本发明中,所述相似性网络提前训练存储,使用相似性网络融合方法中的训练算 法,对于训练样本集进行训练,并对于训练中间计算得到的矩阵进行存储。上述王波博士提 出的方法提到:相似性网络被表示成为一张图G = (V,E),其中节点V表示样本,边E的权 重则是两个样本的相似程度。因而边的权重被表示成为一个nXn的矩阵。其中的W(i,j) 表示两个样本Xi与 Xj之间的相似度,P (Xi,Xj)表示样本Xi与Xj之的欧氏距离,y是一个 经验参数,通常取值[0. 3,0.8]。计算公式如下:
【权利要求】
1. 一种用于数据聚类的相似性网络融合快速方法,其特征在于包括:相似性网络提前 训练存储,相似性网络的快速融合;其中: 所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性 网络,对于这一过程中得到的网络进行存储,用来做之后对新样本所进行的相似性网络的 快速融合。
2. 根据权利要求1所述的一种用于数据聚类的相似性网络融合快速方法,其特征在 于:所述相似性网络提前训练存储,存储了相似性网络融合计算过程中的中间网络,这些网 络用于最后进行快速相似性网络融合;同时,使用存储下来的中间网络,进行相似性网络融 合模型快速计算。
3. 根据权利要求1或2所述的一种用于数据聚类的相似性网络融合快速方法,其特 征在于:所述相似性网络的快速融合是指:对于不同特征的相似性网络进行有效的划分存 储,然后进行迭代融合计算,实现快速分类。
4. 根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法,其特征在 于:所述相似性网络的快速融合,是对添加新样本到原训练样本集中进行相似性网络的快 速融合,对于一个新样本,同样需要计算矩阵W,S,P,其中有很大一部分与训练阶段计算结 果十分相似,将该部分计算用训练阶段存储的矩阵信息进行替换。
5. 根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法,其特征在 于:所述对于不同特征的相似性网络进行有效的划分存储,是指:利用相似性网络提前训 练存储阶段存储的矩阵,矩阵划分方法为: 对一个(n+l)*(n+l)的矩阵划分出左上角n*n的矩阵作为Parti,划分出右侧(n+l)*l 的矩阵作为Part II,划分出左下方l*n的矩阵作为Partlll,其中Part I的部分都可以用 训练阶段的矩阵替换,在线分类阶段实际需要计算的是Part II和Part III,测试阶段的S 矩阵用下式计算,其中1彡i彡n+1 ; j = n+1,Ni表示Xi的K个近邻,K的取值依据是具体 数据集规樽:
上述矩阵划分方法同时适用于S,P矩阵,矩阵P的第一个初始矩阵也类似计算;在用于 矩阵初始化计算完成之后,进行迭代融合计算。
6. 根据权利要求5所述的一种用于数据聚类的相似性网络融合快速方法,其特征在 于:所述的迭代融合计算,具体为: 利用之前相似性网络提前训练存储阶段存储的矩阵,进行该阶段的相似性网络的融 合,将S,P矩阵都分为四个部分,划分方法为: 对一个(n+1) * (n+1)的矩阵划分出左上角n*n的矩阵作为第1部分,划分出右上方n*l 的矩阵作为第2部分,划分出左下方l*n的矩阵作为第3部分,划分出右下方1*1的矩阵作 为第4部分; 当已知第t -1次迭代的情况时,根据公式
先计算
其中S矩阵本权利要求中所述划分方法得到Sl,S2, S3, S4,定义
为矩阵P,那 么P1,P2, P3, P4即为该划分方法得到的矩阵块;等式的右边是一个临时矩阵,记为Temp,是 Tempi, Temp2, Temp3, Temp4即为该划分方法得到的Temp的矩阵块; 事实上,SI XPl近似于训练过程中的SXP,S、P分别为S矩阵与P矩阵,因而有训练过 程中中间存储得到的SXP进行替换Tempi,按下面的公式计算Temp2, Temp4,并用Temp2的 转置近似代替Temp3 :
最后,计算公式
中的X(SW)T部分,公式前半部 分
的结果存在临时矩阵Temp中,Pw按权利要求中所述划分方法得到
是第V类特征下一次迭代过程中标 准化的相似性矩阵,可得
同理计算出P3(V),P3(V).只是数学计算的中间步骤,因而得到整个P (v),又对称地,得到对 于任意i类特征在下一次迭代过程中的标准化的相似性矩阵P(i),至此,根据当前的迭代情 况,完全计算得到下一次的迭代情况;又已知初始情况,由数学归纳法易得,可以计算得到 迭代完成的情况;根据迭代得到最后的P矩阵即最后的标准化的相似性矩阵,从而实现了 相似性网络融合的快速方法; 结合部分标定的数据,采用半监督学习标签传递的方法,即可以对新样本进行聚类或 分类。
【文档编号】G06K9/66GK104392247SQ201410625530
【公开日】2015年3月4日 申请日期:2014年11月7日 优先权日:2014年11月7日
【发明者】张重阳, 卢贤龙 申请人:上海交通大学