一种用于数据聚类的相似性网络融合快速方法

文档序号：6633482阅读：2704来源：国知局

一种用于数据聚类的相似性网络融合快速方法
【专利摘要】本发明提供一种用于数据聚类的相似性网络融合快速方法，所述方法包括：相似性网络提前训练存储，相似性网络的快速融合；其中：所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络，对于这一过程中得到的网络进行存储，用来做之后对新样本所进行的相似性网络的快速融合。本发明通过构建相似性网络为不同类型的数据相似性网络，有效地将这些网络进行融合，根据融合后的网络和部分标定的样本，有效地快速地预测新目标的类别；通过矩阵划分与预处理，有效地减少了在线预测中的时间复杂度，同时精确率只受到少量的损失；可以应用于视频，以较快的速度与较高的准确率实现在线目标分类。
【专利说明】一种用于数据聚类的相似性网络融合快速方法

【技术领域】
[0001] 本发明涉及的是一种数据融合方法，具体地说，涉及的是一种用于数据聚类的相似性网络融合快速方法。

【背景技术】
[0002] 目前，智能监控视频由于其广阔的应用范围吸引了大量的关注。在智能视频技术中，自动目标检测与分类已经成为智能监控系统的一项主要任务。由于运动的复杂性，交错的背景，物体位置与视角的变化等原因，监控视频目标分类成为一个具有挑战性的任务。同时，实际监控系统常常需要进行实时在线目标分类。
[0003] 现有的目标分类方法之中，一些方法使用形状与运动信息进行分类，这类方法的速度相对较快，但是，其鲁棒性也受到限制，因为目标在视频中的形状会随着视角而发生变化。另一类方法考虑得标定的数据与大量未标定的数据，半监督学习法在目标分类领域有着更大广泛的使用。
[0004]现有研究中，王波博士等在论文《Similarity network fusion for aggregating data types on a genomic scale》提出一种新的基于图的数据融合方法，相似性网络融合。相似性网络融合方法计算并融合从不同特征数据中获得到相似性网络，充分发挥不同特征之间的互补性，用于半监督学习。该相似性网络融合方法具有以下优点：1.基于较少量的标定样本；2.在不同尺度、噪声的情况下都有良好的表现；3.可充分发挥不同类型特征数据之间的互补性。
[0005] 尽管相似性网络融合方法有诸多优点，但由于其对于单一新样本的分类速度相当缓慢，因而不适用于目标在线分类。考虑到相似性融合方法的这些限制，本发明提出一种基于相似性网络融合的快速方法。

【发明内容】

[0006] 本发明针对现有技术中存在的上述技术问题，提供一种用于数据聚类的相似性网络融合快速方法，在上述王波博士提出的方法上做了改进，大大提升了原方法对单一新样本的相似性网络融合速度，能够适用于实时在线目标检测。
[0007] 本发明提供一种用于数据聚类的相似性网络融合快速方法，用于视频中目标的在线分类。通过构建相似性网络，为不同类型数据基于相似性进行聚类，有效地将这些网络进行融合。根据融合后的网络和部分标定的样本，可以有效地快速地预测新目标的类别。该方法是一种相似性网络融合快速方法，通过矩阵划分与预处理，有效地减少了在线预测中的时间复杂度，同时精确率只受到少量的损失。
[0008] 为实现上述目的，本发明所述的用于数据聚类的相似性网络融合快速方法包括两个部分：相似性网络提前训练存储，相似性网络的快速融合。其中：
[0009] 所述相似性网络提前训练存储是指：利用样本间的距离计算样本的不同特征的相似性网络，对于这一过程中得到的网络进行存储，用来之后对新样本所进行的相似性网络的快速融合。
[0010] 所述相似性网络的快速融合是指：对于特征网络进行有效的划分存储，在分类时进行快速分类。
[0011] 以下对两个部分进行详细说明：
[0012] 1、相似性网络提前训练存储
[0013] 本发明中，所述相似性网络提前训练存储，使用相似性网络融合方法中的训练算法，对于训练样本集进行训练，并对于训练中间计算得到的矩阵进行存储。上述王波博士提出的方法提到：相似性网络被表示成为一张图G = (V，E)，其中节点V表示样本，边E的权重则是两个样本的相似程度。因而边的权重被表示成为一个nXn的矩阵。其中的W(i，j) 表示两个样本Xi与 Xj之间的相似度，P (Xi，Xj)表示样本Xi与Xj之的欧氏距离，y是一个经验参数，通常取值[0. 3,0.8]。计算公式如下：

【权利要求】
1. 一种用于数据聚类的相似性网络融合快速方法，其特征在于包括：相似性网络提前训练存储，相似性网络的快速融合；其中：所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络，对于这一过程中得到的网络进行存储，用来做之后对新样本所进行的相似性网络的快速融合。
2. 根据权利要求1所述的一种用于数据聚类的相似性网络融合快速方法，其特征在于：所述相似性网络提前训练存储，存储了相似性网络融合计算过程中的中间网络，这些网络用于最后进行快速相似性网络融合；同时，使用存储下来的中间网络，进行相似性网络融合模型快速计算。
3. 根据权利要求1或2所述的一种用于数据聚类的相似性网络融合快速方法，其特征在于：所述相似性网络的快速融合是指：对于不同特征的相似性网络进行有效的划分存储，然后进行迭代融合计算，实现快速分类。
4. 根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法，其特征在于：所述相似性网络的快速融合，是对添加新样本到原训练样本集中进行相似性网络的快速融合，对于一个新样本，同样需要计算矩阵W，S，P，其中有很大一部分与训练阶段计算结果十分相似，将该部分计算用训练阶段存储的矩阵信息进行替换。
5. 根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法，其特征在于：所述对于不同特征的相似性网络进行有效的划分存储，是指：利用相似性网络提前训练存储阶段存储的矩阵，矩阵划分方法为：对一个（n+l)*(n+l)的矩阵划分出左上角n*n的矩阵作为Parti，划分出右侧（n+l)*l 的矩阵作为Part II，划分出左下方l*n的矩阵作为Partlll，其中Part I的部分都可以用训练阶段的矩阵替换，在线分类阶段实际需要计算的是Part II和Part III，测试阶段的S 矩阵用下式计算，其中1彡i彡n+1 ; j = n+1，Ni表示Xi的K个近邻，K的取值依据是具体数据集规樽：
上述矩阵划分方法同时适用于S，P矩阵，矩阵P的第一个初始矩阵也类似计算；在用于矩阵初始化计算完成之后，进行迭代融合计算。
6. 根据权利要求5所述的一种用于数据聚类的相似性网络融合快速方法，其特征在于：所述的迭代融合计算，具体为：利用之前相似性网络提前训练存储阶段存储的矩阵，进行该阶段的相似性网络的融合，将S，P矩阵都分为四个部分，划分方法为：对一个（n+1) * (n+1)的矩阵划分出左上角n*n的矩阵作为第1部分，划分出右上方n*l 的矩阵作为第2部分，划分出左下方l*n的矩阵作为第3部分，划分出右下方1*1的矩阵作为第4部分；当已知第t -1次迭代的情况时，根据公式
先计算
其中S矩阵本权利要求中所述划分方法得到Sl，S2, S3, S4,定义
为矩阵P，那么P1，P2, P3, P4即为该划分方法得到的矩阵块；等式的右边是一个临时矩阵，记为Temp，是 Tempi, Temp2, Temp3, Temp4即为该划分方法得到的Temp的矩阵块；事实上，SI XPl近似于训练过程中的SXP，S、P分别为S矩阵与P矩阵，因而有训练过程中中间存储得到的SXP进行替换Tempi，按下面的公式计算Temp2, Temp4,并用Temp2的转置近似代替Temp3 :
最后，计算公式
中的X(SW)T部分，公式前半部分
的结果存在临时矩阵Temp中，Pw按权利要求中所述划分方法得到
是第V类特征下一次迭代过程中标准化的相似性矩阵，可得
同理计算出P3(V)，P3(V).只是数学计算的中间步骤，因而得到整个P (v)，又对称地，得到对于任意i类特征在下一次迭代过程中的标准化的相似性矩阵P(i)，至此，根据当前的迭代情况，完全计算得到下一次的迭代情况；又已知初始情况，由数学归纳法易得，可以计算得到迭代完成的情况；根据迭代得到最后的P矩阵即最后的标准化的相似性矩阵，从而实现了相似性网络融合的快速方法；结合部分标定的数据，采用半监督学习标签传递的方法，即可以对新样本进行聚类或分类。
【文档编号】G06K9/66GK104392247SQ201410625530
【公开日】2015年3月4日申请日期:2014年11月7日优先权日:2014年11月7日
【发明者】张重阳, 卢贤龙申请人:上海交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张重阳;卢贤龙;
技术所有人：上海交通大学;
我是此专利的发明人

上一篇：电子商务应用中基于rsa问题前向安全的数字签名方法
上一篇：低反射触控显示屏的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。