1.一种基于不相似度与拉普拉斯正则化下的稀疏子集选择方法,其特征在于,所述方法包括:
假设有一个源集x={x1,...,xm}和一个目标集y={y1,...,yn},他们分别含有m和n个元素,假设我们得到了x与y之间的不相似度关系
用如下矩阵代表这些未知变量
用变量zij表示xi是否代表yj,当zij取0时表示xi代表yj,反之则不代表;为了保证每一个yj都有相应的代表元,规定
基于不相似度选择一个很好地编码y的x元素需要达到以下三个目标,第一,我们需要代表元能够足够好的代表yj,如果xi被选为代表元,则编码yj的花费为dijzij∈{0,dij},则通过x的子集代表y的花费为
将这三个目标集合起来,我们得到以下优化函数
其中||-||p代表lp范数,i(-)代表指示函数。此目标函数中的第一项代表编码的质量,第二项表示代表元的个数,第三项表示代表元的结构;
由于其中包含二元结构zij∈{0,1},所以此问题是一个非凸问题,即np-hard,所以有:
在这个优化函数中我们去掉了非凸部分——指示函数i(-);继续将以上问题写为如下的矩阵形式
s.t.1tz=1t,z≥0
其中,