基于不相似度与拉普拉斯正则化下的稀疏子集选择方法与流程

文档序号:20601680发布日期:2020-05-01 21:42阅读:来源:国知局

技术特征:

1.一种基于不相似度与拉普拉斯正则化下的稀疏子集选择方法,其特征在于,所述方法包括:

假设有一个源集x={x1,...,xm}和一个目标集y={y1,...,yn},他们分别含有m和n个元素,假设我们得到了x与y之间的不相似度关系dij表示xi代表yj的好坏程度,它的值越小表示xi越能更好的代表yj;将这种二元关系写成如下的矩阵形式

用如下矩阵代表这些未知变量

用变量zij表示xi是否代表yj,当zij取0时表示xi代表yj,反之则不代表;为了保证每一个yj都有相应的代表元,规定

基于不相似度选择一个很好地编码y的x元素需要达到以下三个目标,第一,我们需要代表元能够足够好的代表yj,如果xi被选为代表元,则编码yj的花费为dijzij∈{0,dij},则通过x的子集代表y的花费为第二,我们希望能够选择尽可能少的代表元来代表目标集y,这个目标等同于矩阵z含有较少非零行。第三,我们希望所得到的代表元能够有比较好的结构,即代表元之间的“距离”能够尽可能的远;

将这三个目标集合起来,我们得到以下优化函数

其中||-||p代表lp范数,i(-)代表指示函数。此目标函数中的第一项代表编码的质量,第二项表示代表元的个数,第三项表示代表元的结构;

由于其中包含二元结构zij∈{0,1},所以此问题是一个非凸问题,即np-hard,所以有:

在这个优化函数中我们去掉了非凸部分——指示函数i(-);继续将以上问题写为如下的矩阵形式

s.t.1tz=1t,z≥0

其中,tr代表矩阵的迹,l=one(1)-e。


技术总结
本发明公开了一种基于不相似度与拉普拉斯正则化下的稀疏子集选择方法,其通过利用给定源集和目标集之间的成对不相似性关系,考虑了从源集合中找到可以有效地代表目标集的代表元的问题,并提出了基于不相似度的低秩稀疏子集选择模型,可以使用凸规划有效地解决。在以往工作的基础上我们考虑了代表元之间的结构,使得代表元的数目更少,代表的质量更高。其中还使用Algorithm 1进行算法的有效实现,并且我们的算法可以更进一步并行化,因此可以进一步减少计算时间。

技术研发人员:杨晨曦
受保护的技术使用者:杨晨曦
技术研发日:2018.10.24
技术公布日:2020.05.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1