一种数据转换方法、装置及数据处理系统与流程

文档序号:32944794发布日期:2023-01-14 10:17阅读:来源:国知局

技术特征:
1.一种数据转换方法,其特征在于,包括以下步骤:将待转换高维空间数据集a={x
i
}建模为高斯分布,将转换后的低维空间数据集b={y
i
}建模为t分布,y
i
为x
i
转换后的数据,i=1,2,

,m,m为a、b中的数据个数;计算a中任意两个高维空间数据x
i
、x
j
的欧氏距离r(x
i
,x
j
),并对每个欧氏距离进行加权,欧氏距离越小,加权系数越小;利用加权后的欧氏距离计算高维空间数据x
i
、x
j
的联合分布p
ij
,进而得到低维空间数据y
i
、y
j
的联合分布q
ij
;构建目标优化函数,利用梯度下降法求解低维空间数据y
i
、y
j
的最优解,从而将高维空间数据集a转换为低维空间数据集b。2.根据权利要求1所述的数据转换方法,其特征在于,所述两个高维空间数据x
i
、x
j
的欧氏距离为:式中,x
in
、x
jn
分别x
i
、x
j
的第n维分量,n=1,2,

,n,n为高维数据的维度。3.根据权利要求2所述的数据转换方法,其特征在于,所述加权系数的设定方法包括:将所有欧氏距离r(x
i
,x
j
)按照从小到大的顺序排序;将排序后的欧氏距离r(x
i
,x
j
)按照从前到后的顺序分成k组,依次为第1组、第2组、

、第k组;为每组的欧氏距离设置一个加权系数a
k
,且a1<a2<

<a
k
。4.根据权利要求3所述的数据转换方法,其特征在于,所述两个高维空间数据x
i
、x
j
的联合分布p
ij
为:为:为:式中,p
j︱i
、p
i︱j
为x
i
、x
j
的相似性条件概率;k1为第k组的第1个欧氏距离对应的x
i
的下标i,s-k为第k组中欧氏距离r
k
(x
i
,x
m
)的数量。5.根据权利要求4所述的数据转换方法,其特征在于,两个低维空间数据y
i
、y
j
的联合分布q
ij
为:式中,r(y
i
,y
j
)为y
i
、y
j
的欧氏距离。
6.根据权利要求5所述的数据转换方法,其特征在于,所述目标优化函数m为:式中,kl为k-l散度。7.根据权利要求6所述的数据转换方法,其特征在于,所述方法在计算r(x
i
,x
j
)之后还包括按下式对r(x
i
,x
j
)进行归一化的步骤:式中,为r(x
i
,x
j
)的归一化值,r
min
、r
max
分别为r(x
i
,x
j
)的最小值和最大值。8.根据权利要求7所述的数据转换方法,其特征在于,所述低维空间数据的维度为2。9.一种数据转换装置,其特征在于,包括:数据分布设置模块,用于将待转换高维空间数据集a={x
i
}建模为高斯分布,将转换后的低维空间数据集b={y
i
}建模为t分布,y
i
为x
i
转换后的数据,i=1,2,

,m,m为a、b中的数据个数;欧氏距离加权模块,用于计算a中任意两个高维空间数据x
i
、x
j
的欧氏距离r(x
i
,x
j
),并对每个欧氏距离进行加权,欧氏距离越小,加权系数越大;概率分布计算模块,用于利用加权后的欧氏距离计算高维空间数据x
i
、x
j
的联合分布p
ij
,进而得到低维空间数据y
i
、y
j
的联合分布q
ij
;低维空间求解模块,用于构建目标优化函数,利用梯度下降法求解低维空间数据y
i
、y
j
的最优解,从而将高维空间数据集a转换为低维空间数据集b。10.一种数据处理系统,其特征在于,包括权利要求9所述的装置。

技术总结
本发明提供一种数据转换方法、装置及数据处理系统。所述方法包括:将待转换高维空间数据集A={x


技术研发人员:曹瀛
受保护的技术使用者:苏州碳氧网络科技有限公司
技术研发日:2022.10.28
技术公布日:2023/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1