一种数据转换方法、装置及数据处理系统与流程

文档序号：32944794发布日期：2023-01-14 10:17阅读：来源：国知局

技术特征：
1.一种数据转换方法，其特征在于，包括以下步骤：将待转换高维空间数据集a＝{x
i
}建模为高斯分布，将转换后的低维空间数据集b＝{y
i
}建模为t分布，y
i
为x
i
转换后的数据，i＝1,2,
…
,m，m为a、b中的数据个数；计算a中任意两个高维空间数据x
i
、x
j
的欧氏距离r(x
i
,x
j
)，并对每个欧氏距离进行加权，欧氏距离越小，加权系数越小；利用加权后的欧氏距离计算高维空间数据x
i
、x
j
的联合分布p
ij
，进而得到低维空间数据y
i
、y
j
的联合分布q
ij
；构建目标优化函数，利用梯度下降法求解低维空间数据y
i
、y
j
的最优解，从而将高维空间数据集a转换为低维空间数据集b。2.根据权利要求1所述的数据转换方法，其特征在于，所述两个高维空间数据x
i
、x
j
的欧氏距离为：式中，x
in
、x
jn
分别x
i
、x
j
的第n维分量，n＝1,2,
…
,n，n为高维数据的维度。3.根据权利要求2所述的数据转换方法，其特征在于，所述加权系数的设定方法包括：将所有欧氏距离r(x
i
,x
j
)按照从小到大的顺序排序；将排序后的欧氏距离r(x
i
,x
j
)按照从前到后的顺序分成k组，依次为第1组、第2组、
…
、第k组；为每组的欧氏距离设置一个加权系数a
k
，且a1<a2<
…
<a
k
。4.根据权利要求3所述的数据转换方法，其特征在于，所述两个高维空间数据x
i
、x
j
的联合分布p
ij
为：为：为：式中，p
j︱i
、p
i︱j
为x
i
、x
j
的相似性条件概率；k1为第k组的第1个欧氏距离对应的x
i
的下标i，s-k为第k组中欧氏距离r
k
(x
i
,x
m
)的数量。5.根据权利要求4所述的数据转换方法，其特征在于，两个低维空间数据y
i
、y
j
的联合分布q
ij
为：式中，r(y
i
,y
j
)为y
i
、y
j
的欧氏距离。
6.根据权利要求5所述的数据转换方法，其特征在于，所述目标优化函数m为：式中，kl为k-l散度。7.根据权利要求6所述的数据转换方法，其特征在于，所述方法在计算r(x
i
,x
j
)之后还包括按下式对r(x
i
,x
j
)进行归一化的步骤：式中，为r(x
i
,x
j
)的归一化值，r
min
、r
max
分别为r(x
i
,x
j
)的最小值和最大值。8.根据权利要求7所述的数据转换方法，其特征在于，所述低维空间数据的维度为2。9.一种数据转换装置，其特征在于，包括：数据分布设置模块，用于将待转换高维空间数据集a＝{x
i
}建模为高斯分布，将转换后的低维空间数据集b＝{y
i
}建模为t分布，y
i
为x
i
转换后的数据，i＝1,2,
…
,m，m为a、b中的数据个数；欧氏距离加权模块，用于计算a中任意两个高维空间数据x
i
、x
j
的欧氏距离r(x
i
,x
j
)，并对每个欧氏距离进行加权，欧氏距离越小，加权系数越大；概率分布计算模块，用于利用加权后的欧氏距离计算高维空间数据x
i
、x
j
的联合分布p
ij
，进而得到低维空间数据y
i
、y
j
的联合分布q
ij
；低维空间求解模块，用于构建目标优化函数，利用梯度下降法求解低维空间数据y
i
、y
j
的最优解，从而将高维空间数据集a转换为低维空间数据集b。10.一种数据处理系统，其特征在于，包括权利要求9所述的装置。

技术总结
本发明提供一种数据转换方法、装置及数据处理系统。所述方法包括：将待转换高维空间数据集A＝{x

技术研发人员：曹瀛
受保护的技术使用者：苏州碳氧网络科技有限公司
技术研发日：2022.10.28
技术公布日：2023/1/13

完整全部详细技术资料下载

当前第2页1 2