一种降维映射的大数据可视化方法

文档序号:8512568阅读:449来源:国知局
一种降维映射的大数据可视化方法
【技术领域】
[0001]本发明涉及计算机的大数据处理领域,具体地说是一种降维映射的大数据可视化方法。
【背景技术】
[0002]大数据可视化,可视分析是大数据分析的重要方法,大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧。主要从可视分析领域所强调的认知、可视化、人机交互的综合视角出发,分析支持大数据可视分析的基础理论,包括支持分析过程的认知理论、信息可视化理论、人机交互与用户界面理论等。
[0003]大数据可视分析是指在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力。
[0004]降维映射中,机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数f: x_>y,其中X是原始数据点的表达,目前最多使用向量表达形式;y是数据点映射后的低维向量表达,通常y的维度小于X的维度(当然提高维度也是可以的);f可能是显式的或隐式的、线性的或非线性的。

【发明内容】

[0005]本发明的目的是克服现有技术中存在的不足,提供一种降维映射的大数据可视化方法。
[0006]本发明的技术方案是按以下方式实现的,实施步骤如下:
1)、建立一个目标函数,实现一种点对点的降维映射,能保持对应的距离不变;
2)、对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法。在这两种最优化方法中,每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则,则每步迭代仅需一对数据;以数据为基准,对其他数据映射进行调
-K-
T ;
3)、学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。
[0007]本发明的优点是:
本发明的一种降维映射的大数据可视化方法和现有技术相比,并不采用常见的Himberg收缩模型,而根据神经元在这两种空间中对应距离的一致性进行调节,可以证明这种调节方式类似于随机梯度下降法。本方法具有保距映射的功能,不但实现了数据间距离信息的直观展现,还能在不需要任何额外控制参数的情况下自动避免神经元的过度收缩问题,从而极大地提高算法的可控性和数据可视化的质量。
【具体实施方式】
[0008]下面对本发明的一种降维映射的大数据可视化方法作以下详细说明。
[0009]本发明的一种降维映射的大数据可视化方法,对神经元的位置进行调节的依据已不再是Himberg收缩模型,而是根据神经元在原数据空间和低维空间中对应距离(或相似度)的一致性进行调节,目的是为了对数据间的距离(或相似度)信息进行直观展现。在迭代的每一步,以获胜神经元V为基准,对其他神经元的位置进行调节,如采用距离度量而非相似度量等。
[0010]实施步骤如下:
1)、建立一个目标函数,实现一种点对点的降维映射,能保持对应的距离不变;
2)、对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法。在这两种最优化方法中,每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则,则每步迭代仅需一对数据。以数据为基准,对其他数据映射进行调
-K-
T ;
3)、学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。
[0011]除说明书所述的技术特征外,均为本专业技术人员的已知技术。
【主权项】
1.一种降维映射的大数据可视化方法,其特征在于实施步骤如下: 1)、建立一个目标函数,实现一种点对点的降维映射,能保持对应的距离不变; 2)、对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法;在这两种最优化方法中,每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则,则每步迭代仅需一对数据;以数据为基准,对其他数据映射进行调-K-T ; 3)、学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。
【专利摘要】本发明提供一种降维映射的大数据可视化方法,首先建立一个目标函数,实现一种点对点的降维映射;然后对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法。在这两种最优化方法中,每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则,则每步迭代仅需一对数据。以数据为基准,对其他数据映射进行调节;最后学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。本发明具有保距映射的功能,不但实现了数据间距离信息的直观展现,还能在不需要任何额外控制参数的情况下自动避免神经元的过度收缩问题,从而极大地提高算法的可控性和数据可视化的质量。
【IPC分类】G06F17-30
【公开号】CN104834716
【申请号】CN201510235026
【发明人】戴鸿君, 于治楼
【申请人】浪潮集团有限公司
【公开日】2015年8月12日
【申请日】2015年5月11日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1