基于同时融合多视角特征及多标签信息的支持向量机分类方法

文档序号:6615987阅读:415来源:国知局
专利名称:基于同时融合多视角特征及多标签信息的支持向量机分类方法
基于同时融合多视角特征及多标签信息的支持向量机分类方法技术领域
本发明属于标签技术领域,特别地涉及一种基于同时融合多视角特征及多标签信息的支持向量机分类方法。
背景技术
随着信息时代的到来,各种数据以几何级数爆发增长。尤其是在互联网领域,海量跨媒体数据已是人们关注和研究的热点。例如,图像数据结合文本标签数据的内容理解和提取在互联网信息搜索和数据挖掘应用方面起到了至关重要的作用。而其中一个关键就是如何准确地对具有多种特征的图像进行内容分类。这些特征可以通过各种特征提取技术得到,比如图像sift特征提取技术、HUE图像颜色特征提取技术、Gabor图像纹理提取技术。 而在文本分析和内容分类问题中,一篇体育新闻的文章中往往附有比赛图片、视频、声音等信息,同时这篇文章也可能被翻译成了其他语言的文字。如何有效地提取和利用这些来自多种信息视角的特征,并且提高数据的分类准确率,成了当今计算机数据挖掘领域亟待解决的课题。
另一方面,在实际的数据挖掘分类问题中,很多情况下数据对象在拥有通过不同途径得到的多视角特征信息的同时,往往会有多个类属标签与之关联。这些标签反映了目标对象的对应属性,是人们对这些数据内容的概括或属性的分类。例如,在多标签图像数据的分类问题中,一幅图拥有类属标签“山”、“湖水”、“船”。而一篇谈论苹果公司产品的文章, 可以具有“科技”、“经济”、“数码产品”等分类标签。
现有的分类技术,都只关注了数据的多标签分类问题或是数据的多视角信息特征分类的问题,而忽视了如何将多视角信息特征和多标签信息有效融合起来提高分类问题的准确率。在传统的多标签分类技术中,通常是把多标签问题转化为一对多One Vs All(OVA) 的分类模式,即把多标签分类问题分解为多个二分类问题。但在这一多标签问题的分解过程中,没有考虑到多标签空间中的数据关联信息。例如,一个已有内容标签“山”、“湖泊”、 “船”的图片,它的内容中有“人”的概率远远大于有“建筑楼”的概率。传统的多标签分类器既没有很好地利用这方面的信息,也没考虑到利用数据多视角特征空间的关联信息和冗余信息。同样,在现有的多视角信息特征分类技术中,往往只注意多视角特征在特定标签上的分类一致性,而都忽视了多标签信息对于多视角特征的鉴别选择作用。例如,“苹果”标签在分类“红苹果”、“绿苹果”和“红旗”图片的时候,会鉴别地选择形状特征,而颜色特征在根据“苹果”这个概念进行图片分类时会产生干扰和影响。而且现有的多视角信息特征分类器直接将多种途径得到的数据特征作为分类器的输入,带入了很多噪声干扰和冗余信息,使得分类结果受到很大影响。
鉴于现有的多标签分类器和多视角特征分类器各自存在的缺点和不足,本发明提出的鉴别型支持向量机分类方法能够同时融合多视角特征及多标签信息,把分类过程和特征融合过程结合起来提高分类准确度,有效解决了实际数据挖掘应用中多视角特征、多标签数据的智能分类和内容识别问题。发明内容
为解决上述问题,本发明的目的在于提供一种基于同时融合多视角特征及多标签信息的支持向量机,用于提供一种技术在支持向量机分类的同时,学习得到新的数据空间里的一个统一的数据表达形式。数据的这种新的表达形式能够有效地消除多种特征表达间的冗余,加强相互间的关联辅助信息。由于在学习过程中引入了多标签信息的正则项调节因子,新的数据表达鉴别地选择了多视角特征,从而进一步提高了分类器的准确率。
为实现上述目的,本发明的技术方案为
一种基于同时融合多视角特征及多标签信息的支持向量机分类方法,包括以下步骤 SlO 至 S30
S10,输入多视角特征训练数据以及每个数据所对应的多标签信息,建立同时融合多视角特征及多标签信息的支持向量机MVMLSVM分类器的数学模型,设定各个项的对应权重因子的值,其具体包括SlOl至S103,
S101,输入给定的多视角特征数据以及每个数据的多标签信息,
权利要求
1.一种基于同时融合多视角特征及多标签信息的支持向量机分类方法,其特征在于,包括以下步骤SlO至S30 S10,输入多视角特征训练数据以及每个数据所对应的多标签信息,建立同时融合多视角特征及多标签信息的支持向量机MVMLSVM分类器的数学模型,设定各个项的对应权重因子的值,其具体包括SlOl至S103, S101,输入给定的多视角特征数据以及每个数据的多标签信息,x; e R^xl,允 e{—1,+1}, i e {1,2, ...,n},vG {1,2, ...,V},lG {1,2,…,L},其中 L 是标签的种数,dv是第V个视角特征的维度,W表示数据X丨在第I种标签上的类属关系,M值为+1表示数据<属于第I种标签,-I表示不属于,采用矩阵形式来表达数据和数据所附有的标签信息,分别用Xv,V G {1,2,…,V}和兮来表示,其中,Xv =[x[,…,X:] =M j的每一列I属于L维的标签空间y,即Y.,. e y5而交的每一行的转置后的列向量表示各个数据在第I种标签上的类属关系,用Y1表示,
全文摘要
本发明实施例公开了一种基于同时融合多视角特征及多标签信息的支持向量机分类方法,包括以下步骤输入多视角特征训练数据以及每个数据所对应的多标签信息,建立同时融合多视角特征及多标签信息的支持向量机分类器的数学模型,设定各个项的对应权重因子的值;训练和学习分类器的各个参数,运用循环迭代算法更新目标优化式的各个参数变量,直到两次迭代的整体目标函数值之差的绝对值小于预设的阈值时停止,并且采用更新计算某个参数时,固定其他参数值的策略;用训练得到的分类器,对实际数据进行多标签分类或预测。本发明用于提供一种技术在支持向量机分类的同时,学习得到新的数据空间里的一个统一的数据表达形式,提高了分类器的准确率。
文档编号G06F17/30GK102982344SQ201210452040
公开日2013年3月20日 申请日期2012年11月12日 优先权日2012年11月12日
发明者方正, 张仲非 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1