一种用户兴趣点确定方法与装置的制作方法

文档序号:7929316阅读:276来源:国知局

专利名称::一种用户兴趣点确定方法与装置的制作方法
技术领域
:本发明涉及通信领域,尤其涉及根据用户操作的多媒体内容,确定用户兴趣点的方法与装置。
背景技术
:现有通信网络中,为方便用户使用,提供了多种多样功能的互连网服务。如mSpaces是面向手机用户的个性化的和手机通信功能相结合的互联网服务,旨在增加用户粘性和忠诚度。mSpaces用户利用系统提供的各种工具组件创建自己的个性化页面,并享有自己的个人空间存储和发布自己的原创内容,并通过现有各类通信服务如飞信、彩信、短信和邮箱等实现信息的发布、与好友的互动沟通、信息共享以及定制自己感兴趣的内容推送到手机,享受一点提交多点发布和一次定制自动推送的手机无线服务和互联网社区服务。用户可以通过手机终端访问mSpaces网站,上传/下载图片、上传/下载音乐视频、撰写博客、发送短彩和用户位置特征等。因此,mSpaces平台上会发生很多与用户行为相关的事件,而这些事件相关的操作内容,如用户上传图片的内容、用户下载音乐的内容、用户订阅的媒体信息等都与手机终端用户的行为习惯,兴趣特征等有很重要关系。现有技术中,在确定用户兴趣点时,一种实现方式是根据用户的静态属性信息确定,如根据用户的性别、年龄以及用户所属区域等。还有的实现方式是根据用户上传或下载的信息,匹配设定的关键词,来进行用户类别区分,根据用户所属用户类别,确定出用户的兴趣点。现有技术的上述兴趣点确定方法,都是简单且粗略的定位用户的兴趣点,确定出的用户兴趣点不够准确。
发明内容本发明提供一种用户兴趣点确定方法与装置,根据用户操作的多媒体内容,较准确地确定出用户的兴趣点。本发明提供的用户兴趣点确定方法,包括根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值;根据所述多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与所述媒体特征值之间的差值;按照所述差值从小到大的顺序,选取一个或一个以上的对应兴趣点确定为所述用户的兴趣点;其中,所述媒体兴趣类聚空间是针对每一种多媒体类型分别预先生成的;所述媒体兴趣类聚空间中包含预先设置的兴趣点,每一个所述兴趣点对应的兴趣特征值由选取的与所述兴趣点对应的训练样本的特征确定。本发明还提供一种用户兴趣点确定装置,包括媒体特征确定模块,用于根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值;类聚空间确定模块,用于根据所述多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;兴趣点确定模块,用于计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与所述媒体特征值之间的差值;按照所述差值从小到大的顺序,选取一个或以上的对应兴趣点确定为所述用户的兴趣点;类聚空间生成存储模块,用于针对每一种多媒体类型分别生成对应的媒体兴趣类聚空间并存储;所述媒体兴趣类聚空间中包含预先设置的兴趣点,每一个所述兴趣点对应的兴趣特征值由选取的与所述兴趣点对应的训练样本的特征确定。本发明针对每一种多媒体类型分别生成媒体兴趣类聚空间,媒体兴趣类聚空间中包含有设置的若干个兴趣点,每一个兴趣点具有对应的兴趣特征值,由选取的与该兴趣点相关的多媒体内容作为训练样本,并根据训练样本特征预先确定。当用户操作多媒体内容(如图片、文本及声音等)时,根据用户操作的多媒体内容,确定对应媒体特征值;通过计算媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与媒体特征值之间的差值;选取差值较小的一个或多个对应兴趣点确定为用户的兴趣点。由于多媒体内容的媒体特征值表征了用户操作的多媒体内容的特征,而兴趣点对应的兴趣特征值是由对应的训练样本的特征确定的,因此,当媒体特征值与兴趣特征值的差值较小时,表明用户操作的多媒体内容与兴趣点对应的训练样本比较接近,从而实现根据用户操作的多媒体内容较准确地确定出用户的兴趣点。图1为本发明实施例提供的用户兴趣点确定方法流程图;图2为本发明实施例提供的当用户操作图片时用户兴趣点确定方法流程图;图3为本发明实施例提供的用户兴趣点确定系统结构示意图;图4为本发明实施例提供的用户兴趣点确定系统中类聚空间生成存储模块结构示意图;图5为本发明实施例提供的用户兴趣点确定系统中兴趣点确定模块结构示意图;图6为本发明实施例提供的用户客户端结构示意图。具体实施例方式本发明提供一种用户兴趣点确定方法与装置,实现根据用户操作的多媒体内容,较准确地确定出用户的兴趣点。下面结合附图,用具体实施例对本发明提供的用户兴趣点确定方法与装置进行详细阐述。参见图l,为本发明实施例提供的用户兴趣点确定方法流程图,具体包括步骤S101、根据用户操作的多媒体内容,确定表征该多媒体内容特征的媒体特征值;步骤S102、根据用户操作的多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;步骤S103、计算媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与用户所操作的多媒体内容的媒体特征值之间的差值;步骤S104、按照计算获得的差值从小到大的顺序排序对应兴趣点;步骤S105、按差值从小到大的顺序,选取一个或一个以上的对应兴趣点确定为用户的兴趣点。其中,媒体兴趣类聚空间针对每一种多媒体类型分别预先生成。例如针对图片(或图像)生成相应的媒体兴趣类聚空间;针对声音生成相应的媒体兴趣类聚空间等。媒体兴趣类聚空间中包含预先设置的若干个兴趣点,每一个兴趣点具有兴趣特征值,每一个兴趣点对应的兴趣特征值,由与预先选取的与该兴趣点相关的多媒体内容作为训练样本,并根据训练样本的特征确定。—实施例中,媒体兴趣类聚空间是一个多维的向量空间,媒体特征值以媒体特征向量表示,兴趣特征值以兴趣特征向量表示。下面以多媒体的一种类型,即图片为例,具体描述如何生成对应的媒体兴趣类聚空间。1)用户预先设置媒体兴趣类聚空间的若干个兴趣点,如网球、乒乓球、旅游等都对应着媒体兴趣类聚空间中的一个兴趣点。2)为每个兴趣点输入m个训练样本图片和k个关键词(可选项),该组训练样本图片表示与该兴趣点相关的一系列图片,如"网球"兴趣点,可以输入网球、球拍、网球比赛等图片,关键词可以是网球、温博尔顿、费德勒、萨拉波娃等。3)为了能够用离散数值来表示这些图片,需要从训练样本图片中抽取可以量化的图片的特征(如色阶、亮度、轮廓等),形成一个n维向量。具体处理过程为首先进行图片裁剪,即将每个训练样本图片都裁剪成大小一致的图片(如300*300),无论图片原始大小的长宽比例,都将其进行压縮或扩大至同样的分辨率,以便于图片特征值提取。图片特征值提取通过色阶、分块颜色、分块轮廓等参数来定义一个图片内容。例如主要提取图像三个方面的数据色阶、图像分块均值颜色以及图像分块轮廓数据。对于一个兴趣点(设为a),为兴趣点a选取m个训练样本图片。对于其中的某个训练样本图片i,首先获取图片的色阶数据;然后,将图片分割为N*N(当图片大小为300*300时,N的取值可以是8-10)个小块,先对每小块图片的颜色取均值(模糊),并映射到8色的色彩空间中的一种颜色,从而获得一个表示每个小块颜色的数值。再对每小块特征进行轮廓提取,获得,N个描述各块轮廓特征的矢量线段描述,经过上述处理就得到了描述这个训练样本图片i的图像内容的特征向量,即imgfi(cs,Oi,o2,o3,----o画,c2,c3,,cNXN)其中,cs为一个集合,表示基于量化的HSV(色调hue,饱和度saturation,值value)空间的颜色均方图,并将其离散在162个均分的区间内分布。0l,o2,……,oNXN表示每一小块图像的轮廓特征的矢量描述集合,(^,C2,....,c,表示图像中各小块的颜色值。这样对于兴趣点a的m个训练样本图片,就能得到m个图像内容特征向量,表示为ivect(imgfpimgf2,imgf3,....,imgf迈)这m个图像内容特征向量可以大致描述该兴趣点的图像内容特征。除了图像内容特征向量之外,每个图像还可以有相应的关键词对图像进行描述。例如对于兴趣点a,它的每个训练样本图片可以相应地提供一些关键词,汇总所有训练样本图片的关键词从而得到兴趣点a的特征词汇向量,即despt(keyw丄,keyw2,……,keywn)其中,keyw表示关键词,despt集合表示兴趣点的特征词集合。分别对媒体兴趣类聚空间中设置的每个兴趣点输入一组训练样本图像和关键词,建立ivect和despt特征向量,从而构建了基于图片的媒体兴趣类聚空间。建立的特征向量可以通过扩展标识语言(extensibleMarkupLanguage,XML)或其他方式进行描述并存储于计算机中。构建了基于图片的媒体兴趣类聚空间后,对于用户操作的图片,可以采用相同的方法提取图片特征,生成对应的特征向量(为描述清楚方便,下文中,将兴趣点对应的特征向量称为兴趣特征向量,将根据用户操作的多媒体内容生成的对应特征向量称为媒体特征向量),并计算媒体特征向量与兴趣特征向量之间的差值,按差值从小到大的顺序,选取一个或一个以上的对应兴趣点确定为用户的兴趣点。根据本发明提供的上述方法,对于用户每次操作的多媒体内容,都需要计算媒体特征向量与兴趣特征向量之间的差值,根据差值大小确定出差值较小的对应兴趣点作为用户的兴趣点。为了尽量减小计算量,一较佳实施例中,还对多媒体内容根据设定的标识生成策略生成对应的内容标识,并存储内容标识与兴趣点的对应关系。对应关系的初始记录包括根据训练样本的多媒体内容的内容数据生成的内容标识与对应的兴趣点的对应关系;并在用户操作多媒体内容后,对用户本次操作的多媒体内容按照同样的标识生成策略生成对应的内容标识,并与存储的对应关系中的内容标识进行匹配,当存储的对应关系中包含了用户本次操作的多媒体内容的对应内容标识时,可以根据存储的对应关系直接确定出对应的兴趣点为用户兴趣点;而当存储的对应关系中没有包含用户本次操作的多媒体内容的对应内容标识时,按上述方法确定出对应兴趣点,将用户本次操作的多媒体内容的对应内容标识与对应兴趣点的对应关系记录,增加到存储的对应关系中,实现不断增加对应关系中的记录,以提高后续的匹配成功率。—实施例中,对应关系可以采用表格的形式存储。该对应关系表中,至少包括两个字段内容标识和对应的兴趣点。—实施例中,对应关系表还可以存储计算出的差值,即存储内容标识的对应多媒体内容的媒体特征向量与对应兴趣点的兴趣特征向量之间的差值。生成的内容标识用于唯一地标识出对应的多媒体内容,本发明实施例中的内容标识不是人为设置的没有具体含义的标识符或数值,而是需要根据对应的多媒体内容数据计算得到,表征对应的多媒体内容的特征。对同一种类型的多媒体内容采用同样的标识生成策略确定出对应的内容标识后,就可以通过内容标识的比较,确定出对应的多媒体内容是否相同。下面以图片的内容标识生成为例,以如何生成多媒体内容的内容标识进行具体说明。对于每个同样大小的图片文件,可以使用一种算法生成该图片的唯一标识(ID),使同一ID表示不同图片的概率趋近于O。首先可以使用某种方法,将图片文件的大量数量,用一串较短的数字进行表示。例如用图像文件的CRC循环校验码来表示。在这串较短的数字中,再随机抽取某些位的数值,以这些数值为偏移量,提取图片文件中该偏移量的数据内容,将这些内容合并到这串较短数字中生成对应的ID。—种图片的ID提取方法如下<formula>formulaseeoriginaldocumentpage9</formula>上式中,i为图片文件变形为300*300后的32位CRC循环校验码,CRC生成式为<formula>formulaseeoriginaldocumentpage9</formula>取i的十进制前两位数记为il,j为图片文件第il个字节的值;取i的十进制的最高位的值记为i2,k为图片文件的第i2个字节的值。将三者(即i,j和k)合并后便是ID的值。这样,对于每个图片文件来说,经过变形之后,ID基本能够唯一标识一个图片。当两个图片文件的内容相同时,其对应ID相同,所以比对ID是否相同就可以确定出图片是否相同。对于音频数据文件,也可以生成对应的ID。例如,先裁剪音频文件的前10秒的数据(从音频有波形的地方开始),根据音频前10秒的数据,提取音频特征生成对应的ID。音频特征例如包括短时平均能量、过零率、频率中心及带宽等。由于XML具有树状特性对应了imgf向量中具有子向量的特点,因此可以用XML来标识媒体特征。具体定义如下表一所示表一<table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table>根据上述描述可知,一个兴趣点对应一个或一个以上兴趣特征向量;向量的个数等于为该兴趣点选定的训练样本数量。如上所述,兴趣点a具有m个训练样本图片,其对应的图像内容特征向量ivect(imgfpimgf2,imgf3,...,imgfm)具有m个向量imgf^imgfm。以上述实施例生成的基于图片的媒体兴趣类聚空间为例,当用户操作的多媒体内容为图片时,确定出用户兴趣点的具体流程如图2所示,具体包括步骤S201、根据用户操作的图片,采用上述方法确定出与用户本次操作的图片对应的媒体特征向量及内容标识。步骤S202、用用户本次操作的图片的内容标识,在存储的内容标识与兴趣点对应关系中进行匹配。步骤S203、判断是否匹配到相同的内容标识,若是,执行步骤S204;否则,执行步骤S205。步骤S204、根据存储的对应关系,获取与内容标识对应的兴趣点,转至步骤S213。步骤S205、获取下一个兴趣点的兴趣特征向量ivect和despt。步骤S206、取出ivect中的下一个imgf向量,计算imgf向量与用户所操作的图片的媒体特征向量之间的差值,并记录该差值。假设img^表示用户所操作的图片对应的媒体特征向量;其中imgfi=(cs"。u,。u,——。l画,Cu,q,"Cu,,c丄,画)假设imgf2为ivect中的一个imgf向量,其中imgf2=(cs2,o2a,o2,2,o2,3,----o2,NXN,c2,2,c2,3,,c2,NXN)imgfi和imgf2之间的差值为DBI(imgf^,imgf2)=y一cdist(imgf丄,imgf2)+y2*odist(imgf工,imgf2)+y3*cdist(imgfpimgf2)其中,cdist(imgfpimgf2)=(cs「cs》TA(cs厂cs》,A[a^」]表示色彩i和色彩j的关系。odist(imgfpimgf2)表示经过图像裁剪之后,两个图像之间轮廓的相异性。即ofc争g/;,//ng/;)=V(01,1—02,1)2+(01,2—。2,2)2+...+(01,N—。2,N*N)2其中,Yl,Y2,Y3为各个部分所占比重的权值。步骤S207、判断是否完成全部imgf向量与用户操作的图片的媒体特征向量之间的差值计算,若否,转至步骤S206;若是,继续步骤S208。步骤S208、判断图片是否附带有关键词,若是,执行步骤S209;若否,执行步骤S210。步骤S209、确定图片所带关键词是否出现在兴趣点的despt集合中,并计算出现个数。假设图片附带了m个关键词,那么附带了关键词的图片的关键词集合可以表示为mIkw=(J设兴趣点j共有n个关键词表示,它的关键词集合为kw"(J^"乂图片Ikw与兴趣点kWi的关键词相关度KWR表示为A^i(7fcw,—)=Z/5^peflfm/(,—)/=i其中isAppeared(keyword,keywordset),表示图片的关键词keyword是否在兴趣点的关键词集合keywordset中出现,如果出现,则isAppeared(keyword,keywordset)值为l,否则为O。也就是说,KWR计算的是图片附带的关键词在兴趣点的关键词集合中出现的次数的总和。步骤S210、计算用户操作的图片的媒体特征向量与当前兴趣点的兴趣特征向量之间的差值,并选取最小差值作为用户操作的图片的媒体特征向量与当前兴趣点对应的兴趣特征向量之间的差值。差值DII具体计算式为D//=Am〗n(ZW0附gf1,/附g/;》-)bv)上式中,Pi和P2为权重系数。步骤S211、判断媒体兴趣类聚空间中的全部兴趣点是否都计算完毕,若否,转至步骤S205;若是,执行步骤S212。步骤S212、比较各兴趣点对应的差值,将各兴趣点对应的差值按从小到大的顺序排序,确定出差值最小的一个兴趣点或差值较小的K个兴趣点。并将用户本次操作的图片的内容标识及选取的对应兴趣点以及计算出的对应差值增加到保存的对应关系中。步骤S213、将步骤S204或步骤S212中确定出的兴趣点作为用户的兴趣点,保存到用户兴趣历史记录中;另外,还可以在用户兴趣历史记录中保存计算出的对应差值,该差值大小可以表明用户兴趣与对应兴趣点之间的差异性大小。11采用图2所述流程,在确定出用户操作的多媒体内容的媒体特征向量时,还生成对应的内容标识,先根据内容标识匹配存储的内容标识与兴趣点对应关系表,如果能匹配到相同的内容标识,则直接输出对应的兴趣点作为用户的兴趣点,避免了与媒体兴趣类聚空间中各兴趣点之间差异性的逐一计算比较。另外,若本次未匹配到相同的内容标识,则采用上述实施例提供的方法确定出对应的兴趣点后,还将本次用户操作的多媒体内容的内容标识与确定出的对应兴趣点增加到对应关系中,使得对应关系中的记录不断增加,后续根据内容标识进行匹配时,匹配成功的可能性也不断增大。当用户在线通过互连网登录网络侧相应服务器时,可以由网络侧服务器捕获用户操作的多媒体内容,执行本发明上述实施例提供的用户兴趣点确定方法,确定出用户的兴趣点。当用户离线操作多媒体内容时,还可以由用户客户端根据用户操作的多媒体内容,确定出对应的媒体特征向量及内容标识并先保存在本地。当用户客户端登录网络侧服务器时,将本地存储的媒体特征向量及内容标识发送至网络侧服务器,由网络侧服务器根据预先生成的媒体兴趣类聚空间,采用上述方法确定出用户的兴趣点。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如R0M/RAM、磁碟、光盘等。基于同一发明构思,本发明实施例还提供一种用户兴趣点确定装置,其结构示意图如图3所示,包括媒体特征确定模块31,用于根据用户操作的多媒体内容,确定表征多媒体内容特征的媒体特征值;类聚空间确定模块32,用于根据用户操作的多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;兴趣点确定模块33,用于计算媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与媒体特征值之间的差值;按照差值从小到大的顺序,选取一个或以上的对应兴趣点确定为用户的兴趣点;类聚空间生成存储模块34,用于针对每一种多媒体类型分别生成对应的媒体兴趣类聚空间并存储;媒体兴趣类聚空间中包含预先设置的兴趣点,每一个兴趣点对应的兴趣特征值由选取的与该兴趣点对应的训练样本的特征确定。—实施例中,用户兴趣点确定装置还包括对应关系存储更新模块35,用于存储多媒体内容的内容标识与兴趣点的对应关系;所述内容标识根据多媒体内容数据按照设定的标识生成策略生成,对应关系的初始记录包括根据训练样本的多媒体内容的内容数据生成的内容标识与对应的兴趣点的对应关系;以及存储根据用户操作的多媒体内容生成的、当前未保存在本地的内容标识与选取的对应兴趣点的对应关系记录。—实施例中,类聚空间生成存储模块34的具体结构如图4所示,包括设置子模块341,用于设置一个以上兴趣点;并为每一个兴趣点选定一个或一个以上的训练样本;特征提取子模块342,用于提取每一个兴趣点对应的训练样本的特征,生成与每一个兴趣点对应的兴趣特征向量;生成子模块343,用于保存设置的一个以上兴趣点对应的兴趣特征向量,生成媒体兴趣类聚空间。—实施例中,兴趣点确定模块33的具体结构如图5所示,包括内容标识生成子模块331,用于根据用户操作的多媒体内容,按照设定的标识生成策略,生成用户操作的多媒体内容的对应内容标识;匹配子模块332,用于将生成的用户操作的多媒体内容的内容标识,与对应关系存储更新模块35中存储的内容标识匹配;并输出匹配结果;确定子模块333,用于当匹配结果为匹配到相同的内容标识时,根据对应关系存储更新模块35中存储的对应关系,将与该内容标识对应的兴趣点确定为用户的兴趣点;以及当匹配结果为未匹配到相同的内容标识时,按照上述方法计算差值,并按照差值从小到大的顺序,选取一个或以上的对应兴趣点确定为用户的兴趣点。实际应用中,本发明提供的用户兴趣点确定装置的各模块都可以设置在网络侧服务器中;或者其中的媒体特征确定模块设置在用户客户端中,其余各模块设置在网络侧服务器中,由用户客户端发送媒体特征值,或者媒体特征值和内容标识给网络侧服务器。当媒体特征确定模块设置在用户客户端时,该用户客户端的具体结构如图6所示,包括用户操作事件产生器61,用于产生多媒体内容操作,并存储该操作;媒体特征确定模块62,用于根据用户操作的多媒体内容,确定表征多媒体内容特征的媒体特征值;或者根据用户操作的多媒体内容,确定表征多媒体内容特征的媒体特征值外,还按照设定的标识生成策略生成用户操作的多媒体内容的内容标识;媒体特征存储模块63,用于存储媒体特征确定模块62确定出的媒体特征值;当所述媒体特征确定模块62还生成所述内容标识时,还用于存储媒体特征确定模块62生成的内容标识;媒体特征发送模块64,用于发送存储的媒体特征值到网络侧服务器;或者发送存储的媒体特征值和内容标识到网络侧服务器。将媒体特征确定模块设置在用户客户端中,当用户离线操作多媒体内容时,可以由用户客户端根据用户操作的多媒体内容,确定出对应的媒体特征向量以及内容标识并保存在本地。当用户客户端登录网络侧服务器时,将本地存储的媒体特征向量及内容标识发送至网络侧服务器,由网络侧服务器根据预先生成的媒体兴趣类聚空间,采用本发明上述实施例公开的用户兴趣点确定方法确定出用户的兴趣点。综上所述,本发明通过针对每一种多媒体类型分别生成媒体兴趣类聚空间,根据训练样本确定出媒体兴趣类聚空间中每一个兴趣点对应的兴趣特征值。当用户操作多媒体内容(如图片、文本及声音等)时,根据用户操作的多媒体内容,确定对应媒体特征值;并选取与用户本次操作的多媒体内容对应的媒体兴趣类聚空间,计算媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与媒体特征值之间的差值;选择差值较小的对应兴趣点确定为用户的兴趣点。由于多媒体内容的媒体特征值表征了用户操作的多媒体内容的特征,而兴趣点对应的兴趣特征值是由对应的训练样本的特征确定的,因此,当媒体特征值与兴趣特征值的差值较小时,表明用户操作的多媒体内容与兴趣点对应的训练样本比较接近,从13而实现根据用户操作的多媒体内容较准确地确定出用户的兴趣点。通过根据本发明提供的上述方法对用户所操作的多媒体内容的长期跟踪分析,记录并不断更新用户兴趣点历史记录,可以较准确地确定出用户的兴趣爱好。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。权利要求一种用户兴趣点确定方法,其特征在于,包括根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值;根据所述多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与所述媒体特征值之间的差值;按照所述差值从小到大的顺序,选取一个或一个以上的对应兴趣点确定为所述用户的兴趣点;其中,所述媒体兴趣类聚空间是针对每一种多媒体类型分别预先生成的;所述媒体兴趣类聚空间中包含预先设置的兴趣点,每一个所述兴趣点对应的兴趣特征值由选取的与所述兴趣点对应的训练样本的特征确定。2.如权利要求1所述的方法,其特征在于,所述媒体兴趣类聚空间是一个多维的向量空间;所述媒体特征值以媒体特征向量表示;所述兴趣特征值以兴趣特征向量表示;所述计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与所述媒体特征值之间的差值,包括计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征向量与所述媒体特征向量之间的向量差值。3.如权利要求2所述的方法,其特征在于,所述媒体特征向量和兴趣特征向量采用扩展标识语言XML标识。4.如权利要求2所述的方法,其特征在于,生成所述媒体兴趣类聚空间的具体方法为设置一个以上兴趣点;为每一个兴趣点选取一个或一个以上对应的训练样本;提取每一个兴趣点对应的训练样本特征,生成与每一个兴趣点对应的兴趣特征向量;由所述一个以上兴趣点对应的兴趣特征向量,生成所述媒体兴趣类聚空间。5.如权利要求4所述的方法,其特征在于,一个兴趣点对应一个或一个以上兴趣特征向量。6.如权利要求l-5任一所述的方法,其特征在于,还包括存储多媒体内容的内容标识与兴趣点的对应关系;所述内容标识是根据多媒体内容的内容数据按照设定的标识生成策略生成的,所述对应关系的初始记录包括根据所述训练样本的多媒体内容的内容数据生成的内容标识与对应兴趣点的对应关系;计算所述差值之前进一步包括根据用户操作的多媒体内容,按照所述设定的标识生成策略,生成用户操作的多媒体内容的内容标识;并与存储的所述对应关系中的内容标识匹配;当匹配到相同的内容标识时,根据存储的所述对应关系,将与该内容标识对应的兴趣点确定为所述用户的兴趣点;当未匹配到相同的内容标识时,计算所述差值,并按照所述差值从小到大的顺序,选取一个或一个以上的对应兴趣点确定为所述用户的兴趣点;以及在所述对应关系中增加本次生成的所述用户操作的多媒体内容的内容标识与本次选取的对应兴趣点的对应关系记录。7.—种用户兴趣点确定装置,其特征在于,包括媒体特征确定模块,用于根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值;类聚空间确定模块,用于根据所述多媒体内容所属多媒体类型,确定对应的媒体兴趣类聚空间;兴趣点确定模块,用于计算所述媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与所述媒体特征值之间的差值;按照所述差值从小到大的顺序,选取一个或以上的对应兴趣点确定为所述用户的兴趣点;类聚空间生成存储模块,用于针对每一种多媒体类型分别生成对应的媒体兴趣类聚空间并存储;所述媒体兴趣类聚空间中包含预先设置的兴趣点,每一个所述兴趣点对应的兴趣特征值由选取的与所述兴趣点对应的训练样本的特征确定。8.如权利要求7所述的装置,其特征在于,所述类聚空间生成存储模块,包括设置子模块,用于设置一个以上兴趣点;并为每一个兴趣点选取一个或一个以上对应的训练样本;特征提取子模块,用于提取每一个兴趣点对应的训练样本的特征,生成与每一个兴趣点对应的兴趣特征向量;生成子模块,用于保存所述一个以上兴趣点对应的兴趣特征向量,生成所述媒体兴趣类聚空间。9.如权利要求8所述的装置,其特征在于,还包括对应关系存储更新模块,用于存储多媒体内容的内容标识与兴趣点的对应关系;所述内容标识是根据多媒体内容的内容数据按照设定的标识生成策略生成的,所述对应关系的初始记录包括根据所述训练样本的多媒体内容的内容数据生成的内容标识与对应兴趣点的对应关系;以及存储根据用户操作的多媒体内容生成的内容标识与选取的对应兴趣点的对应关系记录。10.如权利要求9所述的装置,其特征在于,所述兴趣点确定模块,具体包括内容标识生成子模块,根据用户操作的多媒体内容,按照所述设定的标识生成策略,生成用户操作的多媒体内容的内容标识;匹配子模块,用于将生成的所述用户操作的多媒体内容的内容标识,与所述对应关系存储更新模块中存储的内容标识匹配;并输出匹配结果;确定子模块,用于当匹配结果为匹配到相同的内容标识时,根据所述对应关系存储更新模块中存储的对应关系,将与该内容标识对应的兴趣点确定为所述用户的兴趣点;以及当匹配结果为未匹配到相同的内容标识时,计算所述差值,并按照所述差值从小到大的顺序,选取一个或以上的对应兴趣点确定为所述用户的兴趣点。11.如权利要求7-9任一项所述的装置,其特征在于,所述装置各模块设置在网络侧服务器中;或者所述装置的媒体特征确定模块设置在用户客户端中,其余各模块设置在网络侧服务器中;所述用户客户端还发送所述媒体特征值,或者所述媒体特征值和内容标识给所述网络侧服务器。12.如权利要求11所述的装置,其特征在于,所述用户客户端包括用户操作事件产生器,用于产生多媒体内容操作,并存储该操作;媒体特征确定模块,用于根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值;或者用于根据用户操作的多媒体内容,确定表征所述多媒体内容特征的媒体特征值外,还按照设定的标识生成策略,根据多媒体内容数据生成用户操作的多媒体内容的内容标识;媒体特征存储模块,用于存储所述媒体特征确定模块确定出的媒体特征值;当所述媒体特征确定模块还生成所述内容标识时,还用于存储所述内容标识;媒体特征发送模块,用于发送存储的媒体特征值到网络侧服务器;或者用于发送存储的媒体特征值和内容标识到网络侧服务器。全文摘要本发明公开了一种用户兴趣点确定方法与装置,包括针对每一种多媒体类型分别生成媒体兴趣类聚空间,媒体兴趣类聚空间中的包含预先设置的若干个兴趣点,每一个兴趣点根据选取的与所述兴趣点对应的训练样本的特征确定出对应的兴趣特征值。当用户操作多媒体内容时,根据用户操作的多媒体内容,确定对应媒体特征值;通过计算媒体兴趣类聚空间中的每一个兴趣点对应的兴趣特征值与媒体特征值之间的差值;选取差值较小的一个或多个对应兴趣点确定为用户的兴趣点。采用本发明提供的用户兴趣点确定方法与装置,能实现根据用户操作的多媒体内容,较准确地确定出用户的兴趣点。文档编号H04W4/12GK101771957SQ20081024118公开日2010年7月7日申请日期2008年12月26日优先权日2008年12月26日发明者孙杰,郑于锷申请人:中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1