专利名称:根据播放列表生成用户档案的方法和装置的制作方法
技术领域:
本发明涉及一种在已获取一组播放列表的媒体装置上生成用户档案的方法。
此外,本发明的另一方面涉及推荐播放列表的生成。
本发明还涉及实现该方法的计算机系统和计算机程序产品。
另外,本发明涉及可在其上执行所述方法的媒体装置。
背景技术:
美国专利2002/0040326揭示了一种方法,它被提供用来选择下载至移动设备的分类化内容条目。该方法对在所述移动设备上呈现、播放和视觉显示的内容条目进行监视。内容条目为作为数据流可被下载至所述移动设备上的任何媒体类型(例如MP3)的条目。
现有技术中已知的方式是利用用户喜好(例如以相符用户档案的形式)来向用户推荐内容。内容可以是歌曲、电影等。所述用户喜好和用户档案为快捷的功能性条目,用来帮助用户挑选或向其推荐其喜好的内容。特别是,由于因特网、广播公司、唱片公司和电影工业提供巨大、并数量仍在增长的各种内容(例如通过因特网和MP3文件的形式),因此当在媒体播放机(例如CD播放机、收音机、个人计算机等)上以软件工具或添加功能的方式应用所述喜好和用户档案可将用户从在大量可获取内容中挑选合适媒体内容的费时工作中解脱出来,由此避免了过重的信息负担。
在先前的已知技术中,一般利用两条途径完成用户喜好的获取1)直接请求用户对内容进行评级,和/或2)观察内容的实际使用方式(例如在内容被播放时)。
但是单个播放列表可能一般只被用来表示部分兴趣,例如一个播放列表反映了对摇滚乐内容的兴趣,另一播放列表反映了对电影内容(例如歌剧)的兴趣,而还有一个截然不同的播放列表反映了对肥皂剧电视节目等的兴趣。换句话说,单个播放列表可能是不完整的并且仅片面地反映某个用户对特定内容方面的兴趣,比如,上述例子中的摇滚乐内容、歌剧电影和肥皂剧电视节目等。
由此出现的一个问题是,单个播放列表并不必然反映或者并不代表用户对各种各样内容领域(实际上被其所有人和用户喜爱)的广泛兴趣。
导致的进一步问题是对内容使用方式的观察工作是相当不可靠的,这是因为播放内容的设备一般不对实际收听和/或观看内容者进行登记;而且直接要求对正在播放的内容进行评级也给用户带来了额外的耗时负担(因为要作出评级响应)。
当前推荐器的问题(由前述实例可知)是不能有效地对用户编辑的播放列表进行分析。推荐器对于播放列表是如何由特定用户制作的不作分析。已知的推荐器对于可组合在播放列表内的单独条目进行推荐,其方式过于简单,例如取最佳的10个条目。
发明内容
因此本发明的一个目标是提供一种自动生成可靠的用户档案的方法,该用户档案包含了用户对不同播放列表类别的喜好信息。另一个目标是解决上述现有技术的问题。本发明的进一步目标是根据用户播放列表确定用户喜好。
其通过一种为给定用户在媒体装置上生成用户档案的方法(以及相应的媒体装置)实现,该媒体装置已自动获取一个第一组播放列表,其包含至少一个属于所述给定用户的播放列表,所述方法包含下列步骤-对所述第一组播放列表进行分析并且得出若干表示播放列表性质的播放列表特征;以及-根据所述经过分析的第一组播放列表和所述得出的播放列表特征生成用户档案。
按照本发明的有益实施例在从属权利要求中得到限定。
因此所生成的可靠的用户档案可以作为快捷的功能性条目使用,有助于用户在可能随后播放的喜好内容之前,选择和/或被推荐给定媒体装置上的喜好内容。
本发明的一个优点是在生成用户档案时考虑了更多的播放列表及其附加性质,从而形成和表示出更为完整的用户兴趣和更为可靠的用户档案。
本发明的一个进一步优点是使过程(即所述方法)自动化并且采用已知的信息,即已经获取的播放列表。由于用户一般花费大量的时间和精力去手工创建他们喜欢的歌曲或其它内容的播放列表,因此这些播放列表提供的喜好信息很有可能是高质量的。
此外的一个优点是所述方法可以执行在系统、媒体装置上和/或自动搜索播放列表的软件程序上。所述系统、媒体装置和/或程序可以随后对这些播放列表进行分析,从而生成所述用户档案。
所考虑的因素最好包括出现频度、播放列表的创建日期以及一个或多个播放列表中内容条目(歌曲、视频等)之间的关系。
作为一种扩展,所述系统、媒体装置和/或程序例如通过检查因特网上一个播放列表的存在,或者通过在手工创建时为播放列表加注标签,可以将手工创建的播放列表与商用播放列表(即曲目集(albums))加以区分。
本发明的附加优点是在档案生成中无需用户花费力气。
本发明的附加优点是,由于信息的质量预计是高的并且高于现有技术中的播放观察记录,所以采用了已创建的播放列表。
出于在前面涉及方法时描述的相同的理由,所述计算机系统和媒体装置分别提供了相同的优点并且解决了相同的问题。
附图简述以下借助较佳实施例和附图对本发明作更为充分的阐述,其中
图1示出了在具有播放列表的媒体装置上生成用户档案的方法;以及图2示出了生成和应用用户档案的媒体装置以及计算机可读介质。
具体实施例方式
图1示出了在具有播放列表的媒体装置上生成用户档案的方法。所述媒体装置可以是自动点唱机、机顶盒、电视机、个人电脑、DVD播放机、收音机、录像机和/或可以播放来自用户档案中播放列表和/或被推荐的内容的类似装置。
播放列表是一张例如音乐曲目(歌曲)的排序表。它也可包含其它的内容,例如图片片断(视频)。
一首歌曲为元数据附属或嵌入在其中的一段音频(例如一个首部包含有歌曲信息的MP3文件)。
相应地,视频包含图像段(例如MPEG帧),相应的元数据附属或嵌入其中(例如一个首部包含各种有关该视频信息的MPEG文件)。
音乐元数据描述了歌曲的特征。典型的歌曲特征为诸如曲名和创作人员之类的列名(nominal)特征。
诸如类别、速度(tempo)和发行年份之类的分类或数字特征。
也可以采用从音频信号中自动提取的下层信号性质。
相应地,描述视频电影的视频特征的元数据同样也是可能的。
以下描述主要着力于包含歌曲排序表的播放列表;但是应当明白的是,该描述还意在涵盖包含有视频、照片等排序表的播放列表。
一个短的播放列表可以类似于
对应的序号、ID、标题、创作人员、类别、速度、发行年份等可以供包含有电影或电影片断等的播放列表详述。
在应用本方法之前,假设播放列表(即第二组播放列表)已经获取并且驻留在媒体装置内。但是这些播放列表(所述的第二组播放列表)可能已经被不同的用户获得(第一种情形),这就是设立步骤100的理由,该步骤确定属于给定单个用户的播放列表(即第一组播放列表)。如果仅有一个用户已经获得播放列表(第二中情形),则所述第一和第二组播放列表是相同的,并且步骤100不再需要。在步骤100中,两种情形下获取特定用户的播放列表的问题都得到了解决。
在步骤100中,媒体装置将在所述第二组播放列表中搜索第一组播放列表。其结果是所述第一组播放列表仅属于特定的用户。所述第一组播放列表可以文件的形式在一个或多个指定用户目录内区分开来或从这些目录内分离出来,即这些文件(播放列表)被加注标签,具有(用户的)一个性质并且/或具有其它仅指示所述特定用户的鉴别信息。
如果最初有不止一个用户获得了播放列表(第一种情形),则所述第一组播放列表将是所述第二组播放列表的子集,在所有情况下,所述第一组播放列表都仅属于特定的用户。
如上所述,当所述第二组播放列表实质上等同于所述第一组播放列表时(第二种情形),即当所述播放列表组属于同一且是唯一的创建者、所有者或用户时,步骤100不是必需的。在这种情形下,所述第一组播放列表等同于存储在媒体装置内的播放列表,因此无需处理不同的播放列表组。
在任何情形下,在获取了属于特定用户的第一组播放列表后,本方法进入步骤200。
在步骤200,对所述第一组播放列表进行分析。分析可以按照下述各种方式执行。
通常情况下,用户是否喜欢一个播放列表取决于1)播放列表内的歌曲,2)播放列表内的歌曲组合和播放列表内的变化(variation),以及3)歌曲在播放列表内的顺序。
根据播放列表内歌曲的特征,通过表示整个列表的性质而不基于单首歌曲,可以形成播放列表的特征。例如-速度差异-不同创作人员的数量还可以根据歌曲的特征来构造转变特征,从而将播放列表内出现的歌曲转变的性质表示出来。
例如对于歌曲1与歌曲2之间的转变-相对速度差[速度(歌曲2)-速度(歌曲1)]/速度(歌曲1)-类别变化如果类别(歌曲1)=类别(歌曲2),则取假值,否则取真值。
换句话说,分析结果可以导致源于播放列表的各种参数,即速度差异、不同创作人员的数量、相对的速度差、一个或多个喜好类别、类别变化的数量、取值为真值的(两首歌曲之间)特定类别变化、取值为假值的(另外的两首歌曲之间)类别变化以及歌曲之间取值为真值和假值的类别变化的数量。
在步骤300中,生成了用户档案。它基于所述经过分析的第一组播放列表和这些播放列表的实际应用(即实际使用情况)。用户档案的生成可以下述各种方式完成。
一个或多个播放列表的用户喜好(评价)可以借助歌曲特征、播放列表特征和转变特征来表示。
在本方法当前步骤的档案生成中,用户档案比较好的是包含用户喜欢或不喜欢的歌曲、转变和播放列表的实例,并且因此由这些实例组成。一个例子为不是归属于喜好类“+”(即喜欢)就是归属于喜好类“-”(即不喜欢)。另一种方式是例如用1-5的量度值来表示喜好程度,其中1表示“非常不喜欢”而5表示“非常喜欢”。
喜好的实例从用户对播放列表所做或已做的编辑和播放操作中获得,即所述第一组播放列表及其使用时实际运用情况。
例如,播放列表的运用情况可能是在收听播放列表时跳过某首歌曲不听,这样用户实际上生成了一个持负面评价(negative)的歌曲实例(不喜欢这首歌曲),而该实例被加入用户档案。(运用和使用播放列表时)持正面评价的实例取自于用户手工创建的播放列表。这些提供了用户喜欢的歌曲和转变实例以及用户喜好的变化程度。
因此用户档案基本上包含三个集合(collection)-用户喜欢或不喜欢的歌曲的集合,-用户喜欢或不喜欢的转变的集合,以及-用户喜欢或不喜欢的播放列表的集合。
由于人们对音乐的喜好会随时间而改变,因此比较好的是加入时间戳记以便能够最终去除喜好实例。而且时间戳记在对喜好进行预测时可以用来计量实例的权重,给较早的实例较小的权重,给较近的实例较大的权重,等等。
例如歌曲实例集合的一部分可以类似于歌曲-id 喜好类 时间戳记256 +(喜欢)02-03-2003,12:10
476-(不喜欢)17-03-2003,10:31129+(喜欢) 03-04-2003,13:40所述歌曲-id对应于先前定义的“ID”。
由于特征已经归因于这三个集合中每一个的元素,因此用户的喜好可以借助于这些特征来表示(归纳),并且可以对新的播放列表作喜好预测。
根据实例的集合,例如以下述方式进行统计可以找出喜好类(持正面评价的类和持负面评价的类)的特性。
持正面评价歌曲的实例类别摇滚乐的百分比=53流行音乐的百分比=32其它音乐的百分比=15速度平均值=80,方差=32发行年份平均值=1985,方差=21等等。
对于持负面评价的歌曲实例,也有相应的类似实例。
持正面评价的转变实例类别变化取值为真值的百分比=37取值为假值的百分比=63相对速度差平均值=5,方差=0.5等等。
相应地,对于持负面评价的转变实例,也有类似的实例。
持正面评价的播放列表实例不同创作人员的数量平均值=10,方差=7速度变化平均值=20,方差=14等等。
对于持负面评价的转变实例,也有相应的类似实例。
这样,用户档案包含了播放列表中属于分类性质的歌曲元数据的计数、总和等和/或百分比,以及播放列表中属于数字性质的歌曲元数据的平均值和/或方差。
而且可以采用概率方法替代上述方式或连同上述方式使用,此时正在进行评估的播放列表特征值与实例集合中出现的特征值进行比较。例如,假设用户档案内所有持正面评价的歌曲实例对应于1980年代发行的歌曲。如果新播放列表内有一首发行年份为1958年的歌曲,则考虑到该特征,这首歌曲几乎不可能会被优先选择。1975年的歌曲更有可能被优先选择而1985年的歌曲非常有可能。
可以为一个播放列表内所有歌曲和转变的所有特征以及播放列表的特征确定喜好概率(可能性)。所有这些概率的(例如带权重)乘积给出了被用户喜好的播放列表的总体概率。这种概率可以用作取值范围在0-1之间的喜好预测。为了构造推荐的播放列表,尝试构造一个使该预测最大的播放列表。另一种替换方式是采用贝叶斯分析和推荐方法。贝叶斯分析/逻辑涉及利用先前的概率/结果来(更好地)预测未来的概率/结果。
其它根据实例集合内找到的特征值创建播放列表的喜好预测的(非概率)方法也是可行的。而且对于所包含的各种特征可以作各种选择。
这些特性构成精简的用户档案,其将在下一步骤内被用来预测用户对新的播放列表的喜好并生成新的推荐播放列表。类似的论述,与包含歌曲的播放列表相同,也可适用于包含视频、视频片断或其它可播放内容条目的播放列表,即用户档案也可基于对包含视频(视频片断或其它可播放内容条目)的排序表的播放列表的分析,并随后生成用户档案(关于视频的等)。
上述步骤的结果是建立起用户档案,并且随后可以作为快捷的功能性条目(在所述的媒体装置中)适用于用户,从而选择或者向他或她推荐符合他们偏好的内容条目(如果存在的话)。用户档案由此使用户得以摆脱从大量可获取内容(例如存在于或来自因特网、先前存储在用户的媒体装置内、来自诸如CD、DVD等的计算机可读介质)中挑选合适内容条目的工作。
换句话说,当可用内容条目与根据用户档案推荐的内容条目匹配良好时,可以根据自动生成的用户档案进行内容条目的推荐,例如相同或最相似的内容条目(譬如具有相同或最相似的类别、速度、持正面评价的喜好类等)在提供于所述媒体装置上时应当予以推荐。
本方法可另外包含步骤400。
在步骤400中,根据所述用户档案生成了推荐的播放列表。
如上所述,所述特性构成精简的用户档案。这随后可根据本发明的方式使用以预测用户对新的播放列表的喜好并生成新的推荐播放列表。
相应地,诸如速度变化、相对速度变化、平均值、标准偏差之类的统计方法可应用于构造或生成一个或多个步骤300中用户生成档案中的推荐播放列表。结果是,新生成的播放列表可能具有与步骤100-300中所指的播放列表相同的结构。这样,就可以将多变性和一致性考虑进去。
此外,其它方面可以作为考虑,特别是播放列表内条目之间的转变。
换句话说,在当前步骤中,按照本发明的一个方面,通过对用户喜好(喜欢、不喜欢等)的了解,由此,作为最终结果,生成了推荐的播放列表。
图2示出了生成和运用用户档案的媒体装置以及计算机可读介质。媒体装置具体实现了图1所示的方法。标号20表示媒体装置,而标号23表示计算机可读介质,由程序代码组成的所述方法可以存储在其上。
媒体装置(20)例如可以是自动点唱机、机顶盒、电视机、个人电脑、硬盘记录器(例如便携式的)、固态器件、DVD播放机、收音机、录像机或类似,这里的媒体装置(20)可以充分利用按照本发明所生成的用户档案和新的播放列表。接下来所示的为提供例如视频或歌曲等内容条目的媒体提供商(21)。标号21可表示不止一个的媒体提供商。内容条目可以是象电视节目那样的直播内容、可供点播收看的视频、因特网上交互式直播电视、因特网电视、因特网网站、电影、无线广播(例如歌曲)或其它可以观看和/或收听的内容,并且该内容随后可以存储起来,也就是录制在适于以后在所述媒体装置上播放和演示的数据介质上。用更专业的术语描述,内容条目包含,例如,一个或多个选自下组的条目-包含图片和声音信号的DVD MPBG程序流;-包含图片和声音信号的蓝光MPEG传输流;-CD声音信号;-给定的数字音频格式(例如MP3、WMA、实时音频(Real Audio)、WAV等);-给定的数字电影格式(例如DivX、DVD/MPEG2、Avi、wmf、MOV、实时视频(Real Video)等);-给定的图片格式(例如JPEG、GIF、BMP、TIFF等);和/或-任何能够使装置输出图片和/或声音信号的格式,例如G72x、aiff、real。
内容条目一般包含在文件中并且更多的内容条目可以列在例如播放列表内。
标号24表示媒体装置(20)的一个或多个CPU或处理能力。按照本发明,CPU可用修改或检索到的播放列表和一个生成的用户档案来更新数据库或存储器(25)以供后续检索和使用。
通常情况下,媒体装置(20)可以是呈现(即播放和/或显示)所述内容条目的装置。按照本发明,内容条目可以在播放之前从播放列表或生成的用户档案中选择或加以推荐。
媒体装置(20)可进一步包含与CPU(24)相连的输入装置(26),用于接受/登记各种用户输入的响应。输入装置(26)例如可以是键盘、鼠标、遥控器、在屏幕上点击的交互式菜单、操纵杆、借助图形用户接口进行选择的简单的按钮等。输入装置(26)例如用来编辑各种播放列表,在手工创建时标注播放列表,从播放列表初始化播放或者播放按照本发明方式生成的用户档案所建议和/或推荐的内容。
此外,用户输入可以用来检索和/或操作播放列表和/或按照本发明生成的用户档案。
标号22表示一个或多个媒体装置的用户。该用户或该些用户可在选择时观看和/或收听所推荐的内容条目。
标号27示出了接至媒体提供方(21)的用户连接点。它可以是电视机或收音机的天线输出口、调制解调器或ADSL连接或接至因特网的类似连接、卫星接收机的天线输出口、接至电视机或录像机的SCART连接、蓝牙或红外线接口等。从所述用户连接点可以进一步检索到预定义或商业性的的播放列表。
计算机可读介质可以是磁带、光盘、数字多用途光盘(DVD)、光盘(可记录或可刻录CD)、微型光盘、硬盘、软盘、智能卡、PCMCIA卡等。
在权利要求书中,置于括号内的任何附注标记不应构成对权利要求的限制。动词“包含(comprise)”及其词形变化的使用并未将那些在权利要求中未提及的要素或步骤的存在排除在外。要素或步骤之前所用的不定冠词“一个”并未将多个要素或步骤的存在排除在外。
本发明可以借助包含几个种类不同的要素的硬件和合适编程的计算机实现。在那些将若干装置(means)列举出来的装置类(device)权利要求中,几个装置(means)可由硬件的一个且是同一个单元(item)实现。仅根据某些技术措施在相互不同的从属权利要求中被列举这样一个事实,并不能表明没有可能利用这些技术措施的组合来获益。
权利要求
1.一种在媒体装置(20)上为给定用户(22)生成用户档案的方法,该媒体装置已自动获取一个第一组播放列表,其包含至少一个属于所述给定用户(22)的播放列表,所述方法包含下列步骤-对所述第一组播放列表进行分析(200)并且得出多个表示播放列表性质的播放列表特征;以及-根据所述经过分析的第一组播放列表和所述得出的播放列表特征生成(300)用户档案。
2.如权利要求1所述的方法,其中所述方法进一步包含的步骤是,从一个第二组播放列表中选择所述第一组播放列表,该第二组播放列表包含至少一个属于用户(22)的播放列表。
3.如权利要求1或2所述的方法,其中所述多个播放列表特征包含一个或多个下列特征-一个表示速度差异的特征;-一个表示不同创作人员数量的特征;-一个表示相对速度差的特征;-一个或多个表示一个或多个喜好类别的特征;-一个表示若干类别变化的特征;-一个表示某一特定类别变化存在与否的特征;以及-一个表示歌曲之间类别变化取真值和假值数量的特征。
4.如权利要求1-3所述的方法,其中,所述方法进一步包含的步骤是-根据所述用户档案生成(400)至少一个推荐播放列表。
5.如权利要求4所述的方法,其中,采用了贝叶斯分析和推荐方法。
6.如权利要求1-5所述的方法,其特征在于,所述第一组播放列表的每个播放列表包含一个诸如歌曲或视频之类内容条目的排序表,所述内容条目包含元数据。
7.如权利要求6所述的方法,其特征在于,所述元数据包含标题、创造人员、类别、速度和发行年份。
8.如权利要求1-7中任意一项所述的方法,其特征在于,所述生成的用户档案包含所述用户喜欢和/或不喜欢的诸如歌曲或视频之类内容条目实例的集合、所述用户喜欢和/或不喜欢的转变的集合以及所述用户喜欢和/或不喜欢的播放列表的集合。
9.如权利要求1-8中任意一项所述的方法,其特征在于,所述用户档案进一步包含播放列表中属于分类性质的内容元数据的计数和/或百分比,以及播放列表中属于数字性质的内容元数据的平均值和/或方差。
10.如权利要求1-9中任意一项所述的方法,其特征在于,所述媒体装置为自动点唱机、机顶盒、电视机、个人电脑、DVD播放机、硬盘记录器(便携式)、固态器件、收音机或录像机。
11.如权利要求1-10中任意一项所述的方法,其特征在于,每个内容条目包含一个或多个选自下组的条目-一个包含图片和声音信号的DVD MPEG程序流;-一个包含图片和声音信号的蓝光MPEG传输流;-一个CD声音信号;-一个给定的数字音频格式(例如MP3、WMA、实时音频(RealAudio)、WAV等);-一个给定的数字电影格式(例如DivX、DVD/MPEG2、Avi、wmf、MOV、实时视频(Real Video)等);-一个给定的图片格式(例如JPEG、GIF、BMP、TIFF等);和/或-任何能够使所述媒体装置输出图片和/或声音信号的格式,例如G72x、aiff、real。
12.一种生成用户档案的媒体装置(20),该媒体装置(20)已自动获取一个第一组播放列表,其包含至少一个属于所述给定用户(22)的播放列表,所述媒体装置(20)包含-用于对所述第一组播放列表进行分析(200)并且得出多个表示整个播放列表性质的播放列表特征的装置(24);以及-用于根据所述经过分析的第一组播放列表和所述得出的播放列表特征生成(300)用户档案的装置(24)。
13.一种计算机系统,其实现了如权利要求1-11中任意一项所述的方法。
14.一种包含存储于一个计算机可读介质(23)上的程序代码的计算机程序产品,当该计算机程序在计算机上运行时,该程序代码用于实现如权利要求1-11中任意一项所述的方法。
全文摘要
本发明涉及一种根据播放列表生成用户档案的方法(以及相应的装置),其中该用户档案根据用户自己的播放列表以及由此得到的特性生成。这样,在用户档案生成时将更多的播放列表考虑进来,从而生成更为可靠的用户档案。此外,该过程(即所述方法)是自动完成的并且利用的是已知信息。被考虑的因素是发生频度、播放列表的创建日期和一个或多个播放列表中内容条目(歌曲、视频等)之间的关系。
文档编号G06Q30/00GK1799261SQ200480015374
公开日2006年7月5日 申请日期2004年5月26日 优先权日2003年6月3日
发明者M·P·博拉恩德, W·F·J·维哈伊格, A·M·德穆伊 申请人:皇家飞利浦电子股份有限公司