专利名称:视听习惯学习装置的制作方法
视听习惯学习装置
背景技术:
近年,地面数字广播、BS数字广播、CS数字广播、按次计费(PPV) 广播、视频点播(VOD)、因特网上的内容等能够在电视上视听的频道、 内容等在增加。随之,查找想看的节目、切换频道的操作变得烦杂。
此外,录像播放机因记录容量的扩大,能够录制大量的节目。为了从 大量录制的节目中查找想视听的节目,需要使用页面的切换、分类或者搜 索功能,对用户(视听者)来说成为需要花费时间的麻烦的操作。
这样,随着多频道化、设备的高性能化等,设备的操作方法变得复杂。 因此,学习用户的行为,推测用户的意图从而适宜地进行工作的系统的重 要性正在增加。
在数字电视、录像播放机等中,已知有这样的系统根据广播中或者 录像完成的内容的播放历史,学习用户的视听习惯,并推荐适宜的内容。 例如在专利文献l中,提出了这样的系统记录播放录像完成的电视节目 时的星期、时间、类型从而累积用户的播放习惯,推荐适合于当前的星期、 时间等的类型的节目视听。
[专利文献l特开2006-229707号/>才艮
第1个问题是,在视听习惯的学习上要花费长时间。在学习用户的视 听习惯并推荐适宜的内容的系统中,如果用户开始使用设备而未发现立竿 见影的效果,则很可能不会继续使用该系统。因此,需要在短时间内学习用户的视听习惯、播放习惯等。
但是,在根据星期和时间段的组合学习视听习惯的情况下,需要长时 间的学习。例如,在学习星期日的晚上的视听类型习惯的情况下, 一般是 对在星期日的晚上视听的节目类型的频率进行计数。因为星期日的晚上在 1个月中只有四次或者五次,所以即使该方法连续获取一个月间数据,也 只能得到几次的操作历史。因而,即使连续获取一个月间数据,作为用于 生成具有信赖性的视听习惯模型的数据数量来说,也很难说是充分的。
在使用统计的学习方法的情况下,如果频率少,则不能保证概率值的 统计的准确性。此外,如果为了更好地掌握视听习惯,例如,将晚上的时 间段细分为1小时单位等进行离散化,则频率进一步M。因此,为了得 到具有信赖性的概率值,需要进一步长时间的学习。
第二个问题是频繁地切换频道的跳过广告节目的处理。在录像播放机 的情况下,频繁地切换所播放的录像节目的现象少,能够比较容易地获得 与视听时间段有关的信息。但是,在接收电视广播的情况下,跳过广告节 目的用户非常多。如果因跳过广告节目而频繁地切换视听节目,则学习视
听习惯是困难的。因而,考虑这样的方法在视听时间上设置阈值,除去 认为是跳过广告节目的频道操作。例如,是这样的方法小于等于3分钟 的频道切换看作是跳过广告节目而不看作是进行了^f见听。
但是,如果在跳过广告节目判定上设定阈值,则在小于等于阔值的时 间内播放的节目将全部被除去。即,如果例如将阈值设定为3分钟,则即 使假定用户不是跳过广告节目而视听了小于等于3分钟的节目,系统侧也 判定为未进行视听,从而不能学习适宜的视听习惯。
第三个问题是视听时间的离散化。在统计的学习方法中,大多将取连 续值的属性离散化。例如,因为时刻这一属性取连续值,所以采取如0点 到1点(0-1) 、 1点到2点(1-2 ) 、 2点到3点(2-3 )那样以1个小时为 单位分割为24个值等的方法。
在学习视听习惯时,使用视听时刻。例如,在某一用户从21点到22 点视听了电影的情况下,将该操作历史数据分配到21-22,并对频率进行计数。但是,在某一用户从21点30分到23点30分^L听了电影的情况下, 需要预先明确怎样进行离散化。
发明内容
因而,本发明的目的在于解决跳过广告节目和视听时间离散化的问题, 能够在短时间内学习视听者的视听习惯。
为了解决上述问题,本发明提供一种视听习惯学习装置,其对视听者 的视听习惯进行学习,该视听者经由设备视听具有影像以及声音的至少一 种的节目,其特征在于,该装置具有视听历史获取部,其获取表示上述
的属性的视听记录;视听历史分割部,其按以单位时间离散化了的每一离 散化时刻分割上述视听记录;视听历史复制部,其以比上述单位时间短的 粒度对分割后的上述视听记录的各个所表示的视听时间进行离散化,从而 求出离散化视听时间;视听习惯存储部,其用将上述视听时刻的属性以及 上述节目的属性作为概率变量的贝叶斯网络将上述视听习惯模型化,并存 储该贝叶斯网络的带条件概率表;视听习惯更新部,其将分割后的上述视 听记录的各个的上述离散化视听时间作为视听频率,更新上述带条件概率 表。
如果采用本发明,则能够在短时间内学习视听者的视听习惯。
图l是本发明的视听习惯学习装置的一种实施方式的方框图; 图2是表示本实施方式中的视听历史数据的例子的表; 图3是表示本实施方式中的将视听者的视听习惯模型化而成的贝叶斯 网络的图结构;
图4是本实施方式的视听习惯学习方法的流程图5是跨多个离散化时刻的视听记录的例子;
图6是本实施方式中将图5所示的视听记录分割了的例子;图7是本实施方式中按每一离散化时刻分割视听记录而得到的视听历 史数据的例子;
图8是本实施方式中的频道节点的带条件频率表的例子; 图9是本实施方式中的类型节点的带条件频率表的例子; 图IO是本实施方式中的频道节点的带条件概率表的例子;以及 图ll是本实施方式中的类型节点的带条件概率表的例子。 符号说明
10:遥控器,11:电视机,12: EPG存储部,13:视听历史获取部, 14:视听历史存储部,15:视听习惯学习部,16:视听习惯存储部,30: 星期节点,31:时刻节点,32:频道节点,33:类型节点,34、 35、 36、 37、 38:边,50:初始化部,51: -观听历史分割部,52: -f见听时刻离散化 部,53:视听历史复制部,54:视听历史计数部,55:概率变换部,56: 视听习惯更新部,91:视听对象设备,92:视听习惯学习装置。
具体实施例方式
参照
本发明的视听习惯学习装置的实施方式。而且,对于相 同或者相类的结构赋予相同的标号并省略重复的说明。
图l是本发明的视听习惯学习装置的一种实施方式的方框图。
视听习惯学习装置92是学习视听者(用户)经由视听对象设备91视 听节目的倾向的装置,其中节目包含影像以及声音的至少一种。视听对象 设备91例如具有用遥控器10操作的电视机11。而且,视听对象设备91 的频道的变换等操作,不仅可以用遥控器IO,而且也可以用安装在电视机 11上的频道切换按钮等进行。
在此,所谓节目,不仅是使用电波等广播的所谓的电视节目,而且是 视频点播、因特网上的内容等包含影像以及声音的至少一方的信息。此夕卜, 视听对象设备91,如果是输出节目的设备,则除了电视机ll夕卜,也可以 包含录像播放机、有线电视的机顶盒等。
此外,在电视机11上,例如连接有EPG存储部12。所谓EPG存储部12,是存储电^L节目信息(EPG: Electronic Program Guide,电子节 目指南)的数据库。在EPG中,包含节目的广播日期、广播台、开始时间、 广播时间、类型、标题、演员、节目详细信息等。在以下的说明中,特别 着眼于广播台(频道)和类型信息。
视听习惯学习装置92具有视听历史获取部13、视听习惯存储部16以 及视听习惯学习部15。
视听历史获取部13例如与电视机11连接,获取视听记录,该视听记 录表示视听者视听的节目、即视听对象设备91输出的节目的属性及视听开 始时刻以及^L听结束时刻。所谓节目的属性,是表示该节目所具有的特征 的信息,例如是频道、类型等。节目的类型,例如从EPG存储部12获得。
图2是表示本实施方式中的视听历史数据的例子的表。
视听历史数据例如是由视听的日期、星期、视听开始时刻(进入时刻)、 视听结束时刻(退出时刻)、频道、类型、标题构成的视听记录的集合。 所谓进入时刻,表示切换频道从而来到该数据的频道的时刻,所谓退出时 刻,表示从该数据的频道离开的时刻。例如,第l行的视听记录表示这样 的含义在2007年7月31日星期二的19点8分54秒切换至CH1从而开 始视听纪录片的标题A,在19点10分51秒切换频道从而转移到第2行的 CH2。
视听历史获取部13捕获例如从遥控器10输入的频道切换信号,并获 得视听历史数据。视听历史获取部13所获得的视听历史数据也可以存储在 视听历史存储部14中。
视听习惯存储部16用将视听时刻的属性以及节目的属性作为概率变 量的贝叶斯网络将视听习惯模型化,存储该贝叶斯网络的带条件概率表。 此外,视听习惯存储部16存储与该带条件概率表对应的带条件频率表。
图3是表示本实施方式中的将视听者的视听习惯模型化而成的贝叶斯 网络的图结构。
所谓贝叶斯网络,是利用图结构表示多个概率变量间的定性的依赖关 系,并且用带条件概率表表示各个变量间的定量的关系的概率模型。贝叶斯网络由表示概率变量的节点和表示概率变量间的因果关系的边构成。在
图3中,星期节点30、时刻节点31、频道节点32、类型节点33分别是概 率变量,连接各个节点间的箭头34至38是边。
各节点具有离散化的值。例如星期节点30表示视听了节目的星期,取 星期日、星期一、星期二、星期三、星期四、星期五、星期六中的任意一 个值。时刻节点31表示进行了视听的离散化时刻。虽然时刻原本是连续值, 但其被以单位时间离散化为离散化时刻。在本实施方式中,时刻例如以1
个小时为单位时间被离散化。离散化了的视听时刻取O-l、 1-2、 2-3.....
23-24中的任意一个值。在此,设定0-1表示0点到1点。
频道节点32表示视听过的频道。虽然由于可以视听的频道因电视机 ll的种类等不同而不同,所以频道节点32可以取的值会变化,但是,在 此设定如CH1、 CH2那样来简单表示。类型节点33表示视听节目的类型, 设定其取新闻、体育、戏剧、音乐、综艺、电影、动画片、纪录片、趣味、 信息、剧场、福利、其他中的任意一个值。而且,这样的离散化是一例, 而并不限于此。
边表示节点间的因果关系。从星期节点30至时刻节点31的边34,表 示因星期的不同视听时刻发生变化。例如,能够学习平时经常在从公司回 家后看电视,但星期六经常视听深夜节目这样的习惯。
从星期节点30和时刻节点31至频道节点32的边35、 36,表示在星 期和时刻的组合下所视听的频道不同。例如,能够学习平时经常在早上6 点到8点视听CH1这样与视听频道有关的习惯。从星期节点30和时刻节 点31至类型节点33的边37、 38,表示在星期和时刻的组合下所视听的类 型不同。例如,能够学习经常在星期日从21点开始视听电影这样与视听类 型有关的习惯。
在此,将根据所获得的视听历史数据求出各节点的带条件概率表的情 况称为视听习惯的学习。
视听习惯学习部15具有视听历史分割部51、视听时刻离散化部52、 视听历史复制部53以及视听习惯更新部56。视听历史分割部51按照以单位时间离散化而得到的每一离散化时刻,分割视听记录。视听时刻离散化
部52对分割后的各视听记录的视听时刻进行离散化。视听历史复制部53 以比单位时间更短的粒度,对分割后的视听记录的各个所表示的视听时间 进行离散化,从而求出离散化视听时间。视听习惯更新部56以分割后的视 听记录的各个的离散化视听时间为视听频率,更新带条件概率表。视听习 惯更新部56具有更新带条件频率表的视听历史计数部54以及更新带条件 频率表的概率变换部55。
此外,视听习惯学习装置92也可以具有对视听历史数据、带条件概率 表等进行初始化的初始化部50。
以下,说明使用了该视听习惯学习装置92的视听习惯学习方法。
图4是本实施方式的视听习惯学习方法的流程图。
首先,初始化部50构建视听习惯的贝叶斯网络模型(步骤S1),对 存储在视听习惯存储部16中的带条件概率表以及带条件频率表进行初始 化(步骤S2 )。步骤Sl以及步骤S2例如在碎见听习惯学习装置92的出厂 时、接收到用户的初始化请求时等执行。
接着,确认在视听历史存储部14中是否有未学习的视听记录(步骤 S3)。在有未学习的视听记录的情况下,执行步骤S4至步骤S8的处理。 如果没有未学习的视听记录,则等待,直到被通知未学习的视听历史数据 为止。而且,也可以例如在每次经过规定的时间时执行步骤S4至步骤S8, 从而一并处理累积在视听历史存储部14中的视听历史数据。
在有未学习的视听记录的情况下,视听历史分割部51按每一离散化时 刻分割一见听记录(步骤S4)。
图5是跨多个离散化时刻的视听记录的例子。图6是本实施方式中对 图5所示的视听记录进行了分割的例子。
在存在图5那样跨多个离散化时刻的视听记录的情况下,视听历史分 割部51,如图6所示那样将其分割为多个视听记录。在该例子中,将从20 点58分到22点10分视听过的这一视听记录,按每一离散化时刻分割为从 20点58分到21点、从21点到22点、从22点到22点10分的3个视听记录。所分割的只是进入时刻和退出时刻,其他的属性相同。
图7是本实施方式中按每一离散化时刻分割视听记录而得到的视听历 史数据的例子。
接着,对于分割后的各视听记录进行视听时刻的离散化(步骤S5)。 例如,在图7的第1行的视听记录的情况下,因为视听时刻是从21点到 21点15分,所以离散化为21-22。如图7所示,在分割为多个视听记录的 情况下,也同样地进行离散化。离散化后的值用作为离散化时刻这一属性。 视听时刻的离散化,例如由在视听习惯学习部92中设置的视听时刻离散化 部52进行。因为视听记录按每一离散化时刻被进行了分割,所以各个视听 记录能够唯一地确定取哪个离散化时刻。
接着,视听历史复制部53,对于每一视听记录,用某一粒度对视听时 间进行离散化从而求出离散化视听时间(步骤S6)。该粒度是比离散化时 刻的单位时间短的时间,例如是1分钟。而且,在此,虽然是以分钟为单 位进行的离散化,但以秒为单位进行离散化也可以。
在步骤S6,视听历史复制部53,以视听记录与该离散化视听时间的值 成为相等的方式复制视听记录。例如在图7的第1行的视听记录的情况下, 因为从21点到21点15分进行了 15分钟的视听,所以将该视听记录1个 复制为15个。在第2行的视听记录的情况下,因为从21点到22点进行了 60分钟的视听,所以将该视听记录1个复制为60个。如果其他的数据也 同样地进行复制,则能够从原来的IO个数据得到140个视听记录。通过这 样复制视听记录,学习数据的数量变多,从带条件频率表计算出的带条件 概率值的可靠性升高。
接着,使用复制后的全部的视听记录,视听频率计数部54更新带条件 频率表(步骤S7 )。
图8是本实施方式中的频道节点的带条件频率表的例子。图9是本实 施方式中的类型节点的带条件频率表的例子。而且,在图8以及图9中, 仅示出了星期日的从21点到22点的时间段中的频率。
带条件频率表表示在将父节点作为条件时子节点的各个可以取得的值的频率。例如表示在频道节点32具有图8所表示的带条件频率表的情况下, 在星期日的21点到22点视听CH1的频率是31,视听CH2的频率是105, 视听CH3的频率是4。
在步骤S7,视听频率计数部54通过对适合于父节点的条件的视听记 录进行计数,来更新子节点的各个可以取得的值。因为视听记录在步骤S6 以成为与离散化视听时间的数量相等的方式被进行了复制,所以对其累计 以比离散化时刻的单位时间短的粒度被离散化了的视听频率。
而且,在步骤S7,如果能够累计离散化视听时间的值从而对视听频率 进行计数,则不需要实际地在存储器上等复制视听记录。例如,可以预先 对于各视听记录,保存图7所示的复制数的值,并在步骤S7仅用该复制数 的值累计视听频率。
接着,概率变换部55使用带条件频率表更新带条件概率表(步骤S8 )。
图IO是本实施方式中的频道节点的带条件概率表的例子。图11是本 实施方式中的类型节点的带条件概率表的例子。而且,在图10以及图11 中,仅示出了星期日的从21点到22点的时间段中的概率。
带条件概率表表示在将父节点作为条件时子节点的各个可以取得的值 的频率。例如,表示在频道节点32具有图IO所表示的带条件概率表的情 况下,在星期日的21点到22点视听CH1的概率是22%,视听CH2的概 率是75%,视听CH3的概率是3。/。。
在步骤S8,概率变换部55通过各个子节点的频率除以适合于父节点 的条件的子节点的频率的总和,求得各个子节点的带条件概率,并更新带 条件概率表。例如,在图9的带条件频率表的情况下,因为星期日的从21 点到22点期间的视听频率的总和是31+105+4=140,所以求得CH1的概率 为31 + 140=22%。将该值作为星期日的从21点到22点的CH1的视听概 率,更新图IO的带条件概率表。
如果不对视听频率进行细粒度化来进行计数,则例如从图7所示的视 听历史数据,仅能得到星期日的21点到22点的时间段中的CH1的频率是 5, CH2的频率是2, CH3的频率是3,合计10个计数。此外,如果不对视听频率进行细粒度化来对视听频率进行计数,则例
如根据图7所示的视听历史数据,星期日的21点到22点的时间段中的CH1 的视听概率成为50°/。, CH2的视听概率成为20%, CH3的视听概率成为 30%。但是,CH1的总视听时间是31分钟,CH2的总视听时间是105分 钟,CH3的总视听时间是4分钟。因而,如果不对视听频率进行细粒度化 来对视听频率进行计数,则存在对总视听时间短的频道的视听概率给予高 的评价的情况。特别是在视听者进行在短时间内切换频道的跳过广告节目 的情况下,这样的问题显著出现。另一方面,在本实施方式中,因为能够 得到与总视听时间对应的视听概率,所以因跳过广告节目等进行不正确的 学习的可能性小。
因而,能够根据短时间得到的视听历史数据得到可靠性高的视听习惯。 即,如果使用本实施方式的视听习惯学习装置92,则能够在短时间内学习 视听者的视听习惯。
而且,以上的说明是简单的示例,本发明并不限于上述的实施方式, 而能够以各种方式实施。例如,利用带条件频率表表示的视听频率,因为 还表示相对的概率,所以也可以将上述实施方式中的带条件频率表作为带 条件概率表处理。
权利要求
1. 一种视听习惯学习装置,其对视听者的视听习惯进行学习,该视听者经由设备视听具有影像以及声音的至少一种的节目,其特征在于,该装置具有视听历史获取部,其获取表示上述视听者视听上述节目的开始时刻以及结束时刻的视听时刻以及表示该节目的属性的视听记录;视听历史分割部,其按以单位时间离散化了的每一离散化时刻分割上述视听记录;视听历史复制部,其以比上述单位时间短的粒度对分割后的上述视听记录的各个所表示的视听时间进行离散化,从而求出离散化视听时间;视听习惯存储部,其用将上述视听时刻以及上述节目的属性作为概率变量的贝叶斯网络将上述视听习惯模型化,并存储该贝叶斯网络的带条件概率表;以及视听习惯更新部,其将分割后的上述视听记录的各个的上述离散化视听时间作为视听频率,更新上述带条件概率表。
2. 根据权利要求l所述的视听习惯学习装置,其特征在于上述单位 时间是1小时,上述粒度是l分钟。
3. 根据权利要求1或2所述的视听习惯学习装置,其特征在于 上述视听习惯存储部保存与上述带条件概率表对应的带条件频率表; 上述视听习惯更新部具有用上述视听频率更新带条件频率表的视听历
全文摘要
本发明能够在短时间内学习视听习惯。在视听习惯学习装置(92)中,具备视听历史获取部(13),其获取表示视听者经由电视机(11)等设备(91)视听了节目的开始时刻以及结束时刻的视听时刻以及表示该节目的属性的视听记录;视听历史分割部(51),其按以单位时间离散化了的每一离散化时刻分割视听记录;视听历史复制部(53),其以比单位时间短的粒度对分割后的视听记录的各个所表示的视听时间进行离散化,从而求出离散化视听时间;视听习惯存储部(16),其用将视听时刻的属性以及节目的属性作为概率变量的贝叶斯网络将视听习惯模型化,并存储该贝叶斯网络的带条件概率表;以及视听习惯更新部(56),其将分割后的视听记录的各个的离散化视听时间作为视听频率,更新带条件概率表。
文档编号H04N7/173GK101415085SQ20081016971
公开日2009年4月22日 申请日期2008年10月20日 优先权日2007年10月19日
发明者折原良平, 村上知子, 森纮一郎 申请人:株式会社东芝