专利名称:内容播放装置的制作方法
技术领域:
本发明涉及内容播放装置,并且具体地涉及使得当观看内容时能够获得更强的临场感而不妨碍观看的内容播放装置。
背景技术:
传统上,电视接收器通常是从节目的制造者到观看者的单向信息传输装置。相比之下,已经提出了 CAPTAIN系统(图文电话访问信息网络系统)以及在地面数字广播中的交互服务,作为用于制造观看者能够参与到其中的节目的框架。另一方面,近年来,网络的发展已经允许用户之间大量通信。具体地,能够打出短句的、被称作微博客(micro-blog)的通信工具导致了对具有较高即时性的通信的偏好。使用这样的装置允许用户容易地谈论关于他们在当前时刻的想法的主题,从而产生亲近感和临场感。此外,提出了一种技术,其中,用户或其他用户写的文本被叠加在通过流被分发的运动图像内容上,作为用于使用户相互进行通信的技术(例如,日本未审查专利申请公开第2008-172844号)。借助于该技术,用户输入的文本被传输到流服务器,并且该文本和其他用户书写的其他文本被叠加在正被分发的运动图像内容上。另外,存在一种技术,其中,当使用蜂窝电话观看体育赛事等节目的用户通过操作蜂窝电话来输入欢呼信息时,欢呼信息被反馈给正举行体育赛事等的会场,并且在会场播放对应于欢呼信息欢呼声(例如,日本未审查专利申请公开第2005-339479号)。借助于该技术,其他用户的欢呼信息也被反馈给观看节目的用户的蜂窝电话,所以蜂窝电话的用户也可以体验临场感。
发明内容
然而,借助于前述技术,在观看内容时获得临场感的那种动作妨碍了观看内容。例如,借助于前述交互服务,观看者仅可以做诸如针对程序中的问题从若干选项中选择答案之类的事情。这没有提供自然参与的氛围、并且观看者所得到的不比以受限的方式远程参与的感觉多多少。此外,借助于微博客的交流、以及诸如将输入文本叠加在正通过流被分发的运动图像内容上的技术,实际上用户必须已主动地输入了文本。因此,如果用户试图专注于观看内容,则打字和交流技巧会受到影响,但是如果用户试图专注于打字,则用户可能错失对观看内容的完整享受。另外,借助于用于将在蜂窝电话处输入的欢呼信息反馈到实际会场的方法,用户传输欢呼和叫声作为欢呼信息,所以用户必须有意地传输该信息,这可能干扰对于内容的专注。所希望的是能够实现在观看内容时获得的更强的临场感而不妨碍观看。因此,公开了一种用于生成关于观看者对内容的情绪反应的信息的系统。该系统可以包括观看者反应输入单元,其被配置成捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,内容数据表示至少一个内容音频或内容视频。该系统还可以包括观看者情绪分析单元,其被配置成基于本地数据来生成指示本地观看者对内容数据的情绪反应的本地观看者情绪信息。还公开了一种用于生成关于观看者对内容的情绪反应的信息的方法。该方法可以包括捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,内容数据表示至少一个内容音频或内容视频。该方法还可以包括基于本地数据来生成指示本地观看者对内容数据的情绪反应的本地观看者情绪信息。另外,公开了一种用于将内容与关于观看者对该内容的情绪反应的信息进行组合的装置。该装置可以包括观看者反应输入单元,其被配置成捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,内容数据表示至少一个内容音频或内容视频。该装置还可以包括观看者情绪分析单元,其被配置成基于本地数据来生成指示本地观看者对内容数据的情绪反应的本地观看者情绪信息。另外,该装置可以包括传输单元,其被配置成将本地观看者情绪信息传输到服务器。该装置还可以包括合成单元。合成单元可以被配置成从服务器接收组合观看者情绪信息。另外,合成单元可以被配置成基于组合观看者情绪信息来确定至少一个效果音频或效果视频。合成单元还可以被配置成将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与内容数据进行组合。还公开了一种用于将内容与关于观看者对该内容的情绪反应的信息进行组合的方法。处理器可以执行程序以使内容呈现装置执行该方法。该程序可以被存储在计算机可读介质中。该方法可以包括捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,内容数据表示至少一个内容音频或内容视频。该方法还可以包括基于本地数据来生成指示本地观看者对内容数据的情绪反应的本地观看者情绪信息。另外,该方法可以包括将本地观看者情绪信息传输到服务器。该方法还可以包括从服务器接收组合观看者情绪信息。此外,该方法可以包括基于组合观看者情绪信息来确定至少一个效果音频或效果视频。该方法还可以包以括将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与内容数据进行组合。
图1是示出了符合本发明的实施例的内容观看系统的配置的图;图2是示出了客户处理单元的配置示例的图;图3是用于描述客户装置进行的合成处理以及服务器进行的分发处理的流程图;图4是用于描述客户装置进行的观看信息生成处理以及服务器进行的合并 (consolidation)处理的流程图;并且图5是示出了计算机的配置示例的框图。
具体实施例方式
将参照附图描述本发明的实施例。内容观看系统的配置示例图1是符合本发明的实施例的内容观看系统的配置示例的图。内容观看系统11 被配置为客户装置21-1至客户装置21-N、以及连接到客户装置21-1至客户装置21-N的服务器22。例如,客户装置21-1至客户装置21-N和服务器22经由诸如因特网的网络(未示出)而彼此连接。客户装置21-1至客户装置21-N接收并播放诸如电视广播节目等的内容。注意, 在不必单独区分客户装置21-1至客户装置21-N的情况下,这些装置将被简单地统称为“客户装置21”。例如,客户装置21-1被安装在诸如用户的家的观看环境23中,并且经由广播网络、通过来自未示出的广播站的无线电波广播来接收节目的广播信号。客户装置21-1被配置为调谐器31、观看者反应输入单元32、客户处理单元33和显示单元34。调谐器31接收从广播站发射的广播信号,从广播信号中分离出用户所指定的频道的节目的广播信号(即,指示了表示至少一个内容音频或内容视频的内容数据的广播信号),并将其提供给客户处理单元33。在下文中,要根据广播信号来播放的节目将被简单地称作“内容”。观看者反应输入单元32例如包括照相机和麦克风,观看者反应输入单元32获得观看内容的用户的视频(运动图像)和音频(即,分别是本地观看者视频和本地观看者音频),作为指示用户关于内容的反应的观看者反应信息(即,表示本地观看者视频和本地观看者音频的本地数据),并且将其提供给客户处理单元33。客户处理单元33使用来自观看者反应输入单元32的观看者反应信息并生成关于用户正观看的内容的观看信息,并且经由诸如因特网等的网络将其传输到服务器22。现在,观看信息是与用户关于内容的反应有关的信息,并且观看者信息包括观看者反应信息,情绪构建信息(即,本地观看者情绪信息)、以及频道信息。注意,情绪构建信息是指示用户的情绪构建程度(即,用户在观看内容时变得有多情绪化的程度或者用户的情绪反应的强度)的信息,并且频道信息是指示正观看的内容的频道的信息。此外,客户处理单元33经由诸如因特网等网络接收从服务器22传输的所有观看者观看信息(即,组合观看者情绪信息)。所有观看者观看信息是通过合并来自连接到服务器22的每个客户装置21的观看信息而生成的信息,其中所有观看者观看信息包括频道信息、指示所有观看者的情绪构建信息的平均值的平均情绪构建信息、以及每个观看者的观看者反应信息。注意,包括在所有观看者观看信息中的平均情绪构建信息指示所有用户的情绪构建的平均程度就足够了,并且不一定是情绪构建信息的平均值。因此,包括在所有观看者观看信息中的观看者反应信息可以是部分观看者的所有观看者反应信息、所有观看者的观看者反应信息的部分信息、或部分观看者的观看者反应信息的部分信息。另外,所有观看者观看信息可以包括所合并的观看者信息的数目,即,包括观看者数目的信息。客户处理单元33将根据从服务器22获得的所有观看者观看信息识别出的情绪构建效果与从调谐器31提供的内容进行合成,并提供所获得的内容(在下文中还被适当地称作“合成内容”),以便被播放。现在,情绪构建效果由组成观看者反应信息的使用者的视频和音频以及诸如准备好的笑声、叫声、欢呼声等的音频的数据组成。换言之,情绪构建效果是表示许多观看者 (用户)关于内容的情绪构建的视频和音频等的数据。注意,情绪构建效果可以是用户关于内容的实际反应(即,远程观看者对该内容的反应的至少一个远程观看者音频或远程观看者视频),或者可以是表示虚拟的观看者反应的、诸如叫声等的音频等。显示单元34被配置为例如液晶显示器和扬声器等,并且播放从客户处理单元33 提供的合成内容。也就是说,显示单元34显示组成合成内容的视频(运动图像),并且还输出组成合成内容的音频。因此,将观看内容的全体观看者的现场观看信息(即,从所有观看者观看信息获得的情绪构建效果)与内容进行合成并播放,由此观看该内容的用户能够得到在观看者之中的融入感以及临场感。注意,以与客户装置21-1相同的方式来配置客户装置21-2至客户装置21-N,并且这些客户装置21还以相同的方式操作。客户处理单元的配置示例更详细地,如图2中所示那样配置图1中的客户处理单元33。具体地,客户处理单元33被配置为分析单元(即,观看者情绪分析单元)61、信息选择单元(即,传输单元)62、 记录单元63和合成单元64构成。分析单元61分析从观看者反应输入单元32提供的观看者反应信息,生成情绪构建信息,并将其提供给信息选择单元62。例如,分析单元61执行运动图像的动作检测作为观看者反应信息,计算包括在移动图像中的用户的动作量,并且取所获得的动作量作为用户的情绪构建信息。在这种情况下,例如,用户动作量越大,用户的情绪构建程度越大,并且情绪构建信息的值越大。此外,例如,分析单元61取音频强度的变化作为观看者反应信息,即,作为指示声音的数量的变化量的值的情绪构建信息。在这种情况下,例如,声音的数量的变化越大,用户的情绪构建程度越大,并且情绪构建信息的值越大。注意,情绪构建信息并不限于用户的动作和声音,并且可以根据从用户获得的其他信息(诸如面部情绪等)而生成,只要可以指示用户的情绪构建程度即可。此外,情绪构建信息可以是由多个元素组成的信息,这多个元素指示用户在观看内容时的反应(诸如用户的移动量和声音的数量的变化),并且情绪构建信息可以是通过以加权方式将多个元素的值相加而获得的信息。另外,情绪构建信息并不限于用户的情绪构建程度,并且还可以包括用户的情绪构建类型,诸如笑声或叫声,即,指示用户情绪类型的信息。信息选择单元62使用来自观看者反应输入单元32的观看者反应信息、来自调谐器31的内容、以及来自分析单元61的情绪构建信息,生成观看信息,并且将其传输到服务器22 。注意,包括在观看信息中的观看者反应信息可以是在观看者反应输入单元32本身处获得的观看者反应信息,或者可以是观看者反应信息的一部分,例如仅是用户的运动图像。此外,观看信息经由网络被传输到服务器22,并且因此优选地是尽可能轻的信息,即,具有小数据量的信息。另外,观看信息可以包括作为客户装置21的装置的信息等。记录单元63记录预先准备的情绪构建效果,并且将所记录的情绪构建效果适当地提供给合成单元64。注意,记录在记录单元63中的情绪构建效果不限于预先准备的诸如运动图像或音频等的数据,并且可以是从服务器22接收的所有观看者观看信息、或者作为所有观看者观看信息的部分的数据等。例如,如果包括在从服务器22接收的所有观看者观看信息中的观看者反应信息被记录,并且被用作观看其他内容时的情绪构建效果,则可以增加情绪构建程度的表达的变化。合成单元64接收从服务器22传输的所有观看者观看信息,并且基于接收到的所有观看者观看信息来选择记录在记录单元63中的情绪构建效果中的某些。此外,合成单元 64将所选择的一个或多个情绪构建效果与从调谐器31提供的内容进行合成,从而生成合成内容(即,表示至少一个组合音频或组合视频的组合数据),并且合成内容被提供给显示单元34并被播放。合成处理和分发处理的描述接着,将描述客户装置21和服务器22的操作。例如,当用户操作客户装置21来指令开始观看预定频道的内容时,客户装置21开始合成处理,接收用户所指示的内容并生成合成内容,并且播放合成内容。此外,当在客户装置21处开始合成处理时,服务器22开始分发处理,以将客户装置21的用户正观看的内容的所有观看者观看信息分发到每个客户装置21。下面是参照图3中的流程图对客户装置21进行的合成处理和服务器22进行的分发处理的描述。在步骤Sll中,客户装置21的调谐器31接收从广播站发射的内容,并将其提供给分析单元61、信息选择单元62和合成单元64。也就是说,接收已广播的广播信号,并且针对接收到的广播信号,提取用户所指定的频道的内容的数据。此外,在步骤S31中,服务器 22经由网络将关于在客户装置21处正播放的内容所获得的所有观看者观看信息传输到客户装置21。在步骤S32中,服务器22确定是否要结束用于将内容的所有观看者观看信息传输 (分发)到播放内容的客户装置21的处理。例如,在播放相关内容的客户装置21结束播放内容的情况下,做出确定以结束处理。例如,经由网络从客户装置21通知结束播放内容。在步骤S32中做出确定将不结束处理的情况下,流程返回到步骤S31,并且重复上述处理。也就是说,新生成的所有观看者观看信息被相继传输到客户装置21。另一方面,在步骤S32中做出确定将结束处理的情况下,服务器22停止传输所有观看者观看信息,并且分发处理结束。此外,在步骤S31中的处理中所有观看者观看信息从服务器22被传输到客户装置 21的情况下,在步骤S12中,合成单元64接收从服务器22传输的所有观看者观看信息。在步骤S13中,合成单元64基于接收到的所有观看者观看信息来选择情绪构件效果,并且将所选择的情绪构建效果与从调谐器31提供的内容进行合成。具体地,合成单元64从记录单元63获得由包括在所有观看者观看信息中的平均情绪构建信息的值所确定的情绪构建效果,将作为获得的情绪构建效果的视频和音频与组成内容的视频和音频进行合成,从而生成合成内容。
此时,例如,用作情绪构建效果的视频可以从包括在平均情绪构建信息中的用户移动量的平均值中识别出,并且要用作情绪构建效果的音频可以从包括在平均情绪构建信息中的用户的声音的数量的变化量的平均值中识别出。注意,可以借助于任何选择方法进行情绪构建效果的选择,只要根据在平均情绪构建信息中所指示的、总体观看者的情绪构建的量级(magnitude)来选择适当的情绪构建效果即可。此外,用作情绪构建效果的视频的量级或音频的音量可以被调节成对应于平均情绪构建信息值的量级,或者可以选择根据平均情绪构建信息值所确定的数目的情绪构建效果。另外,可以将用作包括在所有观看者观看信息中的观看者反应信息的视频和音频与内容进行合成。以这种方式将观看相关内容的其他用户(其他观看者)的实际反应与内容进行合成作为情绪构建效果,允许更强的临场感和与其他观看者的融入感。注意,根据由所有观看者观看信息所指示的所有观看者的情绪构建的状态,可以创建其中没有将情绪构建效果与内容进行合成的场景。也就是说,在情绪构建程度低的情况下,具体而言,没有将情绪构建效果与内容进行合成,并且按原样显示内容。在步骤S14中,合成单元64将所生成的合成内容提供给显示单元34,并且播放合成内容。显示单元34显示组成来自合成单元64的合成内容的视频,并且还输出组成合成内容的音频。因此,反映观看内容的其他客户装置21的用户的反应的叫声、笑声、欢呼等以及观看内容的其他客户的用户的视频等与该内容一起播放。在步骤S15中,客户处理单元33确定是否将结束用于播放合成内容的处理。例如, 在用户操作客户装置21并指令结束观看内容的情况下,做出确定以结束处理。在步骤S15中做出确定将不结束处理的情况下,流程返回到步骤S11,并且重复上述处理。也就是说,继续用于生成和播放合成内容的处理。另一方面,在步骤S15中确定将结束处理的情况下,客户装置21经由网络向服务器22通知观看内容将结束的效果,并且合成处理结束。因此,客户装置21从服务器22获得所有观看者观看信息,并且使用所获得的所有观看者观看信息来合成适合于内容的情绪构建效果。因此,可以实时地接收到诸如其他观看者的情绪构建的情绪反馈,并且可以将其他观看者的反应与内容进行合成。结果,观看内容的观看者可以获得就像他们处于体育场或电影院等之中的真实的临场感,并且可以在处于家的环境中的同时获得与其他观看者的融入感。此外,用户在观看内容的同时不必输入指示描述他们对内容感觉如何等的任何种类的信息文本,所以没有妨碍观看内容。通常,当在体育场中看运动会等时,或当在电影院中看电影时,通常观众 (spectator)或观看者在同一情形中展现相同的反应,所以在该会场内的情绪构建带来在会场中的融入感和临场感。借助于内容观看系统11,观看同一内容的多个用户的反应被实时反映在正观看的内容中。因此,用户可以获得融入感和临场感,其更接近于当实际看运动会时或当在电影院中看电影时获得的融入感和临场感。此外,借助于客户装置21,将预先准备的情绪构建效果与内容进行合成,所以在内容的分发侧不必以任何特定的方式改变内容,并且因此这以可被应用于现有电视广播节目寸。观看信息生成处理和合并处理的描述另外,当用户指令开始观看内容并且上述合成处理和分发处理开始时,在客户装置21与服务器22之间,与该处理并行地执行生成观看信息的观看信息生成处理、以及生成合并了观看信息的所有观看者观看信息的合并处理。将参照图4中的流程图,做出关于客户装置21进行的观看信息生成处理和服务器 22进行的合并处理的描述。当用户指令开始观看内容时,在步骤S61中,观看者反应输入单元32获得观看客户装置21附近的显示器34的用户的观看者反应信息,并且将其提供给分析单元61和信息选择单元62。例如,获得指示观看合成内容的用户的反应的信息(诸如用户的视频和音频等)作为观看者反应信息。在步骤S62中,分析单元61使用从观看者反应输入单元32提供的观看者反应信息来生成情绪构建信息,并且将其提供给信息选择单元62。例如,生成从观看者反应信息获得的、在观看合成内容时用户的动作量或者声音的数量的变化量作为情绪构建信息。在步骤S63中,信息选择单元62使用来自调谐器31的内容、来自观看者反应输入单元32的观看者反应信息、以及来自分析单元61的情绪构建信息,生成与客户装置21的各个用户有关的观看信息。在步骤S64中,信息选择单元62经由网络将所生成的观看信息传输到服务器22。在步骤S65中,客户处理单元33关于是否将结束生成观看信息并将其传输到服务器22的处理做出确定。例如,在用户已指令了结束观看内容的情况下,即,在图3中的合成处理已结束的情况下,则做出确定将结束该处理。在步骤S65中,在做出确定将不结束处理的情况下,流程返回到步骤S61,并且重复上述处理。也就是说,获得在下一个时间点处的观看者反应信息并且生成新的观看信息。另一方面,在步骤S65中做出确定将结束处理的情况下,客户装置21停止所执行的处理,并且观看信息生成处理结束。此外,在观看信息从客户装置21被传输到服务器22的情况下,在步骤S81中,服务器22接收从客户装置21传输的观看信息。此时,服务器22从播放预定频道的相关内容的所有客户装置21接收观看信息。也就是说,服务器22从观看同一内容的所有用户接收包括情绪构建信息的观看信息的供应。在步骤S82中,服务器22使用接收到的观看信息来生成关于预定频道的内容的所有观看者观看信息。例如,服务器22生成识别内容的频道信息、指示所有观看者的情绪构建程度的平均情绪构建信息、以及由部分或所有观看者的观看者反应信息组成的所有观看者观看信息。这里,平均情绪构建信息例如是从每个客户装置21等获得的情绪构建信息的平均值。以这种方式生成的所有观看者观看信息被传输到所有客户装置21,其在图3中的步骤S31的处理中播放预定频道的内容。在步骤S83中,服务器22确定是否将结束用于生成所有观看者观看信息的处理。 例如,在与合并处理并行执行的图3中的分发处理已结束的情况下,做出确定以结束。在步骤S83中做出确定不结束处理的情况下,流程返回到步骤S81,并且重复上述处理。也就是说,基于新接收到的观看信息来生成所有观看者观看信息。另一方面,在步骤S83中做出确定结束处理的情况下,服务器22停止所执行的处理,并且合并处理结束。以这种方式,客户装置21获得观看内容的用户的反应作为观看者反应信息,并将包括观看者反应信息的观看信息传输到服务器22。因此,与观看内容的用户的反应有关的信息可以被提供给服务器22,并且结果是,可为用户提供更真实的临场感和融入感。此外, 在这种情况下,用户不必输入描述他们感觉内容如何的文本等,所以没有妨碍观看内容。现在,在以上描述中,描述了电视广播节目作为用户观看的内容的示例,但是内容可以是任何其他种类的内容,诸如音频(例如音乐)等。此外,布置并不限于像这样的将内容从服务器22传输到的客户装置21的布置;用作服务器22的或用作其等同物的任何布置或配置可以被用于传输内容,并且可以将内容直接传输给用户,或者可以经由基于线缆的或无线的任何通信网络(包括因特网)将内容传输给用户。注意,上述系列处理可以由硬件来执行、或者可以由软件来执行。在由软件来执行系列处理的情况下,将组成其软件的程序从程序记录介质安装到内嵌有专用硬件的计算机、或者例如通过安装各类程序而能够执行各类功能的通用个人计算机中。图5是示出了用于执行上述系列处理的程序的计算机的硬件配置示例的框图。在计算机中,CPU(中央处理器)301、ROM(只读存储器)302和RAM(随机存取存储器)303经由总线304而相互连接。总线304进一步与输入/输出接口 305连接。由键盘、鼠标、麦克风等组成的输入单元306,由显示器、扬声器等组成的输出单元307,由硬盘或非易失性存储器等组成的记录单元308、由网络接口等组成的通信单元309、以及用于驱动可移除介质311 (诸如磁盘、 光盘、磁光盘、或半导体存储器等)的驱动器310被连接到输入/输出接口 305。借助于如上所述配置的计算机,CPU 301经由输入/输出接口 305和总线304将记录在记录单元308中的程序载入到RAM中,并且执行该程序,例如,由此执行上述系列处理。例如通过记录在可移除介质311中、或者经由诸如局域网、因特网、数字卫星广播等的有线或无线传输介质,提供计算机(CPU 301)执行的程序,可移除介质311是诸如磁盘 (包括软盘)、光盘(包括⑶_R0M(致密盘-只读存储器)、DVD(数字多功能盘)等)、磁光盘、或半导体存储器的封装式介质。通过将可移除介质311安装到驱动器310,可以经由输入/输出接口 305将程序安装到记录单元308中。此外,程序可以通过由通信单元309经由有线或无线传输接收来被安装在记录单元308中。可替选地,可以将程序预先安装在ROM 302或存储单元308中。注意,计算机执行的程序可以是以按照本说明书中描述的顺序的时间顺序来执行处理的程序,或者可以是并行地或以特定定时(例如当执行调用时)来执行处理的程序。注意,本发明的实施例不限于上述实施例,并且在不背离本发明的实质的情况下可以做出各种修改。本领域的普通技术人员应该理解,根据设计要求和其他因素可以做出各种修改、 组合、子组合和变型,只要它们落在所附权利要求或其等同物的范围之内。
权利要求
1.一种用于生成关于观看者对内容的情绪反应的信息的系统,包括观看者反应输入单元,其被配置成捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,所述内容数据表示至少一个内容音频或内容视频;以及观看者情绪分析单元,其被配置成基于所述本地数据来生成指示所述本地观看者对所述内容数据的情绪反应的本地观看者情绪信息。
2.根据权利要求1所述的系统,包括调谐器,其被配置成接收指示所述内容数据的广播信号。
3.根据权利要求1所述的系统,其中,所述观看者反应输入单元被配置成在所述内容数据被呈现给所述本地观看者时捕获所述本地数据。
4.根据权利要求3所述的系统,其中,所述本地观看者情绪信息指示所述本地观看者对所呈现的内容数据的情绪反应的强度。
5.根据权利要求4所述的系统,包括服务器和多个内容呈现装置,所述内容呈现装置包括传输单元,其被配置成将至少一个所述本地数据或所述本地观看者情绪信息传输给所述服务器。
6.根据权利要求5所述的系统,其中,所述服务器被配置成组合多个本地观看者情绪信息以创建组合观看者情绪信息。
7.根据权利要求6所述的系统,包括合成单元,其被配置成基于所述组合观看者情绪信息来确定至少一个效果音频或效果视频;以及将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与所述内容数据进行组合,以创建表示至少一个组合音频或组合视频的组合数据。
8.根据权利要求7所述的系统,其中,所述服务器被配置成将所述组合观看者情绪信息传输到所述内容呈现装置中的至少一个;所述内容呈现装置中的所述至少一个包括所述合成单元;以及所述合成单元被配置成从所述服务器接收所述组合观看者情绪信息。
9.根据权利要求7所述的系统,其中,所述内容呈现装置中的至少一个包括显示单元, 其被配置成将所述组合数据呈现给所述本地观看者。
10.根据权利要求7所述的系统,其中,所述合成单元被配置成将所述组合数据输出到所述内容呈现装置之一的显示单元。
11.根据权利要求7所述的系统,其中,所述至少一个效果音频或效果视频包括在所述内容数据被呈现给远程观看者时所述远程观看者对所述内容数据的反应的至少一个远程观看者音频或远程观看者视频。
12.根据权利要求7所述的系统,其中,所述至少一个效果音频或效果视频表示在所述内容数据被呈现给多个观看者时所述多个观看者对所述内容数据的反应。
13.根据权利要求6所述的系统,其中,所述组合观看者情绪信息指示在所述内容数据被呈现给多个观看者时所述多个观看者对所述内容数据的情绪反应的平均强度。
14.根据权利要求6所述的系统,其中,所述服务器从所述内容呈现装置接收所述多个本地观看者情绪信息。
15.根据权利要求1所述的系统,其中,所述观看者情绪分析单元基于所述本地观看者的移动量来生成所述本地观看者情绪信息。
16.根据权利要求15所述的系统,其中,所述观看者情绪分析单元基于由所述本地观看者生成的声音的数量的变化来生成所述本地观看者情绪信息。
17.根据权利要求1所述的系统,其中,所述观看者情绪分析单元基于由所述本地观看者生成的声音的数量的变化来生成所述本地观看者情绪信息。
18.一种用于将内容与关于观看者对所述内容的情绪反应的信息进行组合的装置,包括观看者反应输入单元,其被配置成捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,所述内容数据表示至少一个内容音频或内容视频;观看者情绪分析单元,其被配置成基于所述本地数据来生成指示所述本地观看者对所述内容数据的情绪反应的本地观看者情绪信息;传输单元,其被配置成将所述本地观看者情绪信息传输到服务器;以及合成单元,其被配置成从所述服务器接收组合观看者情绪信息;基于所述组合观看者情绪信息来确定至少一个效果音频或效果视频;以及将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与所述内容数据进行组合。
19.一种用于生成关于观看者对内容的情绪反应的信息的方法,包括捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,所述内容数据表示至少一个内容音频或内容视频;以及基于所述本地数据来生成指示所述本地观看者对所述内容数据的情绪反应的本地观看者情绪信息。
20.一种用于将内容与关于观看者对所述内容的情绪反应的信息进行组合的方法,包括捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,所述内容数据表示至少一个内容音频或内容视频;基于所述本地数据来生成指示所述本地观看者对所述内容数据的情绪反应的观看者情绪信息;将所述本地观看者情绪信息传输到服务器; 从所述服务器接收组合观看者情绪信息;基于所述组合观看者情绪信息来确定至少一个效果音频或效果视频;以及将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与所述内容数据进行组合。
21.一种存储程序的非暂时的、计算机可读存储介质,当由处理器执行所述程序时,所述程序使内容呈现装置执行用于将内容与关于观看者对所述内容的情绪反应的信息进行组合的方法,所述方法包括捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,所述内容数据表示至少一个内容音频或内容视频;基于所述本地数据来生成指示所述本地观看者对所述内容数据的情绪反应的本地观看者情绪信息;将所述本地观看者情绪信息传输到服务器; 从所述服务器接收组合观看者情绪信息;基于所述组合观看者情绪信息来确定至少一个效果音频或效果视频;以及将表示所确定的至少一个效果音频或效果视频的至少一个效果音频数据或效果视频数据与所述内容数据进行组合。
全文摘要
本发明涉及一种内容播放装置。公开了一种用于生成关于观看者对内容的情绪反应的信息的系统。该系统可以包括观看者反应输入单元,其被配置成捕获表示本地观看者对内容数据的反应的至少一个本地观看者音频或本地观看者视频的本地数据,内容数据表示至少一个内容音频或内容视频。该系统还可以包括观看者情绪分析单元,其被配置成基于本地数据来生成指示本地观看者对内容数据的情绪反应的本地观看者情绪信息。
文档编号H04N21/258GK102170591SQ20111004207
公开日2011年8月31日 申请日期2011年2月18日 优先权日2010年2月26日
发明者小柳津秀纪 申请人:索尼公司