增强现实系统的制作方法与工艺

文档序号:11971611阅读:248来源:国知局
增强现实系统的制作方法与工艺
本发明涉及增强现实系统(augmentedrealitysystem)。

背景技术:
增强现实涉及捕获环境中的视频图像的过程,以及使用计算机图形元素(典型地描绘虚拟对象,如将要作为环境的一部分出现的游戏人物)对该视频图像进行增强。为了提供有说服力的增强,这些计算机图形元素期望地要以与环境相一致的方式显示,特别是在尺寸、动作范围和视角方面。因此,例如,如果环境的视频图像(在这里也可作为“场景”)从一个特定的角度示出了地板或桌面,期望地,计算机图形元素以这样的方式缩放和定向使得它们看起来适当地停留在该表面上,并且按照物理上一致的方式在它上面移动。然而,对场景的元素,以及由此对叠加在其上的虚拟对象的尺寸和方向的确定,是重要的任务。现在参考图1,因此,在一个典型的增强现实应用中,将要被视频摄像机捕捉的环境中包含一个已知尺寸的所谓受信标记(fiduciarymarker)1010,以提供可以很容易检测到的并且已知的特征,可以更容易地对该特征的尺寸和方向作出估计。这种受信标记通常是高对比度的(例如黑色和白色)以便在即使相对较差的图像捕捉条件下(如低分辨率图像捕捉,光线不好等)也能为图案识别提供机会。图案本身通常包括含有非对称分布的块或瓦片的厚的四边形边界,这使得消除了该标记方向上的模棱两可情况。因此,识别过程通常提供在所捕获的视频图像内的受信标记的位置(在图像中的x和y轴位置)和旋转(由于标记的非对称)的估计。可选地,附加地,通过将所捕获图案中的受信标记的大小与该受信标记的已知大小(例如,在1米的距离处的大小)作比较,可以估计受信标记(它的z轴的位置)到视频摄像机的距离;换句话说,其尺寸。同样地,可选地,通过将所捕获图案中的受信标记的纵横比与该受信标记的已知纵横比作比较,和/或使用其他技术,如检测透视缩短(其中,长方形的形状表现为梯形)或所捕获图案中受信标记的其他失真,可以对受信标记(即其在z方向上对x-y平面的偏离)的倾斜进行估计。所生成的图形覆盖图典型地包括虚拟图形元素,之后可以将其重叠在受信标记上,使用该受信标记估计的位置,旋转距离和倾斜来修改该虚拟图形元素为适用的。之后将增强的图像输出到显示器。此过程的主观效果是,输出的视频图像包括图形元素(例如,一个怪物或城堡)替代受信标记,通常复制受信标记的估计的位置、距离、旋转和倾斜,以及因此在其上放置该标记的环境的表面。然而,应理解,在这样的增强现实系统中对用户的怀疑的消除(这使得他们共同产生图形覆盖图是所捕获的场景的一部分的错觉),至少部分地依赖于图形覆盖图与该场景的一些真实世界方面的匹配或交互的可靠性。这种可靠性经常依赖于对场景内的受信标记的位置和方向的估计。因此,期望应减少不能可靠地作出这样的估计的场合,以及改善的所作出的估计的一致性。

技术实现要素:
在第一方面中,根据权利要求1提供在增强现实系统中使用的书(book)。在另一个方面,根据权利要求10提供在增强现实系统中使用的娱乐设备。在另一个方面,根据权利要求13提供增强现实系统。在另一个方面,根据权利要求14提供对书中的视频图像进行增强的方法。在另一个方面,根据权利要求15提供计算机程序。本发明的其他各方面和特征在附属权利要求中定义。附图说明现在将通过示例的方式参考附图描述本发明的实施例,其中:图1是根据本发明的实施例的受信标记的示意图。图2A是根据本发明的实施例的书的示意图。图2B是根据本发明的实施例,在其上覆盖有计算机图形增强的书的图像的示意图。图3是根据本发明的实施例的娱乐设备的示意图。图4是根据本发明的实施例的书的示意图。图5是根据本发明的实施例,跟踪书页的翻动的方法的流程图。图6是根据本发明的实施例的书的示意图。图7是根据本发明的实施例的书的示意图。图8是根据本发明的实施例的书的示意图。图9是根据本发明的实施例的增强现实系统的示意图。图10是根据本发明的实施例,对书中视频图像进行增强的方法的流程图。具体实施方式公开了书、娱乐设备、增强现实系统和用于增强书中的视频图像的方法。在下面的描述中,提供了一些具体细节,以便对本发明的实施例的透彻理解。然而,对于本领域技术人员来说这将是明显的,不必采用这些特定的细节来实施本发明。相反,在适当的情况下,为清楚起见,省略那些对于本领域技术人员来说是已知的具体细节。现在参看图2A和2B,在本发明的一个实施例中,书1000具有多个刚性的,可转动的页(leaf)(所谓的“板书”),并且在每一页面(page)1001,1002上包含受信标记1011,1012,如图2A中所示。将页理解为是一本书的单一的可转动的薄片或面板,并通常在每一侧包括一个页面。图2A和图2B示出(通过示例的方式)第1和第2页面(分别标记为1001和1002)。可选地,书的封面和/或封底内页也可作为页面并包括受信记号。因此,在这个例子中,第1页可能实际上是封面内页。同样,可选地,封面和/或封底外页可能包括受信记号。此外,可选地,在外边缘以高对比度的标记1020作为每一页的边界以便于检测页面的范围。耦接到摄像机的娱乐设备可以捕捉书中的图像并且使用已知的技术来检测每个可见的页面上的受信记号,从而对这些书页进行定位。给定这些信息,之后如图2B所示,娱乐设备可以使用对应于可见页面的受信标记1011,1012的位置,尺寸和方向的虚拟图形元素1111,1112来增强所捕获的书中的视频图像,并且输出增强的视频图像以进行显示。通过这种方式,书的显示版本变成一个“神奇的”立体书(pop-upbook),在其中页面可以变得生动。现在转到图3,它示意性地示出合适的娱乐设备(被称为娱乐设备或)的整体系统架构。PS3包括系统单元10,它可连接各种外围设备,包括视频摄像机,如下文所详述。系统单元10包括:单元处理器100;动态随机存取存储器(XDRAM)单元500;具有专用的视频随机存取存储器(VRAM)单元250的现实合成器图形单元200;以及I/O桥700。系统单元10还包括用于从磁盘440的读取的光盘读取器430和可移动的插槽式硬盘驱动器(HDD)400,它们都可通过I/O桥700访问。可选地,系统单元还包括存储卡读卡器450,用于读取紧凑型闪存卡,存储卡等,它同样是可以通过I/O桥700访问的。I/O桥700还连接到4个通用串行总线(USB)2.0端口710;千兆以太网端口720;IEEE802.11b/g无线网络(Wi-Fi)端口730;以及能够支持多达7个蓝牙连接的无线连接端口740。在操作时,I/O桥700处理所有无线、USB和以太网数据,包括来自一个或多个游戏控制器751的数据。例如,当用户玩游戏时,I/O桥700通过蓝牙链接接收来自游戏控制器751的数据并将其导向单元处理器100,单元处理器100相应地更新游戏的当前状态。无线、USB和以太网端口还提供除了游戏控制器751外其他外围设备的连接,如:遥控器752;键盘753;鼠标754;便携式娱乐设备755如SonyPlaystation娱乐设备;和麦克风耳机757。因此,这样的外围设备可以原则上可以无线地连接到系统单元10;例如,便携式娱乐设备755可以通过专门的Wi-Fi连接进行通信,而麦克风耳机757可通过蓝牙链接进行通信。特别地,这些连接使得例如摄像头756(或立体视频摄像机,未示出)的视频摄像机能够耦接到PS3,以便捕获书的视频图像(或立体视频图像对)。提供这些接口意味着PlayStation3设备还潜在地与其他外围设备例如数字录影机(DVR)、机顶盒、数码相机、便携式媒体播放器、语音IP电话、移动电话、打印机和扫描仪兼容。此外,传统的存储卡读取器410可以通过USB端口710连接到系统单元,使得能够读取或设备所使用的那种存储卡420。在本实施例中,游戏控制器751通过蓝牙链路可实行与系统单元10进行无线通信。然而,也可以替代地将游戏控制器751连接到USB端口,从而也提供向游戏控制器751的电池充电的电源。除了一个或多个模拟游戏杆和传统控制按钮外,游戏控制器对6个自由度的动作敏感,对应于各轴的平移和旋转。因此,除了或代替传统的按钮或游戏杆命令,游戏控制器的用户的手势和动作可以被转化为游戏的输入。可选地,其他支持无线功能的外围设备,如便携式娱乐设备755或PlayStationMove(RTM)758可用作控制器。在便携式娱乐设备的情况下,在设备的屏幕上可以提供额外的游戏或控制信息(例如,控制指令或命的条数)。在PlayStationMove的情况下,控制信息可由内部运动传感器和PlayStationMove设备上的光线视频监控来提供。也可使用其他替代或补充的控制设备,诸如跳舞毯(未示出),光枪(图中未示出),方向盘和踏板(未示出)或定制的控制器,如用于快速反应问答游戏的单一或数个大按钮(也未示出)。遥控器752也可通过蓝牙链路实行与系统单元10进行无线通信。遥控器752包括适合BluRayDiskBD-ROM读取器430的操作和磁盘内容的导航的控制。除了传统预记录和可记录的CD,以及所谓的超级音频CD,BluRayDiskBD-ROM读取器430可用于读取与PlayStation和PlayStation2设备兼容的CD-ROM。除了传统预记录和可记录的DVD,读取器430也用于读取与PlayStation2和PlayStation3设备兼容的DVD-ROM。读取器430进一步可用于读取与PlayStation3设备兼容的BD-ROM,以及传统预记录和可记录蓝光磁盘。系统单元10用于将由PlayStation3设备经由现实合成器图形单元200产生或解码的音频和视频,通过音频和视频连接器,提供给诸如具有显示器305以及一个或多个扬声器310的监视器或电视机的显示和声音输出设备300。音频连接器210可以包括传统的模拟和数字输出,而视频连接器220可以包括各种分量视频,S-视频,复合视频和一个或多个高清晰度多媒体接口(HDMI)输出。因此,视频输出可能会以如PAL或NTSC、或720P,1080i或1080p高清晰度的格式。单元处理器100执行音频处理(生成、解码等等)。PlayStation3设备的操作系统支持环绕声、TheatreSurround(DTS)和对来自磁盘的7.1环绕声的解码。在本实施例中,视频摄像机756包括单一电荷耦合器件(CCD)、LED指示灯和基于硬件的实时数据压缩和编码装置,以使压缩的视频数据可以适当的格式(如基于MPEG(运动图像专家组)标准的帧内图像)被发送,从而由系统单元10进行解码。对摄像机LED指示灯进行排列使其响应来自系统单元10的适当的控制数据而发光,例如表示不利的光照条件。视频摄像机756的实施例可通过USB、蓝牙或Wi-Fi通信端口以各种方式连接到系统单元10。视频摄像机的实施例可以包括一个或多个相关联的麦克风并且能够传送音频数据。在视频摄像机的实施例中,CCD的分辨率可以适用于高清晰度的视频捕捉。在视频摄像机的实施例中,它是立体的。在使用中,由视频摄像机捕获的图像可以是例如纳入在游戏中或者视作游戏的控制输入。一般情况下,为了经由系统单元10的通信端口中的与例如视频摄像机或遥控器的外围设备发生成功的数据通信,应提供例如设备驱动的适当的软件。设备驱动的技术是众所周知的,并且将不在这里进行详细的描述,但本领域的技术人员将意识到,在所描述的本实施例中需要设备驱动或类似的软件接口。制造时提供的软件,包括系统固件和PlayStation3设备的操作系统(OS)。在操作中,操作系统提供用户界面,使用户能够从多种功能中进行选择,包括玩游戏,听音乐,观看照片,或观看视频。该界面采用按水平方式排列功能类别的所谓的跨媒体栏(XMB)形式。用户通过使用游戏控制器751、遥控器752或其他合适的控制设备在功能图标(代表功能)间水平移动进行导航以便突出显示想要的功能图标,在那一点上与该功能有关的选项围绕该功能图标作为可垂直滚动的选项图标列表出现,可以以类似的方式对其进行导航。但是,如果将游戏,音频或电影盘440插入到BD-ROM光盘读取器430,PlayStation3设备可以自动选择适当的选项(例如,开始游戏),或者可以提供相关的选项(例如,在播放音频盘或将其内容压缩到HDD400之间进行选择)。此外,操作系统提供了在线的能力,包括Web浏览器,具有可下载额外的游戏内容,演示游戏(demos)和其他媒体的在线商店的界面,以及好友管理能力,提供与当前设备的用户指定的其他Playstation3设备用户进行在线通信;例如,根据可用的外围设备,采用文本、音频或视频。在线能力还提供了在适当配置的游戏的游玩过程中的在线交流,内容下载和内容购买,以及Playstation3设备自身的固件和操作系统本身的更新。应理解,术语“在线的”并不意味着导线的物理存在,因为该术语也可以适用于不同类型的无线连接。现在参看图4,应理解,虽然当书打开和平放时,可以很容易地检测到受信标记,翻动书页的过程中会产生若干问题。首先,应理解,当用户翻转板书1000的刚性页1102时,之后例如第1和第2页面被盖住,而露出第3(未示出,但位于页1102与第2页面的相反的面上)和第4页面(1004)。当翻转动作完成时,第3页和第4页面充分显露出来,该系统可以以与前面参照图2B描述的对第1和第2页面使用的类似的方式来提供对第3和第4页面的图像增强。然而,所产生的第一个问题是,在翻转这些页面的过程中,有那么一个位置第2页面上的受信标记1012(例如)由于摄像机接近边缘观看而变得如此扭曲以致娱乐设备无法识别它。在这一位置上,优选使用一种确定书的翻转页的位置的替代技术,使得依赖于它的任何动画(animation)(例如显示第1和第2页面的向下折叠或第3和第4页面的展开之间的对象的立体动画)能够适当地继续。在共同未决的欧洲专利申请10175548.6中描述这样的技术,通过参考包括在本文中。下面参照图5描述该技术的简要总结。在第一个步骤S10中,视频摄像机或类似的可用于耦接到PS3的图像输入(例如,USB端口)的图像捕获设备捕获包括书的场景,从而生成包含书的图像。正如前面提到的,书本身包括实质刚性页。在第二步骤S20中,例如使用在适当的软件指令下运行单元处理器作为记号检测器,PS3试图在图像中检测受信记号(即书中可见的那些)。如果在其记号中包括某种形式的空间分布冗余,通常不需要受信标记的全部来识别它。在第三步骤S30,将书的页面上的受信标记的图像或部分图像与该标记的参考版本进行比较以确定方向和尺寸,并给定与页面的已知的物理关系(即,其印制的位置),这也提供了一个该书的方向和尺寸的估计,特别是书脊的位置,它作用在书页的旋转原点。单元处理器可能会再次执行比较并估计书脊的位置,并且标记的参考版本可能存储在RAM中、硬盘上、光盘上、或远程存储上,或其他任何合适的存储介质或它们的组合。基于旋转的原点与书脊重合,在第四步骤S40中,为书的翻转页假设了多个可能的位置。特别是,如果给定页面的大小,那么假设页面的自由边缘的位置。再次地在这里单元处理器可以作为进行假设的部件运行。为了提供与这些假设进行比较的基础,在第五步骤S50中对所捕获的图像进行处理以生成已识别出边缘的图像。另外生成表示这些边缘的方向的数据。可由单元处理器、现实合成器图形单元或上述两者的组合执行该图像处理。在第六步骤S60中,使用之前描述的几种可能的评分标准中的一种,参照包含已识别的边缘和这些边缘的方向的图像对书的翻转页的假设边缘中的每一个进行评估。同样,这种评估或比较可以使用运行在合适的软件指令下的单元处理器来执行。然而,通常情况下,没有必要将每个假设的边缘与所处理的图像上的所有像素进行比较。在第七步骤S70中,将预测的翻转页的自由边缘产生最好成绩的假设假定为实际翻转页的位置的最佳匹配,同时单元处理器执行对这一假设的选择。最后,在第八步骤S80,例如图片或多边形对象(例如,3D虚拟对象的2D呈现)的虚拟图形元素重叠或以其他方式纳入所捕获的图像使得在与胜出的假设相一致的位置处对它进行增强。可以典型地根据来自单元处理器的指令,通过现实合成器图形单元结合视频和图形元素来实现此图像的增强。虚拟图形元素本身可以本地存储在RAM中、硬盘上或者光盘上,可以远程存储,或者可以是例程图形生成过程的产物,如树木的生长过程。其他可能的步骤在图5中用虚线箭头示出。这些包括步骤S11、S22、S33,它们重复了步骤S10、S20和S30,用于立体图像对的第二图像,步骤S88中,重复步骤80,用于第二图像中的偏移位置(位移)。同样地,使用点线箭头的步骤S12中提供了一种替代S11、S22和S33的替代的位移测定法,对立体图像对采用了直接的图像比较,例如,通过单元处理器。在这两种情况下,这使得对立体显示进行了3D增强。应理解,上述步骤不一定都需要按照上述的顺序实施。例如,第五步骤S50可能会在第一步骤S10后立即发生。应理解一般而言,可以使用受信标记对书的位置,大小和方向进行初始检测,并确定页码,但之后可以替代地或在受信标记之外,使用页面的粗体边缘对书的位置进行一帧接一帧的跟踪,只定期地或在单元处理器检测到页面的形状可能是模糊的并且需要非对称的标记来解决时对该受信标记进行重新评估。如前所述,想要娱乐设备准确地建模书页翻转的原因之一是提供可以如实地跟踪翻转页的该书的增强,不仅对正在翻转的可见页面,也为了正在打开的新页面进行增强。对新页面进行增强的一个问题是,为了提供新的页面也是“神奇”的错觉,增强应该在页面的任何部分变为可见时马上开始——这通常在该页面的受信标记对娱乐设备可见之前发生。其结果是,特定页面的特征在需要对其进行增强之前是未知的。一种解决方案是提供面对摄像机的页面边缘附近的补充非字母数字标记,其在打开新页面的过程中将会更早地被检测到(见下文),但即使如此,仍然会有这样的标记不能立即可见或可解析的情况。因此,可以设置娱乐设备以便对未知页面的局部视图进行增强。在这种情况下,可以设置娱乐设备以便通过使用符合书中使用的增强的通用的图形或颜色方案来对新打开的页面的可见部分进行增强,或者可以假设只有一个页正在翻转,并选择适用于下一对页面的增强,暂停补充标记,如果存在的话,和/或最终这些页面的受信标记的确认。一般地可以通过设计通用的或至少在书的页面边缘周围细节程度较低的增强来协助这些方法,使得识别页面时可以使用页面特定的增强来离散地替换通用增强。然而,这种方法假设实际上将有一个新的页面打开;现在参照图6,应理解,当翻转书的第一或最后一页面来合上它(即该页面在的封皮内页上)存在一定的误差范围。在这种情况下,在它下面没有将要打开的页面(虽然可能有容易混淆地视为一个页面的阴影1106)。结合上面描述在任何确定的标记可见前对新打开的页面进行增强的策略,这可能会导致对一个不存在的页面进行增强,从而导致在合上书时书的封皮外显示出一个通用的增强的页面,它只有在娱乐设备识别出书的封面或封底时才会被删除。显然,这是不期望的。应理解,对于书初始地打开在它的第一个或最后一个页面并且因此这些是可见的情形,是可能有解决方案的;如果第一页面向第二页面翻转,那么可以设置娱乐设备假设正在合上封面,同样地对于最后一页面向倒数第二页面翻转,那么可以假设正在合上封底。然而,当用户决定合上一个当前打开在任意一对页面处而不是第一对和最后一对页面时,当前页面的知识是没有任何帮助的。因此,现在再参照图7,在本发明的一个实施例中,所述书具有一个比书的页尺寸大的封皮,因此从上面看时,其具有延伸超出每个页面的外边缘的末端,如在图7中所示。本发明的一个实施例中,所述封皮包括沿着至少这样的第一末端(1030A)的高对比度图案,优选是在正常使用时,位于距离摄像机最近的末端。应理解,高对比度的图案因此印刷在封皮内页上,并且在封皮内页的外边缘上和其附近。高对比度图案通常由黑色和白色块组成,或者类似地两种对比颜色或色调(如亮蓝与暗蓝色)的块。这样,两种颜色可以编码为比特图案,用各颜色或色调分别代表1或0。因此,高对比度的图案沿上述书的封皮内页的可见末端可形成一个线性的二进制代码。高对比度的图案可以以脊部1060为轴进行镜像(因此出现封面和封底内页上),也可以以页面的顶部和底部之间的中心线为轴进行镜像,以形成高对比度的图案的四份复制(1030A-D)。高对比度的图案可能编码有关于书的信息(例如标题号),或者可能仅仅是随机的。典型的高对比度的图案可能以大约6到20比特编码。该图案的明亮与暗淡的元素可能遵守均匀的间隔方案或具有任意的或近似的间距。此外,高对比度的图案(1035L,R)也可以沿着书的侧面末端设置。这种高对比度的图案可以与上述的高对比度的图案相同,或可能以不同的方式编码相同的信息,或编码不同的或附加的信息,或是随机的。在上述任何情况下,应理解封皮有预定的物理厚度。因此,在本发明的一个实施例中,高对比度的图案延伸至封皮的边缘并且至少以预定的比例越过封皮的厚度,使得对于视频摄像机以非常小的锐角的角度提高其能见度。在这两种情况下,在翻转书页时,高对比度的图案由此提供了关于书的状态的非常早期的指示。特别地,书的封皮内页边缘周围的高对比度的图案使得娱乐设备能够区别只翻转书中的页和从支撑表面上翻起书的封皮的时刻,例如合上书。这是因为,在翻转书的内页时高对比度的图案不会移动,并且只在翻开书的一个或两个封皮时它才会移动。更一般地,翻转书的内页可能同时导致书的一些更一般的运动,同样地可以检测封皮的任何偶然的翻转动作是否与书的内页或多个内页的翻转动作的速率一致,和/或这样的翻转以何种程度发生。如果封皮以与内页类似的量旋转,则可以假定这本书正在被合上,而如果封皮以一个较小的速度、或以一个较小的程度、或以与内页不相关的方式(例如具有低于预定阈值量的动作相关性)旋转,那么可以假定内页或页的转动仍然会导致翻开书的一页面。也因此而更一般地,高对比度的图案作为可以被用来估计的书的封皮的静止角(restingangle)的一维的二进制图案,以及由此书的页的静止角;因此,如果书放在桌子上,书的封皮可能是平放的,表示相对的页面间的角度为180度。同时,如果这本书放在使用者的腿上,封皮可有一个相对角度例如165度,可以使用它来提供基线角(baselineangle),用于随着翻转页的角度相对于基线角变化来对新打开的页面进行增强。如果如前面所提到的,高对比度图案的角度以与书的页的角度的变化不相关的方式变化,那么这被认为是对基线角的改变,甚至好像同一时间正在翻转书的内页的页面。再次参考图7,通过提供非字母数字的图案(1040A-D)可以更快地识别出页面(或相对的页面对)。在每一页面上可以将这样的非字母数字图案(1040A,1040B)置于比受信标记更靠近书页面的外边缘的地方。通常情况下,这个非字母数字的图案置于受信标记和距离书的用户最远的页面的边缘之间,从而对于书的一般使用来说也最为靠近视频摄像机,其中视频摄像机放置在靠近显示增强的图像的电视机的位置,并且用户面对电视拿着书。非字母数字的图案可以类似地置于受信标记的边角和的页面边角之间,如图7中所示。值得注意的是,非字母数字的图案因此可以形成“L”的形状(例如在边角附近沿着书的外边缘)。在这种情况下非字母数字的图案因此比受信标记到两个边缘的位置更近。值得注意的是,不同于受信标记,非字母数字图案没有必要初始确定书的位置,尺寸或方向。因此,原则上非字母数字图案在尺寸和/或方向上可以是模糊,因为该图案的这些方面可以参考书中的受信标记来分辨。现在参照图8,示出了正在翻页时的书的摄像机视图。值得注意的是,由于非字母数字图案比同页面上的受信标记距离面对摄像机的书的边缘更近,可以在打开页面的过程中更早地由摄像机捕获到它,从而提供关于用户翻转书页时将要打开哪一页面的早期指示。在图8的例子中,书是当前打开在第3和第4页面(1003,1004)的,这些页面的受信标记(1013,1014)是可见的,他们各自的非字母数字图案1043A和1044B(在本例中对于该相对的页对表示为相同的图案的镜像)也是可见的。此外,对应于书的第5和第6页面的非字母数字图案1046B由于第4页面的翻转是可见的。应理解书第6页面上的受信标记不会变得完全可见直到第4页面更进一步翻转。还应理解,高对比度的图案(1030C,D)在书的封皮上的位置指示将要打开一页面,并且不是正在合上该书。为了向打开的页面提供早期且适当的增强,可以使用从第3页面和(对于现在来说)第4页面上可见受托标记处获得的关于书的位置,尺寸和方向的知识来识别非字母数字图案1046B。因此,尽管不能访问第6页面上的受信标记,尽管非字母数字图案可能有旋转模糊性,当与在不同的、当前可见的书页面上的受信标记所指示的书的尺寸和方向一同使用时,仍可以使用非字母数字的图案来指示至少相对的页面对。因此,除了很早就在遮挡页的翻转中使用通用增强,现在给定来自不同页面上的受信标记的关于书的位置,尺寸和方向的知识以及通过新页面上的非字母数字图案更早地识别出正在打开哪个页面,在打开页面的过程中可以更早地对该部分打开的页面进行正确的增强,这对用户来说大大提高了沉浸感和消除了怀疑。现在还参考图9,书1000,娱乐设备10和附接到或集成在娱乐设备的摄相机756一起形成增强现实系统1,其中书的上述特征使得了上述娱乐设备的消除模糊(disambiguation)和增强过程成为可能。因此,在本发明的概括实施例中,增强现实系统1中使用的书1000包括多个硬的页,每一页的面形成了书页面(1001,1002),其中每个这样的页面包括受信标记(1101,1102);并具有比所述书的页更大的尺寸的封皮,因此具有延伸超出所述页面的外边缘的末端,并且在其中封皮的内侧包括沿着至少一个这样的第一末端的第一高对比度的图案(1030A,B,C,D)。在本实施例的一个实例中,封皮具有预定的厚度(例如大约1至5毫米),第一高对比度的图案延伸超过封皮的边缘并且跨越至少封皮厚度的预定的比例,例如厚度的一半。在本实施例的一个实例中,在正常使用中所述第一高对比度的图案至少沿着面对增强现实系统的摄像机的书的第一末端延伸。如前所述,正常使用通常是,用户面对着电视机,在他们与电视机之间拿着或放置一本书,书被定向使得书脊大体上朝向电视机或视频摄像机(不包括任何与书的有效的相互作用或关于其放置的具体说明),并且用于捕获书的图像的视频摄像机在电视附近并且朝向用户和书所在的地方。在本实施例的一个实例中,在正常使用中高对比度的图案沿延伸超出由增强现实系统的视频摄像机观测的书页面的顶部或底部边缘的每个末端延伸。换言之,图案沿垂直于书脊的末端延伸。在这种情况下,这个图案可以是沿着与书脊重合的中心线反射的第一高对比度的图案,如图7中所示。在任何情况下,如前所述第一高对比度的图案可以对关于这本书的信息进行编码。在本实施例的一个实例中,在正常使用中第二高对比度的图案(1035R,L)沿延伸超出由增强现实系统的视频摄像机观测的书页面的左边缘或右边缘的每个末端延伸。换言之,图案沿着与书脊平行的末端延伸。在这种情况下,如前所述第二高对比度的图案可以将不同的信息编码进第一高对比度的图案。在本实施例的一个实例,所述书可以包括一个或多个非字母数字的图案(1040A,B,C,D),并且在页面上这样的非字母数字图案的位置比该页面上的受信标记更接近该页面的外边缘。如前所述,则当与在不同页面上的受信标记所指示的书的尺寸和方向一同使用时,非字母数字的图案能够至少指示包括非字母数字图案所在的各页面的相对的页面对。在概要实施例中,在增强现实系统中使用娱乐设备10,娱乐设备10包括:输入部件,如USB连接器710或无线链路(730,740),其可用于接收书的视频图像。该娱乐设备还包括:图像处理部件,如在适当的软件指令下工作的单元处理器100,用于从所捕获的视频图像中的书的受信标记来估计书的位置和方向,以及图像处理部件,再次地例如在适当的软件指令下工作的单元处理器100,用于估计在所捕获的视频图像中的书的封皮内页的末端上的第一高对比度的图案的位置和方向。在该概要实施例中,所述图像处理部件可用于响应于第一高对比度的图案的位置和方向,在独立于书的封皮只翻转书的一页或多页和相对于翻转书的封皮之间进行区分。换句话说,根据一个或多个该书的受信标记,给定关于书的位置的估计,如果书的封皮保持静止,娱乐设备可以估计出高对比度的图案应该;所在的位置。如果当娱乐设备检测到一个或多个页正在翻转时,封皮仍然静止,那么可以假定正在打开新的页面,而如果封面移动(或可选地,如果他们以对应于一个页或多个页翻转的方式移动),那么就可以假定正在合上这本书并且没有打开新的页面。在本实施例的一个实例中,娱乐设备包括:处理器部件,如单元处理器100和/或RSX200,可用于使用一个或多个图形元素来对所捕获的书的视频图像进行增强,并且其中,在图像处理部件检测到独立于书的封皮地翻转书的一个或多个页的情况下,该处理器部件使用部分打开的已增强的书页面的代表对书的图像进行增强。在本实施例的一个实例中,娱乐设备包括:处理器部件,如单元处理器100和/或RSX200,在图像处理部件使用根据书中不同页面的受信标记估计而来的尺寸和方向信息在该页上检测到非字母数字图案(1040,A,B,C,D)的情况下,该处理器部件可使用对应的部分打开的已增强的书页面的页面特定代表对书的图像进行增强。在概要实施例中,增强现实系统包括所述类型的书和娱乐设备,以及视频摄像机例如EyeToy或PlayStationEye756,被布置为用于向娱乐设备的输入部件提供捕获的视频图像。现在转向图10,一种对书的视频图像进行增强的方法包括:在第一步骤s110中,接收其中有一个或多个可见页面的书的视频图像,并且其中每个可见页面包括受信标记,并且其中第一高对比度的图案在延伸超过所述页面的外边缘的书的封皮内页的末端是可见的。在第二步骤s120中,根据视频图像中的受信标记对书的位置和方向进行估计。在第三步骤s130中,估计视频图像中的第一高对比度的图案的位置和方向。以及在第四步骤s140中,响应于第一高对比度的图案的位置和方向,在独立于书的封皮只翻转书的一页面或多页面和相对于翻转书的封皮之间进行区分。对本领域技术人员来说,对应于所述装置的各种实施例的操作的在本文中描述并要求保护的上述方法的各种变型是在本发明的范围内的,这是显而易见的。最后,应理解,本文所公开的方法,可以在通过软件指令或通过包括或替换为专用硬件而适当地修改为适用的传统的硬件上实施。因此,所要求的对传统等效设备的现有部件的修改可以以下列形式实现:非临时性的计算机程序产品,或类似的制造物品包括存储在数据载体(如软盘、光盘、硬盘、PROM、RAM、闪存或者这些或其他存储介质的任意组合)上的处理器可执行的指令,或以这样的形式:通过网络(例如以太网、无线网络、互联网、或这些任何组合和其他网络)上的数据信号的传输内容,或在硬件中实现为ASIC(专用集成电路)或FPGA(现场可编程门阵列),或其他适合在修改传统等效设备中使用的可配置的电路。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1