基于高速缓存的扭曲引擎的制作方法

文档序号:31726062发布日期:2022-10-05 00:36阅读:24来源:国知局
1.本发明涉及使用高速缓冲存储器的图像扭曲系统及其方法。更具体地,本发明涉及能够使用高速缓冲存储器以低成本执行图像扭曲的图像扭曲系统和方法。
背景技术
::2.图像扭曲是指通过根据某些规则对原始图像进行重新取样来变换原始图像的几何形状。作为示例,例示了校正拍摄图像的镜头失真以生成校正了镜头失真的图像。图像扭曲还可以用于匹配立体图像的图像校正或用于通过合成多个图像来构成全景图像。3.图像扭曲通过原始图像与变形图像之间的像素坐标转换的过程来执行。变形图像的像素的坐标(x,y)之间的变换规则可以由预定的映射函数来表示。有许多讨论了扭曲技术的现有技术可用。4.公开图像扭曲技术的许多现有技术中的一者是转让给教堂山的北卡罗来纳大学的公开了图像扭曲技术的美国专利第6756993b2号。该发明提供了用于渲染图像的方法和装置,更具体地,涉及用于使用3d扭曲技术渲染图像的方法和装置。该专利论述了双线性地对图像进行插值以生成插值输出图像的方法。所公开的扭曲技术从变形图像中去除失真并产生无失真图像。然而,所描述的技术仅能够从变形图像中去除失真,而不能执行几何变换、全景生成和两个图像的混合。5.转让给威斯康星校友研究基金会的另一美国专利第8649558b2号涉及处理图像数据,更具体地,涉及用于扭曲视频数据的设备、系统和方法。视频数据通过针对多个源视频帧中的每一者调整大小来处理,以扭曲(例如,调整大小)视频数据以供显示。该专利通过引入特征(例如几何变换、全景生成和混合)克服了上述专利的缺点。然而,该专利不包括基于高速缓存的扭曲引擎来存储图像以供其稍后使用。因此,所公开的图像扭曲技术成为昂贵且耗时的技术。6.为了克服上述专利的局限性,韩国专利第101540300b1号转让给机器人(robot)公司,涉及使用高速缓冲存储器的图像扭曲系统及其方法。然而,所公开的技术仅支持一种图像格式,并且仅执行失真校正。7.因此,为了克服所述现有技术的缺点,已经公开了基于高速缓存的扭曲引擎,其对输入图像执行失真校正、全景生成和透视校正。而且,基于高速缓存的扭曲引擎利用非常少的高速缓冲存储器来加速引擎过程,从而显著降低扭曲成本。8.现在很明显,在现有技术中开发了适合各种目的的许多方法和系统。此外,虽然这些发明可能适于它们所针对的特定目的,但它们因此将不适于如上所述的本发明的目的。技术实现要素:9.本发明的目的是提供一种图像扭曲系统,其能够通过利用高速缓冲存储器以低成本迅速地执行图像扭曲。本发明的实施例提供了对在本领域中的用于使用基于高速缓存的扭曲引擎(warpengine)来扭曲全景图像的系统和方法的上述和其它问题的解决方案。具体地,所公开的系统和方法在不考虑图像内容的情况下通过使用基于高速缓存的扭曲引擎来扭曲具有偏斜边界的全景数字图像以拟合(fit)预定形状来生成增强的全景图像,该基于高速缓存的扭曲引擎能够支持多个图像格式。10.本发明的主要目的是提供一种基于高速缓存的扭曲引擎,其执行图像失真校正、几何变换、全景生成以及两个或更多图像在一起的混合。基于高速缓存的扭曲引擎减少了ddrsdram访问时间和ddrsdram带宽要求,而且减少了本地sram要求。另外,引擎统一多个图像格式处理速度,从而使得引擎处理速度独立于图像格式。基于扭曲的引擎所支持的不同类型的图像格式包括rgb888、rgb888-平面、yuv422、nv12和nv21以及yuv420(平面)。11.根据本发明的一个方面,提供了一种图像扭曲系统,其用于通过扭曲包括多个原始图像块的原始图像来生成包括多个像素组的变换图像。在主要实施例中,原始图像存储在电子设备的ddrsdram中。设备的高速缓冲存储器在sram(静态ram)中实现,以存储输入图像数据,以供基于高速缓存的扭曲引擎访问。高速缓冲存储器通常包括sram,sram比ddr更昂贵但可提供高得多的带宽。输入图像存储在ddrsdram中,且仅一部分图像数据加载到高速缓冲存储器,以加速引擎过程。设备的高速缓冲存储器由存储输入图像数据的多个高速缓存行组成。本发明通常支持32k字节的高速缓存;然而,高速缓冲存储器的大小是可配置的。进一步地,各个高速缓存行的大小是可配置的。12.本发明的另一目的是提供一种高速缓存查找表,其存储在高速缓冲存储器内,用于存储要顺次加载到高速缓冲存储器中原始图像块的顺序信息。高速缓存查找表包括定义与输入图像有关的信息的多个坐标。输出图像的坐标包括用于x坐标的2个字节和用于y坐标的2个字节。图像扭曲系统可以使用图像查找表来对原始图像执行图像扭曲,从而生成扭曲的图像。图像查找表可以是存储变换图像中包括的像素与原始图像中包括的像素之间的映射信息的查找表。13.本发明的基于高速缓存的扭曲引擎将使用坐标来将输入图像映射到输出图像。输出图像的坐标从左到右和从上到下是固定的。引擎将跟随坐标的输出序列,并查看扭曲表以确定引擎应该抓取输入数据的哪个部分。扭曲引擎使用相同的高速缓存行和相同的高速缓存大小来支持不同的图像格式。各个图像格式支持之间的唯一差别是带宽要求,不同的图像格式要求不同的带宽以实现相同的帧速率。14.然后,扭曲引擎通过基于输入图像的多个坐标双线性地或双三次地对输入图像进行插值来执行扭曲操作。基于高速缓存的扭曲引擎支持双线性和双三次图像插值技术。双三次插值提供了比双线性插值所实现的图像质量更好的图像质量。扭曲引擎的处理器通过光栅扫描方法计算输出图像。15.根据本发明的另一方面,提供了一种图像扭曲系统,其包括处理器和用于存储由处理器执行的计算机程序的存储器,其中,计算机程序在由处理器执行时实现上述方法。提供了一种图像扭曲系统,其用于使得执行上述方法。16.从以下结合附图采取的详细描述中,本发明的其它目的和方面将变得显而易见,附图以示例的方式例示了根据本发明实施例的特征。17.为了实现上述和有关目的,本发明可以以附图中例示的形式来实施,然而,注意附图仅是说明性的,并且在所附权利要求的范围内可以对所例示和所描述的具体构造进行改变。18.尽管上文根据各种示例性实施例和实现方式描述了本发明,但是应当理解,在一个或多个单独实施例中描述的各种特征、方面和功能不限于它们对描述它们的特定实施例的适用性,而是可以单独地或以各种组合应用于本发明的一个或多个其它实施例,无论是否描述了这些实施例,并且无论这些特征是否作为所描述的实施例的一部分呈现。因此,本发明的广度和范围不应被任何上述示例性实施例限制。19.在一些情况下,例如“一个或多个”、“至少”、“但不限于”或其他类似短语的扩展词和短语的存在不应被理解为意指在可能不存在这种扩展短语的情况下预期或要求较窄的情况。附图说明20.根据结合附图采取的下面的描述和所附权利要求,本发明的目的和特征将变得更加明显。应当理解,这些附图仅描述了本发明的典型实施例,因此不应被认为是对本发明范围的限制,将通过使用附图来描述和解释本发明的额外特征和细节,附图中:21.图1例示了使用基于高速缓存的扭曲引擎扭曲输入图像的方法;22.图2例示了根据本发明的用于扭曲输入图像的系统;23.图3例示了根据本发明的系统的输入设备;24.图4例示了根据本发明的系统的基于高速缓存的扭曲引擎;25.图5例示了根据本发明的失真输入图像和无失真输出图像的坐标;26.图6a例示了根据本发明的高速缓存标签;27.图6b例示了根据本发明的扭曲高速缓存行访问;以及28.图6c例示了根据本发明的用于访问高速缓存行的扭曲高速缓存存储体。具体实施方式29.内容(例如视觉内容)可以由一个或多个图像捕捉设备(例如相机)捕捉为更多图像或视频帧。图像捕捉设备包括一个或多个透镜、图像传感器、图像信号处理器、编码器等。透镜可以接收光并将光聚焦在图像传感器上。图像传感器可以对光进行采样并生成电子图像信号。图像信号处理器(isp)可以从图像传感器接收图像信号,并且可以处理图像信号以生成图像、图片或帧。所生成的图像可存储在例如图像捕捉设备的存储器中。30.一些图像捕捉设备使用使所捕捉的图像显著失真的透镜(例如,鱼眼或球面透镜)。图像信号处理器可应用扭曲变换来校正透镜失真和与用一个或多个图像传感器捕捉图像相关联的其它失真(例如,电子卷帘快门校正、双眼视差校正、图像拼接、电子图像稳定等)。因为这些失真中的一些失真可能显著,所以校正失真的扭曲变换可能显著地移动(一个或多个)图像内的部分(例如,像素或像素块)。31.图1例示了用于使用基于高速缓存的扭曲引擎扭曲输入图像的方法。扭曲引擎执行图像失真校正、几何变换、全景生成以及两个或更多图像在一起的混合。基于高速缓存的扭曲引擎减少了ddrsdram访问时间和ddrsdram带宽要求,而且减少了本地sram要求。另外,引擎统一多个图像格式处理速度,从而使得引擎处理速度独立于图像格式。32.用于使用基于高速缓存的扭曲引擎来扭曲输入图像的方法包括:从设备的ddrsdram访问输入图像102。接下来,方法包括:将输入图像的一部分加载到设备的高速缓冲存储器104。设备的高速缓冲存储器在sram(静态ram)中实现。设备的高速缓冲存储器由存储输入图像数据的多个高速缓存行组成。本发明通常支持32k字节的高速缓存;然而,高速缓冲存储器的大小是可配置的。另外,各个高速缓存行的大小是可配置的。从高速缓冲存储器而不是ddrsdram中访问输入图像的一部分降低了本地存储(sram)要求。这进一步减少ddrsdram访问时间和ddrsdram带宽要求。33.在下一步骤106中,完成利用一些初步信息对存储在高速缓冲存储器中的查找表的预加载。lut(lookuptable)包括输入图像的多个坐标。高速缓存查找表包括定义与输入图像有关的信息的多个坐标。图像扭曲系统可以使用图像查找表来对原始图像执行图像扭曲,从而生成扭曲的图像。输出图像的坐标包括用于x坐标的2个字节和用于y坐标的2个字节。在下一步骤中,扭曲引擎跟随所述多个坐标,其中,引擎使用坐标来将输入图像映射到输出图像。本发明的基于高速缓存的扭曲引擎将使用坐标来将输入图像映射到输出图像。输出图像的坐标从左到右和从上到下是固定的。引擎将跟随坐标的输出序列,并查看扭曲表以确定引擎应该抓取输入数据的哪个部分。34.在跟随坐标之后,使用输入图像通过映射(使用不同的坐标通过双线性地或双三次地对输入图像进行插值来进行)输入图像形成插值图像108。双线性插值包括使用四个最近像素值的距离加权平均来估计新像素值的重新采样方法。来自输入光栅的四个单元中心最接近输出处理单元的单元中心,将基于距离加权,然后求平均。双三次插值是使用三次样条或其他多项式技术来锐化和放大数字图像的2d系统。在下一步骤中,使用光栅扫描方法,由扭曲引擎计算准备显示给用户的输出图像110。可以将输出图像存储在电子设备的ddrsdram中112。35.图2例示了用于扭曲输入图像的系统。在一个实施例中,原始图像存储在输入设备202的ddrsdram204中。双倍数据速率同步动态随机存取存储器(正式缩写为ddrsdram)是计算机中使用的双倍数据速率(ddr)同步动态随机存取存储器(sdram)类的存储器集成电路。在主要实施例中,输入设备202是台式计算机。在替代实施例中,设备可以是便携式设备(例如,膝上型计算机、平板计算机或手持设备)。设备可以具有触摸板和触敏显示器(也称为“触摸屏”或“触摸屏显示器”)。36.设备的高速缓冲存储器206在sram(静态ram)中实现,以存储输入图像数据,以供基于高速缓存的扭曲引擎210访问。高速缓冲存储器206通常包括sram,sram比ddrsdram更昂贵但可提供高得多的带宽。设备202的高速缓冲存储器206由存储输入图像数据的多个高速缓存行组成。本发明通常支持32k字节的高速缓存;然而,高速缓冲存储器206的大小是可配置的。另外,各个高速缓存行的大小是可配置的。37.高速缓冲存储器206是特殊的非常高速存储器。高速缓冲存储器206用于高速cpu的加速和同步。高速缓冲存储器206用于减少从主存储器访问数据的平均时间。高速缓存是更小且更快的存储器,其存储来自频繁使用的主存储器单元(memorylocation)的数据的副本。在cpu中存在各种不同的独立高速缓存,其存储指令和数据。当处理器需要读或写主存储器中的单元时,处理器首先检查高速缓存中的对应条目。存在用于高速缓冲存储器206的目的的三种不同类型的映射,如下:直接映射、相联映射(associativemapping)和组相联映射(set-associativemapping)。38.高速缓冲存储器206被分成多个行,其存储包括要被变换以获得输出图像的输入图像的数据。电子设备的高速缓冲存储器206访问输入图像的一小部分,以便加速引擎210过程。这使得扭曲引擎210能够直接从高速缓冲存储器206而不是从ddrsdram204访问输入图像。从高速缓冲存储器206而不是ddrsdram中访问输入图像的一部分降低了本地存储(sram)要求。这进一步减少ddrsdram访问时间和ddrsdram带宽要求。39.高速缓冲存储器206包括存储关于输入图像的一些信息的高速缓存lut或高速缓存查找表208。高速缓存查找表208存储由扭曲引擎210(在随后的段落中描述)利用以获得输出图像的输入图像坐标。高速缓存查找表208是8×8间隔(interval)查找表208,其包含用于x坐标的2个字节和用于y坐标的2个字节。高速缓存查找表208还支持多达4095×4095的图像大小。查找表208不需要高速缓冲存储器206内的大量存储空间。需要非常小的高速缓存大小(几千字节)来存储高速缓存查找表208。本发明的基于高速缓存的扭曲引擎210将使用坐标来将输入图像映射到输出图像。输出图像的坐标从左到右和从上到下是固定的。引擎210将跟随坐标的输出序列,并查看扭曲表208以确定引擎210应该抓取输入数据的哪个部分。40.另外,本发明公开了一种基于高速缓存的扭曲引擎210,其对输入图像执行扭曲操作,并提供无失真的变换后的输出图像。基于高速缓存的扭曲引擎210包括用于向高速缓存查找表加载坐标集的预加载器212。这些坐标集基于输入图像的坐标。扭曲引擎210还包括跟随输入图像的坐标集的跟随器和图像插值器214。图像插值器214双线性地或双三次地对输入图像进行插值。本发明的插值方法使用简单的线性等式来获得插值后的像素值,从而显著地减少了计算量,由此有利于硬件实现和降低了成本。41.本发明的基于高速缓存的扭曲引擎210能够支持双线性和双三次插值技术。双三次插值提供了比双线性插值更好的图像质量。扭曲引擎210支持用于不同应用的许多图像格式,包括rgb888(平面和非平面)、yuv444、yuv422(平面)和nv12。扭曲引擎210使用相同的高速缓存行和相同的高速缓存大小来支持这些图像格式。各个图像格式支持之间的唯一差别是带宽要求,不同的图像格式要求不同的带宽以实现相同的帧速率。扭曲引擎210执行图像失真校正、几何变换、全景生成以及两个或更多图像在一起的混合。基于高速缓存的扭曲引擎210减少了ddrsdram访问时间和ddrsdram带宽要求,而且降低了本地sram要求。另外,引擎210统一多个图像格式处理速度,从而使得引擎210处理速度独立于图像格式。42.用于通过光栅扫描插值图像来计算输出图像的处理器216安装在基于高速缓存的扭曲引擎内部。在光栅扫描方法中,电子束自上而下一次一行地扫过屏幕。基于高速缓存的扭曲引擎还包括用于存储由处理器216计算的输出图像的存储器元件218。然后,将所存储的图像加载到电子设备的ddrsdram。43.图3例示了根据本发明的输入设备300。扭曲由实体系统来实现,该实体系统向用户提供在输入图像与终端用户显示设备300之间起作用的系统。在这些上下文中,可以在图像显示设备300上执行图像处理/变换和有关操作。图像扭曲引擎输出扭曲后的图像数据,该扭曲后的图像数据被提供用于输出到显示器(例如调整大小的显示器),其中以示例的方式示出了手持设备和平板显示器(例如,用于计算机或电视)。在主要实施例中,输入设备300是台式计算机。在替代实施例中,设备是便携式的(例如,膝上型计算机、平板计算机或手持设备)。设备可以具有触摸板和触敏显示器(也称为“触摸屏”或“触摸屏显示器”)。44.另外,各种组件中的每一者可在软件实现的模块中、在逻辑电路、处理器或计算机中执行。这些软件实现的模块可以部分地或全部地在手持设备300(例如移动电话设备或平板设备)中执行。在某些实施例中,这些模块的方面在远离显示设备300(例如,移动电话)的位置处执行,并且可以基于视频被流式传输到的手持设备300处的已知屏幕大小约束来执行。45.本发明的输入设备300包括用于存储输入图像的ddrsdram302。在一个实施例中,原始图像存储在电子设备300的ddrsdram302中。双倍数据速率同步动态随机存取存储器(正式缩写为ddrsdram)是计算机中使用的双倍数据速率(ddr)同步动态随机存取存储器(sdram)类的存储器集成电路。46.输入设备300还包括高速缓冲存储器304。根据本发明,提供了一种高速缓冲存储器304,其包括多个高速缓存块和将被顺次地加载到高速缓冲存储器304中的多个高速缓存块。高速缓冲存储器304包括存储关于输入图像的一些信息的高速缓存lut或高速缓存查找表306。高速缓存查找表306存储由扭曲引擎(在随后的段落中描述)利用以获得输出图像的输入图像坐标。高速缓存查找表306是8×8间隔查找表,其包含用于x坐标的2个字节和用于y坐标的2个字节。高速缓存查找表306还支持多达4095×4095的图像大小。47.查找表306不需要高速缓冲存储器304内的大量存储空间。需要非常小的高速缓存大小(几千字节)来存储高速缓存查找表306。本发明的基于高速缓存的扭曲引擎将使用输出图像的坐标来将输入图像映射到输出图像。输出图像的坐标从左到右和从上到下是固定的。引擎将跟随坐标的输出序列,并查看扭曲表306以确定引擎应该抓取输入数据的哪个部分。48.图4例示了根据本发明的基于高速缓存的扭曲引擎。基于高速缓存的扭曲引擎400包括预加载器402,其向高速缓存查找表加载要基于输入图像的坐标获得的输出图像的坐标集。坐标的加载在坐标加载单元404的帮助下完成,该坐标加载单元404将输入图像的坐标存储在预加载器402内。本发明的基于高速缓存的扭曲引擎400将使用输出图像的坐标来将输入图像映射到输出图像。输出图像的坐标从左到右和从上到下是固定的。引擎将跟随坐标的输出序列,并查看扭曲表以确定引擎应该抓取输入数据的哪个部分。49.高速缓存查找表是8×8间隔查找表,其包含用于x坐标的2个字节和用于y坐标的2个字节。高速缓存查找表还支持多达4095×4095的图像大小。查找表不需要高速缓冲存储器内的大量存储空间。需要非常小的高速缓存大小(几千字节)来存储高速缓存查找表。50.另外,基于高速缓存的扭曲引擎包括用于对输入图像进行插值的图像插值器406。基于高速缓存的扭曲引擎支持双线性和双三次插值。为了使插值器执行输入图像的插值,插值器包括双线性插值单元408和双三次插值单元410。本发明的插值方法使用简单的线性等式来获得插值后的像素值,从而显著地减少了计算量,由此有利于硬件实现和降低了成本。51.双线性插值包括使用四个最近像素值的距离加权平均来估计新像素值的重新采样方法。来自输入光栅的四个单元中心最接近输出处理单元的单元中心,将基于距离加权,然后求平均。双三次插值是使用三次样条或其他多项式技术来锐化和放大数字图像的2d系统。在下一步骤中,使用光栅扫描方法,由扭曲引擎400计算准备显示给用户的输出图像。输出图像可以存储在电子设备的ddrsdram中。包括输出图像计算器414的处理器412安装在基于高速缓存的扭曲引擎400内部,以在使用光栅扫描方法扫描输出图像之后计算输出图像。引擎400还具有用于存储所获得的输出图像的存储器416。存储器416将输出图像加载到电子设备的ddrsdram。52.图5例示了根据本发明的失真输入图像和无失真输出图像的坐标。在图500中例示了失真的输入图像502和没有失真的输出图像504。如图所示,在该图中示出了没有均匀边界的输入图像502。输入图像502具有两个以绿色和红色标记的区域,其被示出为失真的。输入图像的红色区域502b的坐标被示出为a0、a1、a2、a3。坐标在边界之外,并且与图中的灰色区域502a重叠,这使其失真。53.输入图像502中以绿色示出的区域502c具有坐标b0、b1、b2、b3。坐标在边界之外,并且与图中的红色区域502b重叠,这使其失真。为了去除失真,扭曲引擎采用扭曲技术来使输入图像502的边界均匀。包括红色区域502b和绿色区域502c的输入图像502的像素或坐标存储在高速缓冲存储器内的高速缓存查找表中,并且在图像插值过程期间利用。预加载查找表的过程在插值操作之前开始。一旦所有需要的输入像素从ddrsdram加载到高速缓冲存储器,扭曲引擎就被设定为继续进行插值过程。54.首先,将输入图像502的红色区域502b加载到高速缓冲存储器中,之后开始红色区域的处理。在红色区域502b的处理继续进行的同时,将输入图像502的绿色区域502c加载到高速缓冲存储器中。一旦完成了绿色区域502c的加载,扭曲引擎就开始处理输入图像502的绿色区域502c。一旦所有需要的输入像素从ddrsdram加载到高速缓冲存储器,扭曲引擎就被设定为继续进行插值过程。扭曲将处理并输出第一行中的16个块,然后处理并输出第二行中的16个块,在竖直地处理并输出前16个块之后,扭曲然后将在第一行中水平地处理后16个块。这将最小化高速缓存大小,而不管图像大小、失真和变换类型。扭曲引擎支持双线性和双三次插值方法,以对输入图像502进行插值并生成输出图像504。55.在通过基于高速缓存的扭曲引擎对输入图像502进行插值的过程之后,获得具有零失真和自始至终具有均匀边界的输出图像504。如图中可以看到的,获得了具有与输入图像502相同坐标的输出图像504。红色区域502b和绿色区域502c的失真已被去除,从而产生8×8像素红色区域504a和8×8像素绿色区域504b。输出图像504的8×8红色块504a从输入图像502的红色区域502b插值,而输出图像504的8×8绿色块504b从输入图像502的绿色区域502c插值。56.图6a例示了根据本发明的高速缓存标签。高速缓冲存储器具有两个标签;取决于高速缓存行大小的水平标签和取决于高速缓存行的数量的竖直标签。保持标签600a以允许高速缓存从高速缓存地址(标签、索引和偏移)转换为唯一的cpu地址。高速缓存命中意味着cpu试图访问地址,并且匹配的高速缓存块(索引、偏移和匹配标签)在高速缓存中可用。57.每个高速缓存块关联有至少修改和有效位、以及标签地址。有效位表明高速缓存块是被使用(具有有效数据)还是未被使用。修改位仅在有效位被置位时才有意义。修改位表明高速缓存块中的数据是不同于ram(修改)还是与ram相同。如果在从未决读或写中解码cpu地址之后,cpu地址的标签字段匹配与由(索引、偏移)给出的高速缓存地址处的高速缓存块关联的标签,则标签被称为匹配标签。58.如果高速缓存是n路组相联的,那么高速缓存地址(索引、偏移)不仅指定一个高速缓存块,而且指定一组n个高速缓存块。在从高速缓存读取或向高速缓存写入时,如果该组中的任何高速缓存块具有匹配标签,那么这是高速缓存命中,并且使用该高速缓存块。如果在该组中没有高速缓存块具有匹配标签,那么这是高速缓存未命中,并且选择该组的一个高速缓存块用于替换。来自该高速缓存块的数据被写回ram,以为新数据腾出空间,就像在状态转变中标签不匹配的情况一样。59.图6b例示了根据本发明的扭曲高速缓存行访问。本发明的扭曲引擎支持双三次和双线性插值技术。在最坏情况的情形下,双三次插值技术需要访问8个高速缓存行来输出1个像素。60.在双线性插值技术的最坏情况的情形下,双线性插值技术需要访问4个高速缓存行来输出1个像素。从统计结果来看,以双三次访问8个高速缓存行的可能性是大约2.4%,4个高速缓存行访问对于1个像素输出/时钟将是足够好的。61.图6c例示了用于访问高速缓存行的扭曲高速缓存存储体。如图所示的图6b描述了用于同时访问4个高速缓存行的高速缓存存储体。提供了一种存储器高速缓存存储体预测单元,其用于具有多个存储器高速缓存存储体的处理器。该存储器高速缓存存储体预测单元具有接收指令的输入端口。存储器高速缓存存储体预测单元还具有耦合到输入端口的评估单元,其预测多个存储器高速缓存存储体中的哪一者与指令相关联。62.整个高速缓冲存储器有4个存储体。在图6b中,示出了用于双线性和双三次插值的存储体组织结构。在左边是用于双线性插值的存储体组织结构602c,而在右边是用于双三次插值技术的存储体组织结构604c。63.尽管上面已经描述了本发明的各种实施例,但应该理解,它们仅以示例的方式呈现,而不是限制性的。同样,附图可以描述本发明的示例架构或其他配置,这样做是为了帮助理解可以包括在本发明中的特征和功能。本发明不限于所说明的示例架构或配置,而是可使用多种替代架构和配置来实现期望的特征。64.尽管上文根据各种示例性实施例和实现方式描述了本发明,但是应当理解,在一个或多个单独实施例中描述的各种特征、方面和功能不限于它们对描述它们的特定实施例的适用性,而是可以单独地或以各种组合应用于本发明的一个或多个其它实施例,无论是否描述了这些实施例,并且无论这些特征是否作为所描述的实施例的一部分呈现。因此,本发明的广度和范围不应被任何上述示例性实施例限制。65.在一些情况下,例如“一个或多个”、“至少”、“但不限于”或其他类似短语的扩展词和短语的存在不应被理解为意指在可能不存在这种扩展短语的情况下预期或要求较窄的情况。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1