之前我们已经介绍了顶点着色器,管线的下一步是片段着色器,这是大部分OpenGL ES 3.0视觉魔法发生的地方。片段着色器的核心方面是对表面应用纹理。
纹理基础
3D图形渲染中最基本的操作之一是对一个表面应用纹理。纹理可以表现只从网格的几何形状中无法得到的附加细节。OpenGL ES 3.0中的纹理有多种形式:2D纹理、2D纹理数组、3D纹理和立方图纹理。
纹理通常使用纹理坐标应用到一个表面,纹理坐标可以视为纹理数组数据中的索引。
2D纹理
2D纹理是OpenGL ES中最基本和常用的纹理形式,是一个图形数据的二维数组。一个纹理的单独数据元素称作”纹素“(Texel,”texture pixels“(纹理像素)的简写)。OpenGL ES中的纹理图像数据可以用许多不同的基本格式表现。纹理数据可用的基本格式如下表:
基本格式 | 纹素数据描述 |
---|---|
GL_RED | (红) |
GL_RG | (红,绿) |
GL_RGB | (红,绿,蓝) |
GL_RGBA | (红,绿,蓝,Alpha) |
GL_LUMINANCE | (亮度) |
GL_LUMINANCE_ALPHA | (亮度,Alpha) |
GL_ALPHA | (Alpha) |
GL_DEPTH_COMPONENT | (深度) |
GL_DEPTH_STENCIL | (深度,模板) |
GL_RED_INTEGER | (整数红) |
GL_RG_INTEGER | (整数红,整数绿) |
GL_RGB_INTEGER | (整数红,整数绿,整数蓝) |
GL_RGBA_INTERGER | (整数红,整数绿,整数蓝,整数Alpha) |
图像中的每个纹素根据基本格式和数据类型指定。用2D纹理渲染时,纹理坐标用作纹理图形中的索引。一般来说,在3D内容创作程序中将制作一个网格,每个顶点都有一个纹理坐标。2D纹理的纹理坐标用一对2D坐标(s, t)指定,有时也称作(u, v)坐标。这些坐标代表用于查找一个纹理贴图的规范化坐标。
纹理图像的左下角由st
坐标(0.0, 0.0)指定,右上角由st
坐标(1.0, 1.0)指定。在[0.0, 1.0]区间之外的坐标是允许的,在该区间之外的纹理读取行为由纹理包装模式定义。
立方图纹理
除了2D纹理之外,OpenGL ES 3.0还支持立方图纹理。从最基本的特征讲,立方图就是一个由6个单独2D纹理面组成的纹理。立方图的每个面代表立方体六面中的一个。虽然立方图在3D渲染中有多重高级的使用方式,但是最常用的是所谓的环境贴图特效。对这种特效,环境在物体上的倒影通过使用一个表示环境的立方图渲染。通常,生成环境贴图所用的立方图通过在场景中央防止一个摄像机,从6个轴的方向(+X, -X, +Y, -Y, +Z, -Z)捕捉场景图形并将结果保存在立方体的每个面来生成。
立方图纹素的读取通过使用一个3D向量(s, t, r)作为纹理坐标,在立方图中查找。纹理坐标(s, t, r)代表着3D向量的(x, y, z)分量。这个3D向量首先用于选择立方图中需要读取的一个面,然后该坐标投影到2D坐标(s, t),然后从该面上读取。我们可以通过从一个立方体内部的原点绘制一个3D向量来直观地了解这一过程。这个向量与立方体相交的点就是从立方图读取的纹素。
立方图各个面的指定方法与2D纹理的相同。每个面必须为正方形(宽度和高度必须相等),每个面的宽度和高度都一样。用于纹理坐标的3D向量和2D纹理的不同,通常不直接逐顶点地保存在网格上。相反,立方图通常使用法向量作为计算立方图纹理坐标的基础来读取。一般来说,法向量和一个来自眼睛的向量一起使用,计算出一个反射向量,然后用这个向量在立方图中查找。
3D纹理
OpenGL ES 3.0中的另一类纹理是3D纹理(或者体纹理)。3D纹理可以看做2D纹理多个切片的一个数组,它用一个3元(s, t, r)坐标访问,这与立方体很相似。对于3D纹理,r坐标选择3D纹理中需要采样的切片,(s, t)坐标用于读取每个切片中的2D贴图。下图展示了一个3D纹理,其中每个切片由一个单独的2D纹理组成。3D纹理中的每个mip贴图级别包含上一个级别的纹理中的半数切片。
2D纹理数组
OpenGL ES 3.0中最后一种纹理是2D纹理数组。2D纹理数组与3D纹理很相似,但是用途不同。例如,2D纹理数组尝尝用于存储2D图像的一个动画。数组的每个切片表示纹理动画的一帧。2D纹理数组和3D纹理之间的差别很细微,但是很重要。对于3D纹理,过滤发生在切片之间,而从2D纹理数组中读取只从一个单独的切片采样。mip贴图也不一样。2D纹理数组中的每个mip贴图级别包含与以上级别相同的切片数量。每个2D切片的mip贴图完全独立于其他切片(这与3D纹理的情况不同,3D纹理的每个mip贴图级别只有以上级别切片数量的一半)。
为了在2D纹理数组中定位,需使用与3D纹理一样的纹理坐标(s, t, r),r坐标选择2D纹理数组中要使用的切片,(s, t)坐标用于选择切片,选择的方法与2D纹理完全一样。
纹理对象和纹理的加载
纹理应用的第一步是创建一个纹理对象。纹理对象是一个容器对象,保存渲染所需的纹理数据,例如图像数据、过滤模式和包装模式。在OpenGL ES中,纹理对象用一个无符号整数表示,该整数是纹理对象的一个句柄。用于生成纹理对象的函数是glGenTextures
:
1 | /** |
在创建的时候,glGenTextures
生成的纹理对象是一个空的容器,用于加载纹理数据和参数。纹理对象在应用程序不在需要它们的时候也必须删除。这一步骤通常在应用程序关闭或者游戏级别改变时完成,可以使用glDeleteTextures
实现:
1 | /** |
一旦用glGenTextures
生成了纹理对象ID,应用程序就必须绑定纹理对象进行操作。绑定纹理对象之后,后续的操作(如glTexImage2D
和glTexParameter
)将影响绑定的纹理对象。用于绑定纹理对象的函数是glBindTexture
:
1 | /** |
一旦纹理绑定到一个特定的纹理目标,纹理对象在删除之前就一直绑定到它的目标。生成纹理对象并绑定它之后,使用纹理的下一个步骤是真正地加载图像数据。用于加载2D和立方图纹理的基本函数是glTexImage2D
。此外,在OpenGL ES 3.0中可以使用多种替代方法指定2D纹理,包括不可变纹理(glTexStorage2D
)和glTexSubImage2D
的结合。我们首先从最基本的方法开始–使用glTexImage2D
–并在后面描述不可变纹理。为了获得最佳性能,建议使用不可变纹理。
1 | /** |
下面举个例子,演示了生成纹理对象、绑定该对象然后加载由无符号字节表示的RGB图像数据组成的 2x2 2D纹理:
1 | GLuint textureId; |
在上述代码的第一部分,pixels
数组用简单的2x2纹理数据初始化。这些数据由无符号字节RGB三元组组成,范围为[0, 255]。当着色器中从一个8位无符号字节纹理分量读取数据时,该值从[0, 255]区间被映射到浮点区间[0.0, 1.0]。一般来说,应用程序不会以这种简单的方式创建纹理数据,而从一个图像文件中加载数据。
在调用glTexImage2D
之前,应用程序调用glPixelStorei
设置解包对齐。通过glTexImage2D
上传纹理数据时,像素行被认定为对齐到GL_UNPACK_ALIGNMENT
设置的值。默认情况下,该值为4,意味着像素行被认定为从4字节的边界开始。
这个应用程序将解包对齐设置为1,意味着每个像素行从字节边界开始(换言之,数据被紧密打包)。
1 | /** |
glPixelStorei
的GL_PACK_xxxx
参数对纹理图像上传没有任何影响。打包选项由glReadPixels
使用。glPixelStorei
设置的打包和解包选项是全局状态,不由纹理对象存储,也不与之关联。在实践中,很少使用GL_UNPACK_ALIGNMENT
之外的选项指定纹理。为了完整起见,下表提供了像素存储选项的完整列表。
像素存储选项 | 初始值 | 描述 |
---|---|---|
GL_UNPACK_ALIGNMENT GL_PACK_ALIGNMENT | 4 | 指定图像中各行的对齐方式。默认情况下,图像始于4字节边界。将该值设置为1意味着图像紧密打包,各行到齐到字节边界 |
GL_UNPACK_ROW_LENGTH GL_PACK_ROW_LENGTH | 0 | 如果该值非0,则表示每个图像行中的像素数量。如果该值为0,则行的长度为图像的宽度(也就是紧密打包) |
GL_UNPACK_IMAGE_HEIGHT GL_PACK_IMAGE_HEIGHT | 0 | 如果该值非0,则表示作为3D纹理一部分的图形的每个列中像素的数量。这个选项可以用于在3D纹理的每个切片之间填充列。如果该值为0,则图像中的列数等于高度(也就是紧密打包) |
GL_UNPACK_SKIP_PIXELS GL_PACK_SKIP_PIXELS | 0 | 如果该值非0,则表示行开始处跳过的像素数量 |
GL_UNPACK_SKIP_ROWS GL_PACK_SKIP_ROWS | 0 | 如果该值非0,则表示图像开始时跳过的行数 |
GL_UNPACK_SKIP_IMAGES GL_PACK_SKIP_IMAGES | 0 | 如果该值非0,则表示3D纹理中跳过的图像数 |
代码的最后一部分使用glTexParameteri
将缩小和放大过滤模式设置为GL_NEAREST
。这段代码是必需的,因为我们还没有为纹理加载完整的mip贴图链;因此,必须选择非mip贴图缩小过滤器。用于缩小和放大模式的其他选项是GL_LINEAR
,提供双线性非mip贴图过滤。
纹理过滤和mip贴图
到目前为止,我们对2D纹理的介绍仅限于单个2D图像。尽管这使得我们能够解释纹理的概念,但是OpenGL ES中纹理的指定和使用还有一些其他的方法。这种复杂性与使用单个纹理贴图时发生的视觉伪像和性能问题有关。正如我们到目前为止所描述的那样,纹理坐标用于生成一个2D索引,以从纹理贴图中读取。当缩小和放大过滤器设置为GL_NEAREST
时,就会发生这样的情况:一个纹素将在提供的纹理坐标位置上读取。这称作点采样或者最近采样。
但是,最近采样可能产生严重的视觉伪像,这是因为三角形在屏幕空间中变得较小,在不同像素间的插值中,纹理坐标有很大的跳跃。结果是,从一个大的纹理贴图中去的少量样本,造成锯齿伪像,而且可能造成巨大性能损失。OpenGL ES中解决这类伪像的方案被称作mip贴图(mipmapping)。mip贴图的思路是构建一个图像链–mip贴图链。mip贴图链始于原来指定的图像,后续的每个图像在每个维度上是前一个图像的一半,一直持续到最后达到链底部的1x1纹理。mip贴图级别可以编程生成,一个mip级别中的每个像素通常根据上一级别中相同位置的4个像素的平均值计算(盒式过滤)。
GenMipMap2D函数提供了生成mip贴图链的代码。这个函数以一个RGB8图形作为输入,在前面的图像上执行盒式过滤,生成下一个mip贴图级别。mip贴图链用glTexImage2D
加载。
加载mip贴图链之后,便可以设置过滤模式,以使用mip贴图。结果是我们实现了屏幕像素和纹理像素间的更好比率,从而减少了锯齿伪像。图像的锯齿也减少了,这是因为mip贴图链中的每个图像连续进行过滤,使得高频元素随着贴图链的下移越来越少。
1 | glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, width, height, 0, GL_RGB, GL_UNSIGNED_BYTE, pixels); |
纹理渲染时发生两种过滤:缩小和放大。缩小发生在屏幕上投影的多边形小于纹理尺寸的时候。放大发生在屏幕上投影的多边形大于纹理尺寸的时候。过滤器类型的确定由硬件自动处理,但是API提供了对每种情况下使用的过滤类型的控制。对于放大,mip贴图不起作用,因为我们总是从最大的可用级别采样。对于缩小,可以使用不同的采样模式。所用模式的选择基于你需要实现的显示质量水平以及为了纹理过滤损失多少性能。
过滤模式(和许多其他纹理选项)用glTexParameter[i|f][v]
指定。接下来描述纹理过滤模式。
1 | glTexParameteri(GLenum target, GLenum pname, GLint param) |
pname
为GL_TEXTURE_MAG_FILTER
放大过滤器时,param
可能是GL_NEAREST
或GL_LINEAR
。在GL_NEAREST
放大过滤中,将从最靠近纹理坐标的纹理中取得单点样本。在GL_LINEAR
放大过滤中,将从纹理坐标附近的纹理中取得一个双线性样本(4个样本的平均值)。
pname
为GL_TEXTURE_MIN_FILTER
缩小过滤器时,param
可以设置为如下值的任意一个:
GL_NEAREST
– 从最靠近纹理坐标的纹理中获得一个单点样本。GL_LINEAR
– 从最靠近纹理坐标的纹理中获得一个双线性样本。GL_NEAREST_MIPMAP_NEAREST
– 从所选的最近的mip级别中去的单点样本。GL_NEAREST_MIPMAP_LINEAR
– 从两个最近的mip级别中获得样本,并在这些样本之间插值。GL_LINEAR_MIPMAP_NEAREST
– 从所选的最近mip级别中获得双线性样本。GL_LINEAR_MIPMAP_LINEAR
– 从两个最近的mip级别中获得双线性样本,然后在它们之间插值。这种模式通常被称作三线性过滤,产生所有模式中最佳的质量。
在纹理缩小模式中,只要
GL_NEAREST
和GL_LINEAR
不需要为纹理指定完整的mip贴图链。其他所有模式都要求纹理存在完整的mip贴图链。
选择的纹理过滤模式对性能有一定的影响。如果发生缩小且担心性能,那么使用mip贴图过滤模式通常是大部分硬件上的最佳选择。如果没有mip贴图,则纹理缓存利用率可能非常低,因为读取发生在贴图的少数位置。然而,你选择的过滤模式较高,在硬件中的性能代价就越大。例如,在大部分硬件上,进行双线性过滤的代价低于三线性过滤。我们应该选择一种可以提供所要的质量但是不会对性能有过分负面影响的模式。在某些硬件上,你可能轻松地获得高质量的过滤,特别是在纹理过滤带来的开销不是我们的瓶颈时。这需要在应用程序和计划运行应用程序的硬件上进行调整。
无缝立方图过滤
关于过滤,OpenGL ES 3.0中有一个新变化,与立方图的过滤有关。在OpenGL ES 2.0中,当线性过滤核心落到立方图边缘时,过滤将只发生在立方图的一个面上。这将在立方图各面之间的边上造成伪像。在OpenGL ES 3.0中,立方图过滤现在是无缝的–如果过滤核心跨越立方图不止一个面,核心将会从其覆盖的每个面中获得样本。无缝过滤在立方图各面的边缘形成了更平滑的过滤。在OpenGL ES 3.0中,不需要做任何操作就可以启用无缝立方图过滤,所有线性过滤核心将自动使用它。
自动mip贴图生成
前一节讲述了生成mip贴图的一种途径,但是OpenGL ES 3.0还提供了用glGenerateMipmap
自动生成mip贴图的机制。
1 | /** |
在绑定的纹理对象上调用glGenerateMipmap
时,这个函数将从0级图像的内容生成整个mip贴图链。对于2D纹理,0级纹理内容将持续地被过滤并用于每个后续级别。对于立方图,立方体的每一面都由各面的0级生成。当然,要将这个函数用于立方图,必须为立方体的每个面指定0级,每个面的内部格式、宽度和高度都必须匹配。对于2D纹理数组,数组的每个切片将进行与2D纹理一样的过滤。最后,对于3D纹理,将通过过滤各个切片生成全体的mip贴图。
OpenGL ES 3.0不强制用于生成mip贴图的特定过滤算法(但是规范中推荐盒式过滤,各种实现可以自由地选择他们使用的算法)。如果需要特定的过滤方法,就必须自己生成mip贴图。
在开始使用帧缓冲区对象渲染纹理时,自动化mip贴图生成变得特别重要。当渲染到一个纹理时,我们不希望将纹理的内容读回CPU来生成mip贴图,相反,可以使用glGenerateMipmap
和图形硬件,然后在不需要将数据读回CPU的情况下生成mip贴图。
纹理坐标包装
纹理包装模式用于指定纹理坐标超出[0.0, 1.0]范围时所发生的行为,用glTexParameter[i|f][v]
设置。这些模式可以为s、t、r坐标单独设置。GL_TEXTURE_WRAP_S
模式定义s坐标超出[0.0, 1.0]范围时发生的行为,GL_TEXTURE_WRAP_T
设置t坐标的行为,GL_TEXTURE_WRAP_R
设置r坐标的行为(r坐标包装仅用于3D纹理和2D纹理数组)。在OpenGL ES中有三个包装模式可供选择,如下表:
纹理包装模式 | 描述 |
---|---|
GL_REPEAT | 重复纹理 |
GL_CLAMP_TO_EDGE | 限定读取纹理的边缘 |
GL_MIRRORED_REPEAT | 重复纹理和镜像 |
注意,纹理包装模式也影响过滤行为。例如,当纹理坐标在纹理的边缘时,线性过滤核心可能跨越纹理的边缘。在这种情况下,包装模式将决定对于核心在纹理边缘之外的部分要读取哪些纹素。在不希望出现任何形式的重复时,应该使用GL_CLAMP_TO_DEGE
。
纹理调配
纹理调配(Swizzle)控制输入的R、RG、RGB或RGBA纹理中的颜色分量在着色器中读取时如何映射到分量。例如,应用程序可能希望一个GL_RED
纹理映射为(0, 0, 0, R)或者(R, R, R, 1)而不是默认的(R, 0, 0, 1)。每个R、G、B、A值映射到的纹理分量都可以用glTexParameter[i|f][v]
设置的纹理调配单独控制。需要控制的分量用GL_TEXTURE_SWIZZLE_R
、GL_TEXTURE_SWIZZLE_G
、GL_TEXTURE_SWIZZLE_B
或GL_TEXTURE_SWIZZLE_A
设置。作为该分量纹理值来源的可能是分别从R、G、B、A分量读取的GL_RED
、GL_GREEN
、GL_BLUE
或GL_ALPHA
。此外,应用程序可以分别用GL_ZERO
或GL_ONE
将该值设置为常数0或者1。
纹理细节级别
在某些应用中,在所有纹理mip贴图级别可用之前就能够开始显示场景是很实用的。例如,通过数据连接下载纹理图像的GPS应用可以从最低级别的mip贴图开始,在更高级别可用时再显示它们。在OpenGL ES 3.0中,可以通过使用glTexParameter[i|f][v]
的多个参数实现。GL_TEXTURE_BASE_LEVEL
设置用于纹理的最大mip贴图级别。默认情况下下,该值为0,但是如果mip贴图级别还不可用,则可以设置为更高的值。同样,GL_TEXTURE_MAX_LEVEL
设置使用的最小mip贴图级别。默认情况下,它的值为1000(超过了任何纹理可能具备的最大级别),但是可以将其设置为较小的值,以控制用于纹理的最小mip级别。
为了选择要用于渲染的mip贴图级别,OpenGL ES自动计算一个细节级别(LOD)值。这个浮点值确定从哪一个mip贴图级别过滤(在三线性过滤中,控制每个mip贴图使用的多少)。应用程序还可以用GL_TEXTURE_MIN_LOD
和GL_TEXTURE_MAX_LOD
控制最小和最大的LOD值。可以从基本和最大mip贴图级别单独控制LOD限制的一个原因是在新的mip贴图级别可用时提供平滑过渡。仅仅设置纹理的基本和最大级别可能在新mip贴图级别可用时造成间歇伪像,而插入LOD可以使这一过渡看起来更平滑。
深度纹理对比(百分比渐进过滤)
最后两个纹理参数是GL_TEXTURE_COMPARE_FUNC
和GL_TEXTURE_COMPARE_MODE
。引入这些纹理参数是为了提供百分比渐进过滤(PCF)功能。在执行被称作阴影贴图的阴影技术时,片段着色器需要比较一个片段的当前深度值和深度纹理中的深度值,以确定片段在阴影之内还是之外。为了实现平滑的阴影边缘效果,对深度纹理进行双线性过滤是很有用的。但是,在过滤深度值时,我们希望过滤在采样深度值并与当前深度(或参考值)比较之后发生。如果过滤在比较之前发生,我们将平均计算深度纹理中的值,这不能提供正确的结果。PCF提供了正确的过滤,将采样的每个深度值与参考深度比较,然后将这些比较的结果(0或者1)一起进行平均。
GL_TEXTURE_COMPARE_MODE
默认为GL_NONE
,但是当它被设置为GL_COMPARE_REF_TO_TEXTURE
时,(s, t, r)纹理坐标中的r坐标将与深度纹理的值进行比较。然后,比较的结果将成为阴影纹理读取的结果(可能是9或者1,如果启用纹理过滤,则为这些值的平均)。比较函数用GL_TEXTURE_COMPARE_FUNC
设置,可以设置为GL_LEQUAL
、GL_GEQUAL
、GL_LESS
、GL_GREATER
、GL_EQUAL
、GL_NOTEQUAL
、GL_ALWAYS
或者GL_NEVER
。
纹理格式
OpenGL ES 3.0为纹理提供了广泛的数据格式,格式的数量比OpenGL ES 2.0有了很大的增加。
2D纹理可以以确定大小或者确定大小的内部格式用glTexImage2D
上传。如果纹理用未确定大小的格式指定,则OpenGL ES实现可以自由选择纹理数据存储的内部表现形式。如果纹理用确定大小的格式指定,则OpenGL ES实现将选择至少与指定的位数相同的格式。
glTexImage2D
的有效的未确定大小内部格式组合:
内部格式 | 格式 | 类型 | 输入数据 |
---|---|---|---|
GL_RGB | GL_RGB | GL_UNSIGNED_BYTE | 8/8/8 RGB 24- 位 |
GL_RGB | GL_RGB | GL_UNSIGNED_SHORT_5_6_5 | 5/6/5 RGB 16- 位 |
GL_RGBA | GL_RGBA | GL_UNSIGNED_BYTE | 8/8/8/8 RGBA 32- 位 |
GL_RGBA | GL_RGBA | GL_UNSIGNED_SHORT_4_4_4_4 | 4/4/4/4 RGBA 16- 位 |
GL_RGBA | GL_RGBA | GL_UNSIGNED_SHORT_5_5_5_1 | 5/5/5/1 RGBA 16- 位 |
GL_LUMINANCE_ALPHA | GL_LUMINANCE_ALPHA | GL_UNSIGNED_BYTE | 8/8 LA 16- 位 |
GL_LUMINANCE | GL_LUMINANCE | GL_UNSIGNED_BYTE | 8L 8- 位 |
GL_ALPHA | GL_ALPHA | GL_UNSIGNED_BYTE | 8A 8- 位 |
如果应用程序希望更多地控制数据的内部存储方式,那么它可以使用确定大小的内部格式。
规范化纹理格式
我们所说的”规范化“指的是从片段着色器中读取纹理时,结果将处于[0.0, 1.0]范围内(或者在*_SNORM格式中的[-1.0, 1.0]范围)。例如,用GL_UNSIGNED_BYTE
数据指定的GL_R8
图像将取得每个8位的无符号字节值(范围为[0, 255]),并在片段着色器读取时映射到[0.0, 1.0]。用GL_BYTE
数据指定的GL_R8_SNORM
图像将取得每个8位的有符号字节值(范围为[-128, 127])并在读取时映射到[-1.0, 1.0]。
浮点纹理格式
OpenGL ES 3.0也引入浮点纹理格式。大部分浮点格式由16位半浮点数据或者32位浮点数据支持。与规范化纹理格式(R、RG、RGB、RGBA)一样,浮点纹理格式可能有1~4个分量。OpenGL ES 3.0不强制浮点格式用作渲染目标,只强制16位半浮点数据可以过滤。
整数纹理格式
整数纹理格式允许纹理范围在片段着色器中以整数形式读取。也就是说,与片段着色器中读取时数据从整数表示转换为规范化浮点值的规范化纹理格式相反,整数纹理中的值在片段着色器读取时仍然为整数。
整数纹理格式不可过滤,但是R、RG和RGBA变种可以用作帧缓冲区对象中渲染的颜色附着(color attachment)。使用整数纹理作为颜色附着的时候,忽略Alpha混合状态(整数渲染目标不可能进行混合)。用于从整数纹理读取并输出到整数渲染目标的片段着色器应该使用对应该格式的有符号或者无符号整数类型。
共享指数纹理格式
共享指数纹理为不需要浮点纹理使用的那么多深度位数的大范围RGB纹理提供了一种存储方式。共享指数纹理通常用于高动态范围(HDR)图像,这种图像不需要半浮点或者全浮点数据。OpenGL ES 3.0中的共享指数纹理格式是GL_RGB9_E5
。在这种格式中,3个RGB分量共享一个5位的指数。5位的指数隐含地由数值15调整。RGB的每个9位的数值存储无符号位的尾数(因此必然为正)。
sRGB纹理格式
OpenGL ES 3.0中引入的另一个纹理格式是sRGB纹理。sRGB是一个非线性颜色空间,大约遵循一个幂函数。大部分图像实际上都存储为sRGB颜色空间,这种非线性解释了人类能够在不同的亮度级别上更好地区分颜色这一事实。
如果用于纹理的图像是以sRGB颜色空间创作的,但是没有使用sRGB纹理读取,那么所有发生在着色器中的照明计算都会在非线性颜色空间中进行。也就是说,标准创作软件包创建的纹理保存为sRGB,从着色器中读取时仍然保持为sRGB。于是照明计算发生在非线性sRGB空间中。许多应用程序都犯了这个错误,这是不正确的,会造成明显不同(不准确)的输出图像。
为了正确地处理sRGB图像,应用程序应该使用一个sRGB纹理格式,这种格式在着色器中读取时将从sRGB转换为线性颜色空间。然后,着色器中的所有计算都将在线性颜色空间中完成。最后,通过渲染到一个sRGB渲染目标,图像将会自动地转换回sRGB。可以使用着色器命令pow(value, 2.0)
进行近似的sRGB->线性转换,然后用(value, 1/2.2)
进行近似的线性->sRGB转换。然后,尽可能使用sRGB纹理是最好的做法,因为这样减少了着色器指令数量,并且提供更准确的sRGB转换。
内部格式 | 格式 | 类型 | 输出数据 | R | F |
---|---|---|---|---|---|
GL_SRGB8 | GL_RGB | GL_UNSIGNED_BYTE | 8/8/8 SRGB | X | |
GL_SRGB8_ALPHA8 | GL_RGBA | GL_UNSIGNED_BYTE | 8/8/8/8 RGBA | X | X |
深度纹理格式
OpenGL ES 3.0中的最后一种纹理格式类型是深度纹理。深度纹理允许应用程序从帧缓冲区对象的深度附着中读取深度值(和可选的模板值)。这在各种高级渲染算法中很有用,包括阴影贴图。下表展示了OpenGL ES 3.0中有效的深度纹理格式:
内部格式 | 格式 | 类型 |
---|---|---|
GL_DEPTH_COMPONENT16 | GL_DEPTH_COMPONENT | GL_UNSIGNED_SHORT |
GL_DEPTH_COMPONENT16 | GL_DEPTH_COMPONENT | GL_UNSIGNED_INTp |
GL_DEPTH_COMPONENT24 | GL_DEPTH_COMPONENT | GL_UNSIGNED_INT |
GL_DEPTH_COMPONENT43F | GL_DEPTH_COMPONENT | GL_FLOAT |
GL_DEPTH24_STENCIL8 | GL_DEPTH_STENCIL | GL_UNSIGNED_INT_24_8 |
GL_DEPTH32F_STENCIL8 | GL_DEPTH_STENCIL | GL_FLOAT_32_UNSIGNED_INT_24_8_REV |
在着色器中使用纹理
下面代码简要演示在着色器中完成2D纹理的基本过程:
1 | // Vertex shader |
1 | // Fragment shader |
顶点着色器以一个二分量纹理坐标作为顶点输入,并将其作为输出传递给片段着色器。片段着色器消费该纹理坐标,并将其用于纹理读取。片段着色器声明一个类型为sampler2D
的统一变量s_texture
。采样器是用于从纹理贴图中读取的特殊统一变量。采样器统一变量将加载一个指定纹理绑定的纹理单元的数值;例如,用数值0指定采样器表示从单元GL_TEXTURE0
读取,指定数值1表示从GL_TEXTURE1
读取,一次类推。在OpenGL ES 3.0 API中,纹理用glActiveTexture
函数绑定到纹理单元。
1 | /** |
glActiveTexture
函数设置当前纹理单元,以便后续的glBindTexture
调用将纹理绑定到当前活动单元。在OpenGL ES实现上可用于片段着色器的纹理单元数量可以用GL_MAX_TEXTURE_IMAGE_UNITS
参数的glGetintegerv
查询。可用于顶点着色器的纹理单元数量使用带GL_MAX_VERTEX_TEXTURE_IMAGE_UNITS
参数的glGetintegerv
查询。
当使用glBindTexture
绑定为并使用glUniformli
加载纹理后,可以看到片段着色器中使用内建函数texture
从纹理贴图出读取。texture
内建函数形式如下:
1 | /** |
texture
函数返回一个代表从纹理贴图中读取颜色的vec4
。纹理数据映射到这个颜色通道的方式取决于纹理的基本格式。下表展示了纹理格式映射到vec4
颜色的方式,纹理调配确定这些分量中的值如何映射到着色器中的分量。
基本格式 | 纹素数据描述 |
---|---|
GL_RED | (R, 0.0 0.0, 1.0) |
GL_RG | (R, G, 0.0, 1.0) |
GL_RGB | (R, G, B, 1.0) |
GL_RGBA | (R, G, B, A) |
GL_LUMINANCE | (L, L, L, 1.0) |
GL_LUMINANCE_ALPHA | (L, L, L, A) |
GL_ALPHA | (0.0, 0.0, 0.0, A) |
下面看具体示例:
1 | - (void)setupVertices { |
使用立方图纹理的示例
立方图纹理的使用非常类似于2D纹理。通过对立方图的各面(GL_TEXTURE_CUBE_MAP_POSITIVE_(X|Y|Z)
,GL_TEXTURE_CUBE_NEGATIVE_(X|Y|Z)
)调用glTexImage2D
加载每个面的像素数据。
1 | // Vertex shader |
1 | // Fragment shader |
顶点着色器取得一个位置和法线作为顶点输入。发现保存在球面的每个顶点上,用作纹理坐标,并传递给片段着色器。然后,片段着色器使用内建函数texture
,以法线作为纹理坐标从立方图中读取。立方图所用的texture
内建函数采用如下形式:
1 | /** |
读取立方图的函数与2D纹理非常类似。仅有的区别是,纹理坐标有3个分量而不是2个分量,采样器类型必须为sampleCube
。用于绑定立方图纹理和加载采样器的方法与之前2D纹理加载一样。
加载3D纹理和2D纹理数组
除了2D纹理和立方图,OpenGL ES 3.0还包含了3D纹理和2D纹理数组。加载3D纹理和2D纹理数组的函数是glTexImage3D
,它与glTexImage2D
很相似。
1 | /** |
一旦用glTexImage3D
加载了3D纹理或者2D纹理数组,就可以用texture
内建函数在着色器中读取该纹理:
1 | /** |
注意,r坐标是一个浮点值。对于3D纹理,根据过滤模式设置,纹理读取可能跨越体的两个切片。
压缩纹理
上述所说的纹理加载都是未压缩的纹理图像数据,OpenGL ES 3.0还支持压缩纹理图像数据的加载。纹理压缩有几个理由,首先,压缩纹理可以减少纹理在设备上的内存占用;其次(不那么明显),压缩纹理节约了着色器中读取纹理时消耗的内存带宽;最后,压缩纹理减少必须存储的图像数据,从而减少了应用程序的下载大小。
在OpenGL ES 2.0中,核心规范不定义任何压缩的纹理图像格式。也就是说,OpenGL ES 2.0核心简单地定义一个机制,可以加载压缩的纹理图像数据,但是没有定义任何压缩格式。因此,各供应商提供了特定于硬件的纹理压缩扩展。这样,OpenGL ES 2.0应用程序开发者必须在不同平台和硬件上支持不同的纹理压缩格式。
OpenGL ES 3.0引入所有供应商必须支持的标准纹理压缩格式,从而改善了这种情况。爱立信纹理压缩(Ericsson Texture Compression,ETC2和EAC)以无版税标准的形式提供给Khronos,它被作为OpenGL ES 3.0的标准纹理压缩格式。EAC有一些压缩1通道和2通道数据的变种,ETC2也有压缩3通道和4通道数据的变种。用于加载2D纹理和立方图压缩图像数据的函数是glCompressedTexImage2D
,用于2D纹理数组的对应函数为glCompressedTexImage3D
。
注意,ETC2/EAC不支持3D纹理(只支持2D纹理和2D纹理数组),但是
glCompressedTexImage3D
可以用于加载供应商专用的3D纹理压缩格式。
1 | /** |
OpenGL ES 3.0支持的标准ETC压缩纹理格式在下表中列出。所有ETC格式将压缩的图像数据存储在4x4的块中。表中列出了每种ETC格式中每个像素的位数。单个ETC图像的大小可以由每像素位数(bpp)比率算出:sizeInBytes = max(width, 4) * max(height, 4) * bpp / 8
。
内部格式 | 大小(每像素位数) | 描述 |
---|---|---|
GL_COMPRESSED_R11_EAC | 4 | 单通道无符号压缩GL_RED格式 |
GL_COMPRESSED_SIGNED_R11_EAC | 4 | 单通道有符号压缩GL_RED格式 |
GL_COMPRESSED_RG11_EAC | 8 | 双通道无符号压缩GL_RG格式 |
GL_COMPRESSED_SIGNED_RG11_EAC | 8 | 双通道有符号压缩GL_RG格式 |
GL_COMPRESSED_RGB8_ETC2 | 4 | 三通道无符号压缩GL_RGB格式 |
GL_COMPRESSED_SRGB8_ETC2 | 4 | sRGB颜色空间中的三通道无符号压缩GL_RGB格式 |
GL_COMPRESSED_RGB8_PUNCHTHROUGH_ALPHA1_ETC2 | 4 | 四通道无符号压缩GL_RGBA格式,1位alpha |
GL_COMPRESSED_SRGB8_PUNCHTHROUGH_ALPHA1_ETC2 | 4 | sRGB颜色空间中四通道无符号压缩GL_RGBA格式,1位alpha |
GL_COMPRESSED_RGBA8_ETC2_EAC | 8 | 四通道无符号压缩GL_RGBA格式 |
GL_COMPRESSED_SRGBA8_ETC2_EAC | 8 | sRGB颜色空间中四通道无符号压缩GL_RGBA格式 |
一旦加载压缩纹理,它就可以和无压缩纹理一样用于纹理处理。大部分开发人员不会编写自己的压缩程序,具体可使用的压缩工具,自行选择。
注意,所有OpenGL ES 3.0实现都支持如上表中列出的格式。此外,有些实现可能支持表中未列出的供应商专用压缩格式。如果我们试图在不支持它们的OpenGL ES 3.0实现上使用纹理压缩格式,将会产生一个GL_INVALID_ENUM
错误。检查OpenGL ES 3.0实现导出使用的任何供应商专用纹理压缩格式的扩展字符串很重要。如果该实现没有导出这样的扩展字符串,那就只能退而求其次使用无压缩的纹理格式。
除了检查扩展字符串之外,还可以用另外一种方法确定实现所支持的纹理压缩格式。也就是说,可以用glGetIntegerv
查询GL_NUM_COMPRESSED_TEXTURE_FORMATS
来确定所支持的压缩图像格式数量。然后,可以用glGetIntegerv
查询GL_COMPRESSED_TEXTURE_FORMATS
,该调用返回一个GLenum
值的数组。数组中的每个GLenum
值将是实现支持的一种压缩纹理格式。
纹理子图像规范
用glTexImage2D
上传纹理图像之后,可以更新图像的各个部分。如果你只希望更新图像的一个子区域,这种能力就很试用。
1 | /** |
这个函数将更新(xoffset, yoffset)到(xoffset+width-1, yoffset+height-1)范围内的纹素。注意,要使用这个函数,纹理必须完全指定。子图像的范围必须在之前指定的纹理图像界限之内。pixels
数组中的数据必须按照glPixelStorei
的GL_UNPACK_ALIGNMENT
指定的方式对齐。
还有一个用于更新压缩的2D纹理图像子区域的函数:
1 | /** |
此外,与2D纹理一样,可以用glTexSubImage3D
更新现有3D纹理和2D纹理数组的子区域:
1 | /** |
glTexSubImage3D
的表现与glTexSubImage2D
类似,唯一的不同是子区域包含一个zoffset
和depth
,用于指定深度切片中要更新的子区域。对于压缩的2D纹理数组,也可以用glCompressedTexSubImage3D
更新纹理的一个子区域。对于3D纹理,这个函数只能用于供应商专用的3D压缩纹理格式,因为ETC2/EAC只支持2D纹理和2D纹理数组。
1 | /** |
从颜色缓冲区复制纹理数据
OpenGL ES 3.0中支持的另一个纹理功能是从颜色缓冲区复制数据到一个纹理。如果我们希望使用渲染的结果作为纹理中的图像,这一功能就很实用。后面的帧缓冲区对象提供了渲染-纹理转换的快速方法,这种方法比复制图像数据更快。但是,如果性能不是关注点,那么从颜色缓冲区复制图像数据就是一种实用的功能。
作为复制图像数据来源的颜色缓冲区可以用glReadBuffer
函数设置。如果应用程序渲染到一个双缓冲区EGL可显示表面,则glReadBuffer
必须设置为GL_BACK
(后台缓冲区–默认状态)。OpenGL ES 3.0只支持双缓冲区EGL可显示表面。因此,所有在显示器上绘图的OpenGL ES 3.0应用程序都有一个既用于前台缓冲区又用于后台缓冲区的颜色缓冲区。这个缓冲区当前是前台还是后台缓冲区,由对eglSwapBuffers
的最后一次调用决定。当从可显示EGL表面的颜色缓冲区中复制图像数据时,总是会复制后台缓冲区的内容。如果渲染到一个EGL pbuffer,则复制将发生在pbuffer表面。最后,如果渲染到一个帧缓冲区对象,则所复制的帧缓冲区对象的颜色附着通过调用带GL_COLOR_ATTACHMENTi
参数的glReadBuffer
函数设置:
1 | /** |
从颜色缓冲区复制数据到纹理的函数是glCopyTexImage2D
、glCopyTexSubImage2D
和glCopyTexSubImage3D
。
1 | /** |
调用上述函数导致纹理图像从区域(x, y)到(x+width-1, y+height-1)的颜色缓冲区内的像素加载。纹理图像的宽度和高度等于颜色缓冲区中复制区域的大小。我们应该用这些信息填充纹理的全部内容。
此外,可以用glCopyTexSubImage2D
更新已经指定的图像的子区域:
1 | /** |
上述函数将用颜色缓冲区中从(x, y)到(x+width-1, y+height-1)区域的像素更新图像中从(xoffset, yoffset)到(xoffset+width-1, yoffset+height-1)的子区域。
最后,也可以用glCopyTexSubImage3D
将颜色缓冲区的内容复制到之前指定的3D纹理或者2D纹理数组的一个切片中:
1 | /** |
对于上述函数要记住一点,即纹理图像格式的分量不能多于颜色缓冲区。换句话说,复制颜色缓冲区的数据时,可以转换为分量较少的格式,但是不能转换为分量较多的格式。
采样器对象
之前介绍了用glTexParameter[i|f][v]
设置纹理参数(如过滤模式、纹理坐标包装模式和LOD设置)的方法。使用glTexParameter[i|f][v]
的问题是它可能造成大量不必要的API开销。应用程序经常在大量纹理上使用相同的设置,在这种情况下,用glTexParameter[i|f][v]
为每个纹理对象设置采样器状态可能造成大量额外开销。为了缓解这一问题,OpenGL ES 3.0引入采样器对象,将采样器状态和纹理状态分离。简言之,所有可用glTexParameter[i|f][v]
进行的设置都可以对采样器对象进行,可以在一次函数调用中与纹理单元绑定使用。采样器对象可以用于许多纹理,从而降低API开销。
用于生成采样器对象的函数是:
1 | /** |
采样器对象在应用程序不再需要它们时也需要删除:
1 | /** |
当生成采样器对象ID之后,应用程序必须绑定采样器对象以使用其状态。采样器对象绑定到纹理单元,这种绑定取代了用glTexParameter[i|f][v]
进行的所有纹理对象状态设置:
1 | /** |
如果传递给glBindSampler
的sampler
为0(默认采样器),则使用为纹理对象设置的状态。采样器对象状态可以用glSampler[f|i][v]
设置。可以用glSamplerParameter[f|i][v]
设置的参数与用glTexParameter[i|f][v]
设置的相同,唯一的区别是状态被设置到采样器对象,而非纹理对象:
1 | glSamplerParameteri(GLuint sampler, GLenum pname, GLint param); |
不可变纹理
OpenGL ES 3.0中引入的另一种有助于改进应用程序性能的功能是不可变纹理。正如前面所介绍的,应用程序使用glTexImage2D
和glTexImage3D
等函数独立地指定纹理的每个mip贴图级别。这对OpenGL ES驱动程序造成的问题是驱动程序在绘图之前无法确定纹理是否已经完全指定。也就是说,它必须检查每个mip贴图级别或者子图像的格式是否相符、每个级别的大小是否正确以及是否有足够的内存。这种绘图时检查可能代价很高,而使用不可变纹理可以避免这种情形。
不可变纹理的思路很简单:应用程序在加载数据之前指定纹理的格式和大小。这样做之后,纹理格式变成不可改变的,OpenGL ES驱动程序可以预先进行所有一致性和内存检查。一旦纹理不可变,它的格式和大小就不会再变化。但是,应用程序仍然可以通过使用glTexSubImage2D
、glTexSubImage3D
、glGenerateMipMap
或者渲染到纹理加载图像数据。
为了创建不可变纹理,应用程序将使用glBindTexture
绑定纹理,然后用glTexStorage2D
或glTexStorage3D
分配不可变存储:
1 | /** |
一旦创建了不可变纹理,在纹理对象上调用glTexImage*
、glCompressedTexImage*
、glCopyTexImage*
或glTexStorage*
就会无效。这样做将生成GL_INVALID_OPERATION
错误。要用图像数据填充不可变纹理,应用程序需要使用glTexSubImage2D
、glTexSubImage3D
、glGenerateMipMap
或者渲染到纹理图像(通过将其作为帧缓冲区对象附着使用来实现)。
使用glTexStorage*
时,OpenGL ES内部通过将GL_TEXTURE_IMMUTABLE_FORMAT
设置为GL_TRUE
,将GL_TEXTURE_IMMUTABLE_LEVELS
设置为传递给glTexStorage*
的数字,将纹理对象标记为不可变。应用程序可以使用glGetTexParameter[i|f][v]
查询这些值,但是它无法直接设置这些值。必须使用glTexStorage*
函数设置不可变纹理参数。
像素解包缓冲区对象
缓冲区对象可以在服务器端(或者GPU)内存中存储数据,而不是在客户端(或者主机)内存。使用缓冲区对象的好处是减少了从CPU到GPU的数据传送,因而能够改进性能(并降低内存占用率)。OpenGL ES 3.0还引入了像素解包缓冲区对象,这种对象与GL_PIXEL_UNPACK_BUFFER
目标绑定指定。像素解包缓冲区对象允许纹理数据规格保存在服务器端内存。结果是,像素解包操作glTexImage*
、glTexSubImage*
、glCompressedTexImage*
和glCompressedTexSubImage*
可以直接来自缓冲区对象。如果像素解包缓冲区对象在这类调用期间绑定,则数据指针是像素解包缓冲区中的一个偏移量,而不是指向客户端内存的指针,这与使用glVertexAttribPointer
的VBO很相似。
像素解包缓冲区对象可以用于将纹理数据流传输到GPU。应用程序可以分配一个像素解包缓冲区,然后为更新映射缓冲区区域。当进行加载数据到OpenGL的调用(例如glTexSubImage*
)时,这些函数可能立即返回。因为数据已经存在于GPU(或者可以在稍后复制,但是立即复制不需要像客户端数据那样进行)。我们建议在纹理上传操作的性能/内存占用对应用程序很重要的情况下使用像素解包缓冲区对象。
总结
这篇文章主要介绍了OpenGL ES 3.0中使用纹理的方法。