Nvidia SDK11 之 PNPatches(细化算法技术学习)
PN-Triangles (也称作N-patches) 是比较流行的处理粗糙模型细分算法技术,PN-Triangles算法能够将低分辨率模型转化为弯曲表面,该表面然后可以被重新绘制成由“高精曲面细分”的三角形所组成的网格,经常借助于Tessellation (曲面细分) 技术创建外观更加平滑的模型。
图1 曲面细分技术
无需手工输入,PN-Triangles 可实现游戏人物的自动平滑。几何与光照逼真度均能够得到提升。
DirectX 11 最大新特性 就是融入了Tessellation (曲面细分) 技术,从本质上讲,曲面细分技术是一种将多边形分解成更加细小的碎片以提升几何逼真度的方法。例如,如果处理一个正方形并将其沿对角线切开,那么实际上就是将这一正方形“曲面细分”成为两个三角形。就其本身而言, Tessellation (曲面细分) 并不能提升半点逼真度。例如,在游戏中,一个正方形被渲染成为两个三角形还是两千个三角形都是无关紧要的。只有在使用新三角形来描述新信息时, Tessellation (曲面细分) 才能提升逼真度。
图2 Pn triangle 一个特殊的贝塞尔曲面
置换贴图(displacement mapping)。也有翻译成“位移映射”,似乎更准确。位移映射是同凹凸贴图,法线贴图,切线贴图相区别的另一种制造凹凸细节的技术,它使用一个高度贴图制造出几何物体表面上点的位置被替换到另一位置的效果。这种效果通常是让点的位置沿面法线移动一个贴图中定义的距离。它使得贴图具备了表现细节和深度的能力,且可以同时允许自我遮盖,自我投影和呈现边缘轮廓。
图3 置换贴图应用实例
当一个置换贴图 (左) 应用到平面上时,所生成的表面 (右) 就会表现出置换贴图中所编码的高度信息。
图4 几种贴图技术差别
图5 置换贴图原理
1 显示法线(Show Normals)
//* RenderVectorsVS域着色器
图6 demo 截图
ID3D11Buffer* g_pMeshVertexBuffer;
ID3D11ShaderResourceView* g_pMeshVertexBufferSRV;
ID3D11Buffer* g_pMeshNormalsBuffer;
ID3D11ShaderResourceView* g_pMeshNormalsBufferSRV;
ID3D11Buffer* g_pMeshTangentsBuffer;
ID3D11ShaderResourceView* g_pMeshTangentsBufferSRV;
//The IA will add a vertex id to each vertex for use by shader stages. For each draw call, the vertex id is //incremented by 1. The IA will add a vertex id to each vertex for use by shader stages. For each draw call, //the vertex id is incremented by 1.
float4 RenderVectorsVS(uniform float scale, uint vertexID : SV_VertexID) : SV_Position
HSIn_Diffuse output;
int index = vertexID >> 1;
int isOdd = vertexID & 0x1;
float3 position = g_PositionsBuffer.Load(index).xyz;
float4 directionScaled = g_VectorsBuffer.Load(index);
float3 direction = directionScaled.xyz;
//position += direction * directionScaled.w * isOdd;
position += direction * isOdd * scale;
return mul(float4(position, 1.0f), g_ModelViewProjectionMatrix);
2 细分着色器
曲面细分阶段,细分为3个阶段:外壳着色器(Hull - Shader)、Tessellation阶段、域着色器阶段(Domain - Shader )。一三阶段可编程,第二阶段不可编程。
图7 细分流程
2.1 顶点着色器
HSIn_Diffuse RenderTessellatedDiffuseVS(uint vertexID : SV_VertexID, uniform bool renderAnimated = false)
HSIn_Diffuse output;
int2 indices = g_IndicesBuffer.Load(vertexID);
output.position = g_PositionsBuffer.Load(indices.x).xyz;
output.texCoord = g_CoordinatesBuffer.Load(indices.xy);
float4 normalData = g_NormalsBuffer.Load(indices.x);
output.normal = normalData.xyz;
float4 tangentData = g_TangentsBuffer.Load(indices.x);
output.tangent = tangentData.xyz;
output.cornerCoord = g_CornerCoordinatesBuffer.Load(indices.x);
output.edgeCoord = g_EdgeCoordinatesBuffer.Load(vertexID);
return output;
---》input patch
当渲染Tessellation阶段的时候,我们并不把整个low-detail的网格提交到 Input Assembly阶段,而是把顶点(控制点)打包(Patches),然后将集合Patch提交给IA。Direct3D支持1~32个控制点的Patch,如下
2.2The Hull Stage (外壳着色器)
//* DiffuseHS 外壳着色器TCS
[domain("tri")] //按triangle 细分
[partitioning("integer")] //细分模式
[outputtopology("triangle_cw")] //细分后输出的语义
[outputcontrolpoints(3)] //该HS着色器对每个patch调用的次数
[patchconstantfunc("DiffuseConstantHS")] //the constant hull shader函数的名字
[maxtessfactor(64.0)] //最大的细分因子。Direct3D支持最多64个
HSIn_Diffuse DiffuseHS( InputPatch<HSIn_Diffuse, 3> inputPatch, uint i : SV_OutputControlPointID)
return inputPatch[i]
2.3 DiffuseConstantHS
//* Constant Hull Shader着色器
HS_CONSTANT_DATA_OUTPUT DiffuseConstantHS( InputPatch<HSIn_Diffuse, 3> inputPatch)
// tessellation factors are proportional to model space edge length
for (uint ie = 0; ie < 3; ++ie)
// g_TessellationFactor / (float)512 * (float)64 的值是把这条边分为几段
output.Edges[ie] = g_TessellationFactor / (float)512 * (float)64;
//Patch包含的三个控制点p0,p1钟,两个定点的向量 v0
float3 edge = inputPatch[(ie + 1) % 3].position - inputPatch[ie].position;
//p1 ,p0中点到摄像机的向量
float3 vec = (inputPatch[(ie + 1) % 3].position + inputPatch[ie].position) / 2 - g_FrustumOrigin;
float len = sqrt(dot(edge, edge) / dot(vec, vec));
output.Edges[(ie + 1) % 3] = max(1, len * g_TessellationFactor);
// culling 背面剔除
int culled[4];
for (int ip = 0; ip < 4; ++ip)
culled[ip] = 1;
culled[ip] &= dot(inputPatch[0].position - g_FrustumOrigin, g_FrustumNormals[ip].xyz) > 0;
culled[ip] &= dot(inputPatch[1].position - g_FrustumOrigin, g_FrustumNormals[ip].xyz) > 0;
culled[ip] &= dot(inputPatch[2].position - g_FrustumOrigin, g_FrustumNormals[ip].xyz) > 0;
if (culled[0] || culled[1] || culled[2] || culled[3]) output.Edges[0] = 0;
// compute the cubic geometry control points
// edge control points
图8 控制点计算
output.f3B210 = ( ( 2.0f * inputPatch[0].position ) + inputPatch[1].position - ( dot( ( inputPatch[1].position - inputPatch[0].position ), inputPatch[0].normal ) * inputPatch[0].normal ) ) / 3.0f;
output.f3B120 = ( ( 2.0f * inputPatch[1].position ) + inputPatch[0].position - ( dot( ( inputPatch[0].position - inputPatch[1].position ), inputPatch[1].normal ) * inputPatch[1].normal ) ) / 3.0f;
output.f3B021 = ( ( 2.0f * inputPatch[1].position ) + inputPatch[2].position - ( dot( ( inputPatch[2].position - inputPatch[1].position ), inputPatch[1].normal ) * inputPatch[1].normal ) ) / 3.0f;
output.f3B012 = ( ( 2.0f * inputPatch[2].position ) + inputPatch[1].position - ( dot( ( inputPatch[1].position - inputPatch[2].position ), inputPatch[2].normal ) * inputPatch[2].normal ) ) / 3.0f;
output.f3B102 = ( ( 2.0f * inputPatch[2].position ) + inputPatch[0].position - ( dot( ( inputPatch[0].position - inputPatch[2].position ), inputPatch[2].normal ) * inputPatch[2].normal ) ) / 3.0f;
output.f3B201 = ( ( 2.0f * inputPatch[0].position ) + inputPatch[2].position - ( dot( ( inputPatch[2].position - inputPatch[0].position ), inputPatch[0].normal ) * inputPatch[0].normal ) ) / 3.0f;
// center control point
float3 f3E = ( output.f3B210 + output.f3B120 + output.f3B021 + output.f3B012 + output.f3B102 + output.f3B201 ) / 6.0f;
float3 f3V = ( inputPatch[0].position + inputPatch[1].position + inputPatch[2].position ) / 3.0f;
output.f3B111 = f3E + ( ( f3E - f3V ) / 2.0f );
output.Inside = (output.Edges[0] + output.Edges[1] + output.Edges[2]) / 3;
float2 t01 = inputPatch[1].texCoord - inputPatch[0].texCoord;
float2 t02 = inputPatch[2].texCoord - inputPatch[0].texCoord;
//判断z轴朝向 向里还是向外
output.sign = t01.x * t02.y - t01.y * t02.x > 0.0f ? 1 : -1;
return output;
//* _RenderPositionAndNormalPS域着色器
图9 三角形贝塞尔曲面细分示意图
输入渲染管线中的三角面片的信息以顶点为单位,如图 2 所示,P1 ~ P3 是输入顶点的位置信息,N1 ~ N3是输入顶点的法线信息基于这些信息可求得控制点信息。如图3 所示,一个三角面片共有10个控制点,其中 b003,b300,b030是原三角形的 3 个顶点,而其余的7 个控制点则是依据顶点和法线信息插入的,之后根据控制点信息和细分着色器输出的质心坐标信息共同计算出插入点的位置。
/// DiffuseDS 域着色器
PSIn_TessellatedDiffuse DiffuseDS( HS_CONSTANT_DATA_OUTPUT input,
float3 barycentricCoords : SV_DomainLocation,
OutputPatch<HSIn_Diffuse, 3> inputPatch )
PSIn_TessellatedDiffuse output;
float3 coordinates = barycentricCoords;
// The barycentric coordinates 质心就是面积坐标
float fU = barycentricCoords.x;
float fV = barycentricCoords.y;
float fW = barycentricCoords.z;
// Precompute squares and squares * 3
float fUU = fU * fU;
float fVV = fV * fV;
float fWW = fW * fW;
float fUU3 = fUU * 3.0f;
float fVV3 = fVV * 3.0f;
float fWW3 = fWW * 3.0f;
![]() |
‘u/v/w’ 是质心坐标(他们始终满足等式:u + v + w = 1),‘Bxyz’ 是一组控制点
正如你所见的那样,一组控制点大体就是三角形表面上的一个膨胀表面,将质心坐标带入上面的这个公式,我们就能得到更加接近真实的 3D 表面。
图10 Bezier 三角形面片
// Compute position from cubic control points and barycentric cords
float3 position = inputPatch[0].position * fWW * fW + inputPatch[1].position * fUU * fU + inputPatch[2].position * fVV * fV +input.f3B210 * fWW3 * fU + input.f3B120 * fW * fUU3 + input.f3B201 * fWW3 * fV + input.f3B021 * fUU3 * fV +input.f3B102 * fW * fVV3 + input.f3B012 * fU * fVV3 + input.f3B111 * 6.0f * fW * fU * fV;
// Compute normal from quadratic control points and barycentric cords
// 面积坐标的比例因子计算重心的法线
float3 normal = inputPatch[0].normal * coordinates.z + inputPatch[1].normal * coordinates.x + inputPatch[2].normal * coordinates.y;
normal = normalize(normal);
// 面积坐标的比例因子计算重心的纹理坐标
float2 texCoord = inputPatch[0].texCoord * coordinates.z + inputPatch[1].texCoord * coordinates.x + inputPatch[2].texCoord * coordinates.y;
float2 displacementTexCoord = texCoord;
// Edge point 特殊情况
//当质心坐标在三角形的一条边上,coordinates.z对应边的起点到边的终点采用面积坐标比例coordinates.y 或者
//(1- coordinates.y)进行插值。
if(coordinates.z == 0)
displacementTexCoord = lerp(inputPatch[1].edgeCoord.xy, inputPatch[1].edgeCoord.zw, coordinates.y);
else if(coordinates.x == 0)
displacementTexCoord = lerp(inputPatch[2].edgeCoord.xy, inputPatch[2].edgeCoord.zw, coordinates.z);
else if(coordinates.y == 0)
displacementTexCoord = lerp(inputPatch[0].edgeCoord.xy, inputPatch[0].edgeCoord.zw, coordinates.x);
// Corner point特殊情况
if(coordinates.z == 1)
displacementTexCoord = inputPatch[0].cornerCoord;
else if(coordinates.x == 1)
displacementTexCoord = inputPatch[1].cornerCoord;
else if(coordinates.y == 1)
displacementTexCoord = inputPatch[2].cornerCoord;
float offset = g_DisplacementTexture.SampleLevel(SamplerLinearClamp, displacementTexCoord, 0).x;
position += normal * offset;
float3 tangent = inputPatch[0].tangent * coordinates.z + inputPatch[1].tangent * coordinates.x + inputPatch[2].tangent * coordinates.y;
tangent = normalize(tangent);
output.position = mul(float4(position, 1.0f), g_ModelViewProjectionMatrix);
output.texCoord = displacementTexCoord;
output.texCoord = texCoord;
output.positionWS = position;
output.normal = normal;
output.tangent = tangent;
output.sign = input.sign;//inputPatch[0].sign;
return output;
/// DiffuseDS 域着色器
struct PSIn_TessellatedDiffuse
float4 position : SV_Position;
float2 texCoord : TEXCOORD0;
float3 positionWS : TEXCOORD1;
float3 normal : TEXCOORD2;
float3 tangent : TEXCOORD3;
float sign : TEXCOROD4;
float4 RenderTessellatedDiffusePS(PSIn_TessellatedDiffuse input) : SV_Target
// gpu的pixel shader处理的像素,每次都是一个2x2的quad,对于任意一个属性在rtx(RenderTarget x direction)或//者rty方向上的偏导数,都是可计算的, 因为数据是离散的,所以偏导数的计算就是简单的相减 使用ddx/ddy,切记一定//要确保其2x2区域位于同一三角面的光栅化范围内
float3 dir_x = ddx(input.positionWS);
float3 dir_y = ddy(input.positionWS);
float3 normal = normalize(cross(dir_x, dir_y));
float3 lightDir = normalize(g_CameraPosition - input.positionWS);
float3 normal = normalize(input.normal);
float3 tangent = normalize(input.tangent);
//参考图5 求副法线
float3 bitangent = cross(normal, tangent) * input.sign;
// 构建变换矩阵,将位置坐标从模型空间转换到切线空间
float3x3 tangentBasis = float3x3(tangent, bitangent, normal);
float3 lightDir = normalize(g_CameraPosition - input.positionWS);
// 转换光源方向从模型空间到切线空间
lightDir = normalize(mul(tangentBasis, lightDir));
normal = normalize(g_WSNormalMap.Sample(SamplerLinearClamp, input.texCoord).xyz);
float dotNL = max(dot(normal, lightDir), 0.0f);
float diffuse = dotNL * 0.75f + 0.25f;
float specular = pow(dotNL, 100.0f);
float3 diffuseColor = float3(1.0, 0.5, 0.35) * 0.75;// * 0.75 + (input.sign * 0.5 + 0.5) * 0.25;
float3 color = diffuseColor * diffuse + specular * 0.25;
return float4(color, 0);
