在书中的5.6章节有对于坐标变换的内容,里面涉及了NDC空间。
开始阅读的时候不是特别明白,在开始学习拾取的时候,对坐标变换有了一个新的认识。
首先看一个老朋友:
inline XMMATRIX XM_CALLCONV XMMatrixPerspectiveFovLH
(
float FovAngleY,
float AspectHByW,
float NearZ,
float FarZ
)
XMMatrixPerspectiveFovLH这个函数生成了一个从 局部坐标————》NDC空间坐标 的变幻矩阵
(博客里直接添加矩阵好不方便啊。。。。)
我们可以看一下它的实现原理:
不用全部看完,只需要去看XM_NO_INTRINSICS部分,这个部分最好理解!
inline XMMATRIX XM_CALLCONV XMMatrixPerspectiveFovLH
(
float FovAngleY,
float AspectHByW,
float NearZ,
float FarZ
)
{
assert(!XMScalarNearEqual(FovAngleY, 0.0f, 0.00001f * 2.0f));
assert(!XMScalarNearEqual(AspectHByW, 0.0f, 0.00001f));
assert(!XMScalarNearEqual(FarZ, NearZ, 0.00001f));
#if defined(_XM_NO_INTRINSICS_)
float SinFov;
float CosFov;
XMScalarSinCos(&SinFov, &CosFov, 0.5f * FovAngleY);
float Height = CosFov / SinFov;
float Width = Height / AspectHByW;
float fRange = FarZ / (FarZ-NearZ);
XMMATRIX M;
M.m[0][0] = Width;
M.m[0][1] = 0.0f;
M.m[0][2] = 0.0f;
M.m[0][3] = 0.0f;
M.m[1][0] = 0.0f;
M.m[1][1] = Height;
M.m[1][2] = 0.0f;
M.m[1][3] = 0.0f;
M.m[2][0] = 0.0f;
M.m[2][1] = 0.0f;
M.m[2][2] = fRange;
M.m[2][3] = 1.0f;
M.m[3][0] = 0.0f;
M.m[3][1] = 0.0f;
M.m[3][2] = -fRange * NearZ;
M.m[3][3] = 0.0f;
return M;
#elif defined(_XM_ARM_NEON_INTRINSICS_)
float SinFov;
float CosFov;
XMScalarSinCos(&SinFov, &CosFov, 0.5f * FovAngleY);
float fRange = FarZ / (FarZ-NearZ);
float Height = CosFov / SinFov;
float Width = Height / AspectHByW;
const XMVECTOR Zero = vdupq_n_f32(0);
XMMATRIX M;
M.r[0] = vsetq_lane_f32( Width, Zero, 0 );
M.r[1] = vsetq_lane_f32( Height, Zero, 1 );
M.r[2] = vsetq_lane_f32( fRange, g_XMIdentityR3.v, 2 );
M.r[3] = vsetq_lane_f32( -fRange * NearZ, Zero, 2 );
return M;
#elif defined(_XM_SSE_INTRINSICS_)
float SinFov;
float CosFov;
XMScalarSinCos(&SinFov, &CosFov, 0.5f * FovAngleY);
float fRange = FarZ / (FarZ-NearZ);
// Note: This is recorded on the stack
float Height = CosFov / SinFov;
XMVECTOR rMem = {
Height / AspectHByW,
Height,
fRange,
-fRange * NearZ
};
// Copy from memory to SSE register
XMVECTOR vValues = rMem;
XMVECTOR vTemp = _mm_setzero_ps();
// Copy x only
vTemp = _mm_move_ss(vTemp,vValues);
// CosFov / SinFov,0,0,0
XMMATRIX M;
M.r[0] = vTemp;
// 0,Height / AspectHByW,0,0
vTemp = vValues;
vTemp = _mm_and_ps(vTemp,g_XMMaskY);
M.r[1] = vTemp;
// x=fRange,y=-fRange * NearZ,0,1.0f
vTemp = _mm_setzero_ps();
vValues = _mm_shuffle_ps(vValues,g_XMIdentityR3,_MM_SHUFFLE(3,2,3,2));
// 0,0,fRange,1.0f
vTemp = _mm_shuffle_ps(vTemp,vValues,_MM_SHUFFLE(3,0,0,0));
M.r[2] = vTemp;
// 0,0,-fRange * NearZ,0.0f
vTemp = _mm_shuffle_ps(vTemp,vValues,_MM_SHUFFLE(2,1,0,0));
M.r[3] = vTemp;
return M;
#else // _XM_VMX128_INTRINSICS_
#endif // _XM_VMX128_INTRINSICS_
}
关于函数里面的预处理指令时判断是否支持SSE浮点指令集 ARM指令集的,以此来优化性能。
当然,这里有一个奇怪的地方:TM的SSE的注释写错了吧!!!
最主要的:
float SinFov; float CosFov; XMScalarSinCos(&SinFov, &CosFov, 0.5f * FovAngleY); float Height = CosFov / SinFov; float Width = Height / AspectHByW; float fRange = FarZ / (FarZ-NearZ); XMMATRIX M; M.m[0][0] = Width; M.m[0][1] = 0.0f; M.m[0][2] = 0.0f; M.m[0][3] = 0.0f; M.m[1][0] = 0.0f; M.m[1][1] = Height; M.m[1][2] = 0.0f; M.m[1][3] = 0.0f; M.m[2][0] = 0.0f; M.m[2][1] = 0.0f; M.m[2][2] = fRange; M.m[2][3] = 1.0f; M.m[3][0] = 0.0f; M.m[3][1] = 0.0f; M.m[3][2] = -fRange * NearZ; M.m[3][3] = 0.0f;
换句话说,我们获得了以下公式:
x *= 1/tan(a/2) * (Y:X) //这里Y:X指输入的横纵比
y *= 1/tan(a/2)
这样,X与Y 获得的值去除以Z之后,就可以规范化到[-1,1]的NDC坐标了,也就是相对于屏幕的坐标。
Z代表了深度值
z = far*z/(far - near) - far*near/(far-near)
书中有一个曲线约束了深度值。。。。我这个也不懂为什么用这个公式。
还有一个没有解决的问题,xyz经过矩阵变幻之后都要除以局部坐标中z的大小,但是代码中没有这一部分的实现机制。。。。估计GPU自己实现了?
原文:http://www.cnblogs.com/Windogs/p/5074121.html