聊聊如何正确向Compute Shader传递数组

Posted 2021-01-08 murongxiaopifu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了聊聊如何正确向Compute Shader传递数组相关的知识，希望对你有一定的参考价值。

0x00 前言

前一段时间去英国出差，发现Unity Brighton 办公室的手绘地图墙很漂亮，在这里分享给大家。
技术分享图片

在这篇文章中，我们选择了过去几周Unity官方社区交流群以及UUG社区群中比较有代表性的几个问题，总结在这里和大家进行分享。主要涵盖了UGUI、Lighting、Profiler、Shader Graph、SRP、Compute Shader、GLES等领域。

同时，也欢迎大家加入我们这个讨论干货的官方技术群，交流看法分享经验。
Unity官方社区交流群：629212643

0x01 UGUI

Q:陈老师。我发现个问题。Unity 2018.2.3以后的几乎所有版本的inputfield没办法输入部分中文字符，比如“我”，我今天试了好多好多版本。2017是确定没有这个问题的。但是2018我从高到低装了好多。2018.1.9不存在这个问题。

A:Hi，这是一个已知的2018.2的Bug。Bug的原因是由于2018.2中将16bit的C# char截成了8bit的C++ char。我们在2018.3中修复了该问题，并且会Backport回2018.2的版本。

Q:有一个UGUI做的prefab，每次apply之后第一个slider总是会错位，有遇到的吗？Unity版本2017.3.0f3。
技术分享图片
A:嗯，这是一个已知Bug。并且该Bug已经在2017.3.1p1版本中修复了。推荐你直接升级使用我们的长期维护版本2017.4，该版本会持续修复发现的Bug。

0x02 Lighting

Q1: 最近场景要做烘焙阴影动态加载，尝试了下mixed灯光下烘焙出来的shadowmask贴图添加到lightmapping中没办法正常显示出来。看结构已经和取数值出来的时候是一模一样了。网上看到有人说，shadowmask需要保留光源在场景中，否则会显示失败。想了解是不是真的需要保留灯光。或者有其他做法可以动态加载shadowmask。

A: shadowmask是mixed光照模式的一种，并且它保存的是mask信息，即mask信息，而不是真实的光照产生的阴影效果。在mixed-shadowmask光照模式下，需要light来提供直接光，再利用阴影mask来生产阴影。
技术分享图片
如果想要关闭光照，可以考虑使用mixed-subtractive模式或者bake模式。将直接光照结果预先烘焙到贴图上。

Q2:我有两个场景。第一个场景烘焙ok，第二个场景复制的第一个场景，然后加了点新的家具，再烘焙就都是黑的。而且场景内对象的light probes选项也不能勾选。LightMap没有丢失，就是烘焙出来都是黑的。技术分享图片

A:不能勾选light probe是因为你的物体设置了Lightmap static的flag，所以它的lighting信息会烘焙到Lightmap上，而不是从Light Probe中获取。
当然，如果是针对LOD Group的烘焙，在勾选了Lightmap static后，还是可以在模型上勾选light probe的，这是因为LOD需要light probe来提供间接光。
烘焙后模型变黑的问题，首先要确认是否为模型设置了UV2数据。这是因为烘焙时需要UV2数据。其次，可以检查一下模型的Shader中是否包含Meta Pass。
可以参考：
https://docs.unity3d.com/Manual/MetaPass.html
同时，还需要检查一下场景中的Light是否开启，并正确的设定了属性。以及Lighting Window中的间接光Indirect Intensity不为0。

Q3:场景进行光照烘焙时存在速度较慢的问题，是否有一些设置上的改进或最佳实践?
A:在lighting设置窗口中，主要是由于Indirect Resolution的设置会影响烘焙的速度。
事实上，利用Lightmap Parameter机制可以对场景中不同的区域设置不同的烘焙参数，例如光照变化较为低频的部分可以创建一个分辨率较低的Lightmap Parameter，以节约烘焙时间。技术分享图片

（参考文档：https://unity3d.com/cn/learn/tutorials/topics/graphics/fine-tuning-lightmap-parameters?playlist=17102）

0x03 Profiler

Q:请问一下性能指标里面的SetPassCalls和Draw Calls、Batches这些有什区别，具体指什么呢？网上有人说是一样的东西，但是我发现有时候值不一样。技术分享图片

A:SetPass Call指的是切换渲染状态（render state）的次数，比如你的shader中如果有多个pass，或者是场景中有不同的material，都会造成渲染状态切换。
Drawcall的话，以gles为例，就是调用draw的实际次数，例如drawarray、drawelement，调用一次都会增加。
Batch则是会在第一次调用draw行为的时候加1，如果之后渲染状态没有改变，则batch的数量不再增加，但是一次batch内可能会有多次drawcall调用，只是渲染状态没有改变。

0x04 Shader Graph

Q:有朋友在用Shader Graph吗？请问它可以将节点转成shader供Unity 2017使用吗？

A:右键点击节点有一个copy code的选项，可以复制代码。针对根结点，则可以copy生成的全部代码。
技术分享图片

但是不建议在Unity 2017中使用，因为Shader Graph主要是和SRP配合使用的，SRP Shader library和UnityCG.cginc中有比较多的区别。

0x05 SRP

Q:在Unity2018中，使用Lightweight Render Pipeline的时候，有一些Asset Store上的插件的显示结果不正确。
技术分享图片

A: 传统渲染流水线的Built-in的Shader以及自定义的光照 Shader目前不能在新的Lightweight Render Pipeline中使用。LWRP有其自己的Shader。
如果是传统的Built-in Shader，则可以通过菜单选择直接升级到LWRP的Shader。
但是自己写的lit shader会比较麻烦，目前需要手动来修改。这是因为SRP Shader library和UnityCG.cginc中有比较多的区别。因此这个问题只能向插件作者反馈了，或者你仍然使用传统的渲染流水线。

0x06 Compute Shader

Q:话说Unity的Compute Shader传float数组一直有bug。比如传float[5]，C#里写ComputeShader.SetFloats是无法成功的，只有第一个float可以设置成功，这个bug官方已知吗？
A: 这个不是bug。而是根据HLSL的规则，应该对数据进行对齐，以避免为计算偏移所导致的ALU开销。
HLSL的相关文档可以参考：
https://docs.microsoft.com/zh-cn/windows/desktop/direct3dhlsl/dx-graphics-hlsl-packing-rules

"Arrays are not packed in HLSL by default. To avoid forcing the shader to take on ALU overhead for offset computations, every element in an array is stored in a four-component vector."

因此调用带有float []参数的SetFloats应根据HLSL规则进行对齐，即float []应按每个数据16字节，也就是float4的形式传递。
例如如下格式：

    //Setup Float Array
    _floatArray = new float[4*4];
    _floatArray[0] = 0.25f;
    _floatArray[4] = 0.50f;
    _floatArray[8] = 0.75f;
    _floatArray[12] = 1.00f;

传递的结果就是，(0.25, 0.5, 0.75，1)。
而Unity的文档中，其实也有提到这个问题。具体内容可以查看文档。
https://docs.unity3d.com/ScriptReference/ComputeShader.SetFloats.html

This function can be used to set float vector, float array or float vector array values. For example, float4 myArray[4] in the compute shader can be filled by passing 16 floats.

0x07 GLES

Q:我们现在需要一个非压缩单通道格式的纹理，作为palatte使用。用Alpha8在某些mali gpu手机上有问题，会变成rgba32位格式，内存增加4倍。请问是为什么？另外R8的这个在哪里可以设置？
A:第一个问题，在某些mali gpu手机上有问题，这是由于Alpha8 texture format在OpenGL ES 3 及以上版本中被移除了，因此我们使用了GL_EXT_texture_swizzle拓展来实现类似的功能，但是GL_EXT_texture_swizzle拓展在某些mali gpu的手机上的实现存在问题，导致该功能不能正常工作。
如果要使用R8格式，可以将Texture Type设置为Single Channel，选择Red即可。技术分享图片

0x08 后记

好了，以上就是想和大家分享的几个在群里讨论的小问题。
再次，欢迎大家加入我们这个讨论干货的官方技术群，交流分享呀。
Unity官方社区交流群：629212643

技术分享图片

以上是关于聊聊如何正确向Compute Shader传递数组的主要内容，如果未能解决你的问题，请参考以下文章

GPU架构和Compute Shader线程规划

在OpenGL中使用Compute Shader（一）

OpenGL 之 Compute Shader（通用计算并行加速）

Unity3D 5.3.5 Compute Shader粒子测试

使用Compute Shader加速Irradiance Environment Map的计算

在DirectX 12中使用compute shader