Shader的学习
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Shader的学习相关的知识,希望对你有一定的参考价值。
一、SnowTrack(雪跟踪)
前言
这篇小文简单介绍一下如何在Unity中利用shader很简单的实现雪地效果。
01 雪地痕迹的效果
实现雪地印痕的思路其实也很简单吗,既记录玩家移动过程中的位置,之后再根据这些数据修改雪地的mesh即可。
02 工程实现
所以,很简单的,我们在unity中只需要一个玩家头顶上的正交相机和一个rendertexture就可以记录玩家的移动过程中的位置了。
之后再shader文件中先用vs根据rendertexture的数据修改雪地mesh的相关顶点位置,同时为了更方便地实现光照效果,接下来使用surface shader,实现光照。
全部代码如下所示:
Properties {
_MainTex ("Albedo (RGB)", 2D) = "white" {}
_SnowTrackTex ("SnowTrackTex", 2D) = "white" {}
_NormalMap ("NormalMap", 2D) = "bump" {}
_SnowTrackFactor("SnowTrackFactor", float) = 0
}
SubShader {
Tags { "RenderType"="Opaque" }
LOD 200
CGPROGRAM
// Physically based Standard lighting model, and enable shadows on all light types
#pragma surface surf Standard addshadow fullforwardshadows vertex:vert
// Use shader model 3.0 target, to get nicer looking lighting
#pragma target 3.0
sampler2D _MainTex;
sampler2D _SnowTrackTex;
sampler2D _NormalMap;
float _SnowTrackFactor;
struct Input {
float2 uv_MainTex;
};
void vert(inout appdata_full vertex)
{
vertex.vertex.y -= tex2Dlod(_SnowTrackTex, float4(vertex.texcoord.xy, 0, 0)).r * _SnowTrackFactor;
}
void surf (Input IN, inout SurfaceOutputStandard o) {
fixed4 c = tex2D(_MainTex, IN.uv_MainTex);
o.Albedo = c.rgb;
o.Normal = UnpackNormal(tex2D(_NormalMap, IN.uv_MainTex));
o.Alpha = c.a;
}
ENDCG
}
FallBack "Diffuse"
03 效果图
04 demo地址
二、Stanford-Bunny-Fur-With-Unity(斯坦福兔子)
前言
这篇小文简单介绍一下如何在Unity中利用shader很简单的实现毛皮效果。
01 斯坦福兔子和它的毛
我相信对图形学感兴趣的一定经常会见到这个上镜率超高的兔子。
关于它的典故各位可以看看斯坦福兔子模型的来源和故事有哪些?
02 工程实现
接下来就开始我们对兔子的改造行动吧。
- 是否需要皮毛的网格数据呢?
答案:是
- 皮毛的网格要根据什么来生成呢?
要生在兔子身上,所以兔子的原始网格信息提供了皮毛的网格信息。
那么具体要怎么做?
很简单,Geometry Shader就是干这个的。而我们只需要根据兔子的网格信息,以每一个triangle为一个单位,在这个triangle上生成一个向外指的"金字塔" 就可以了。
也就是说,在原有triangle的基础上有新生成了3个指向外向triangle,形成毛皮的效果。
代码如下:Shader "Unlit/aiting_Shader-s" { Properties { _MainTex ("Texture", 2D) = "white" {} _FurFactor("FurFactor", Range(0.01, 0.05)) = 0.02 } SubShader { Tags{ "RenderType" = "Opaque" } LOD 100 Pass { CGPROGRAM #pragma vertex vert #pragma fragment frag #pragma geometry geom #include "UnityCG.cginc" struct appdata { float4 vertex : POSITION; float2 uv : TEXCOORD0; float3 normal : NORMAL; }; struct v2g { float4 vertex : POSITION; float3 normal : NORMAL; float2 uv : TEXCOORD0; }; struct g2f { float2 uv : TEXCOORD0; float4 vertex : SV_POSITION; fixed4 col : COLOR; }; sampler2D _MainTex; float4 _MainTex_ST; float _FurFactor; v2g vert(appdata_base v) { v2g o; o.vertex = v.vertex; o.uv = TRANSFORM_TEX(v.texcoord, _MainTex); o.normal = v.normal; return o; } [maxvertexcount(9)] void geom(triangle v2g IN[3], inout TriangleStream<g2f> tristream) { g2f o; float3 edgeA = IN[1].vertex - IN[0].vertex; float3 edgeB = IN[2].vertex - IN[0].vertex; float3 normalFace = normalize(cross(edgeA, edgeB)); float3 centerPos = (IN[0].vertex + IN[1].vertex + IN[2].vertex) / 3; float2 centerTex = (IN[0].uv + IN[1].uv + IN[2].uv) / 3; centerPos += float4(normalFace, 0) * _FurFactor; for (uint i = 0; i < 3; i++) { o.vertex = UnityObjectToClipPos(IN[i].vertex); o.uv = IN[i].uv; o.col = fixed4(0., 0., 0., 1.); tristream.Append(o); uint index = (i + 1) % 3; o.vertex = UnityObjectToClipPos(IN[index].vertex); o.uv = IN[index].uv; o.col = fixed4(0., 0., 0., 1.); tristream.Append(o); o.vertex = UnityObjectToClipPos(float4(centerPos, 1)); o.uv = centerTex; o.col = fixed4(1.0, 1.0, 1.0, 1.); tristream.Append(o); tristream.RestartStrip(); } } fixed4 frag(g2f i) : SV_Target { fixed4 col = tex2D(_MainTex, i.uv) * i.col; return col; } ENDCG } } }
03 效果图
因此总共会生成9个顶点,三个新三角形共同组成一根毛。
04 demo地址
https://github.com/chenjd/Stanford-Bunny-Fur-With-Unity
三、Explosion and sand effect(爆炸和砂效果)
前言
这篇文章继续沿用了同样来自斯坦福的另一个模型Armadillo,同样也使用了geometry shader来实现效果的表现。
01 凶恶的怪物和爆炸
当然,用之前的斯坦福兔子的模型做爆炸的效果也是可以的,但是考虑到要让一个那么可爱的模型变成沙砾总觉得不太好,所以长相自带怪物属性的模型Armadillo就成了一个不错的选择。
不过另一个让我选择Armadillo的原因其实是因为它的面数和顶点数相对来说更多,可以看到它有106289个顶点和212574个多边形组成,所以用来做爆炸成为沙砾的效果要更好。
02 工程实现
现在让我们把Armadillo的obj文件导入到Unity内,可以看到这个怪物已经站立在我们的场景内了。接下来我们就要利用geometry shader来实现我们想要的爆炸沙粒化的效果了。
之前提到Geometry Shader的时候,往往是利用它来生成更多新的顶点和多边形来实现我们期望的效果,例如利用它在GPU上生成草体,实现真实草的实时渲染。
但是Geometry Shader不仅可以生成新的图元,同时它还可以减少顶点和多边形的输出,以实现一些有趣的效果,比如这篇小文章的例子,利用Geometry Shader来实现怪兽的爆炸和沙粒化效果。
而我们要做的也很简单,就是在Geometry Shader内将输入的由3个顶点组成的三角形图元修改为只有一个顶点组成的点图元。而输出的这个点的坐标我们可以很简单的使用三角形的中心点坐标。
这样,组成怪兽的网格就由三角形图元变成了点图元,而且顶点数量也随之减少,至于怪物本身也变成了下面这个样子。
但是这个时候的模型是静止的,因此也看不出爆炸甚至是沙砾的效果。所以接下来我们就要让怪物的模型随着时间运动起来。
而一个大家都知道的运动学公式就可以用来实现这个效果:
其中的S就是顶点的最新位置,v0和a的值可以作为一个uniform变量传入shader,运动方向可以是沿着三角形的法线方向,而t的来源则是Unity内置的变量_Time的y分量。
这样,需要的几个变量我们就有了:之后只要带入运动学公式就好了。
代码如下:
using System.Collections;
using System.Collections.Generic;
using UnityEngine;
public class Test : MonoBehaviour
{
public Material ExplosionMaterial;
private bool isClicked;
void Update()
{
if (this.isClicked || this.ExplosionMaterial == null)
{
return;
}
if (Input.GetMouseButton(0))
{
Ray ray = Camera.main.ScreenPointToRay(Input.mousePosition);
RaycastHit Hit;
if (Physics.Raycast(ray, out Hit))
{
MeshRenderer[] renderers = Hit.collider.GetComponentsInChildren<MeshRenderer>();
this.ExplosionMaterial.SetFloat("_StartTime", Time.timeSinceLevelLoad);
for (int i = 0; i < renderers.Length; i++)
{
renderers[i].material = this.ExplosionMaterial;
}
this.isClicked = true;
}
}
}
}
shader代码:
Shader "Unlit/aiting_shader-m"
{
Properties
{
_MainTex ("Texture", 2D) = "white" {}
_Speed("Speed", Float) = 10
_AccelerationValue("AccelerationValue", Float) = 10
}
SubShader
{
Tags { "RenderType"="Opaque" }
LOD 100
Pass
{
CGPROGRAM
#pragma vertex vert
#pragma fragment frag
#pragma geometry geom
#include "UnityCG.cginc"
struct appdata
{
float4 vertex : POSITION;
float2 uv : TEXCOORD0;
};
struct v2g
{
float2 uv : TEXCOORD0;
float4 vertex : POSITION;
};
struct g2f
{
float2 uv : TEXCOORD0;
float4 vertex : SV_POSITION;
};
sampler2D _MainTex;
float _Speed;
float _AccelerationValue;
float _StartTime;
v2g vert (appdata v)
{
v2g o;
o.vertex = v.vertex;
o.uv = v.uv;
return o;
}
[maxvertexcount(1)]
void geom(triangle v2g IN[3], inout PointStream<g2f> pointStream)
{
g2f o;
float3 v1 = IN[1].vertex - IN[0].vertex;
float3 v2 = IN[2].vertex - IN[0].vertex;
float3 norm = normalize(cross(v1, v2));
float3 tempPos = (IN[0].vertex + IN[1].vertex + IN[2].vertex) / 3;
float realTime = _Time.y - _StartTime;
tempPos += norm * (_Speed * realTime + .5 * _AccelerationValue * pow(realTime, 2));
o.vertex = UnityObjectToClipPos(tempPos);
o.uv = (IN[0].uv + IN[1].uv + IN[2].uv) / 3;
pointStream.Append(o);
}
fixed4 frag (g2f i) : SV_Target
{
fixed4 col = tex2D(_MainTex, i.uv);
return col;
}
ENDCG
}
}
}
03 效果图
04 demo地址
https://github.com/chenjd/Unity-Miscellaneous-Shaders
Unity-Boids-Behavior-on-GPGPU(海鸥群/鱼群)
前言
在今年六月的Unity Europe 2017大会上unity的CTO Joachim Ante演示了未来unity新的编程特性--C# Job系统,它提供了编写多线程代码的一种既简单又安全的方法。Joachim通过一个大规模群落行为仿真的演示,向我们展现了最新的Job系统是如何充分利用CPU多核架构的优势来提升性能的。
但是吸引我的并非是C# Job如何利用多线程实现性能的提升,相反,吸引我的是如何在现在还没有C# Job系统的Unity中实现类似的效果。
在Ante的session中,他的演示主要是利用多核CPU提高计算效率来实现大群体行为。那么我就来演示一下,如何利用GPU来实现类似的目标吧。利用GPU做一些非渲染的计算也被称为GPGPU——General-purpose computing on graphics processing units,图形处理器通用计算。
01 CPU的限制
为何Joachim 要用这种大规模群落行为的仿真来宣传Unity的新系统呢?
其实相对来说复杂的并非逻辑,这里的关键词是“大规模”——在他的演示中,实现了20,000个boid的群体效果,而更牛逼的是帧率保持在了40fps上下。
事实上自然界中的这种群体行为并不罕见,例如大规模的鸟群,大规模的鱼群。
在搜集资料的时候,我还发现了一位优秀的水下摄影师、加利福尼亚海湾海洋计划总监octavio aburto的个人网站上的一些让人惊叹的作品。
图片来自OctavioAburto
而要在计算机上模拟出这种自然界的现象,乍看上去似乎十分复杂,但实际上却并非如此。
查阅资料,可以发现早在1986年就由Craig Reynolds提出了一个逻辑简单,而效果很赞的群体仿真模型——而作为这个群体内的个体的专有名词boid(bird-oid object,类鸟物)也是他提出的。
简单来说,一个群体内的个体包括3种基本的行为:
Separation:顾名思义,该个体用来规避周围个体的行为。
Alignment:作为一个群体,要有一个大致统一的前进方向。因此作为群体中的某个个体,可以根据自己周围的同伴的前进方向获取一个前进方向。
- Cohesion:同样,作为一个群体肯定要有一个向心力。否则队伍四散奔走就不好玩了,因此每个个体就可以根据自己周围同伴的位置信息获取一个向中心聚拢的方向。
以上三种行为需要同时加以考虑,才有可能模拟出一个接近真实的效果。
可以看出,这里的逻辑并不复杂,但是麻烦的问题在于实现这套逻辑的前提是每个个体boid都需要获取自己周围的同伴信息。
因此最简单也最通用的方式就是每个boid都要和群落中的所有boid比较位置信息,获取二者之间的距离,如果小于阈值则判定是自己周围的同伴。而这种比较的时间复杂度显然是O( n^2)。因此,当群体是由几百个个体组成时,直接在cpu上计算时的表现还是可以接受的。但是数量一旦继续上升,效果就很难保证了。
当然,在Unity中我们还可以利用它的物理组件来获取一个boid个体周围的同伴信息
这个方法会返回和自己重叠的对象列表,由于unity使用了空间划分的机制,所以这种方式的性能要好于直接比较n个boid之间的距离。
但是即便如此,cpu的计算能力仍然是一个瓶颈。随着群体个体数量的上升,性能也会快速的下降。
02 GPU的优势
既然限制的瓶颈在于CPU面对大规模个体时的计算能力的不足,那么一个自然的想法就是将这部分计算转移到更擅长大规模计算的GPU上来进行.
CPU的结构复杂,主要完成逻辑控制和缓存功能,运算单元较少。与CPU相比,GPU的设计目的是尽可能的快速完成图像处理,通过简化逻辑控制并增加运算单元实现了高性能的并行计算。
利用GPU的超强计算能力来实现一些渲染之外的功能并非一个新的概念,早在十年前nvidia就为GPU引入了一个易用的编程接口,即CUDA统一计算架构,之后微软推出了DirectCompute——它随DirectX 11一同发布。
和常见的vertex shader和fragment shader类似,要在GPU运行我们自己设定的逻辑也需要通过shader,不过和传统的shader的不同之处在于,compute shader并非传统的渲染流水线中的一个阶段,相反它主要用来计算原本由CPU处理的通用计算任务,这些通用计算常常与图形处理没有任何关系,因此这种方式也被称为GPGPU——General-purpose computing on graphics processing units,图形处理器通用计算。
利用这些功能,之前由CPU来实现的计算就可以转移到计算能力更强大的GPU上来进行了,比如物理计算、AI等等。
而Unity的Compute Shader十分接近DirectCompute,最初Unity引入Compute Shader时仅仅支持DirectX 11,不过目前的版本已经支持别的图形API了。详情可以参考:Unity - Manual: Compute shaders。
在Unity中我们可以很方便的创建一个Compute Shader,
这里我先简单的介绍一下这个Compute Shader中的相关概念,首先在这里我们指明了这个shader的入口函数。之后,声明了在compute shader中操作的数据。
这里使用的是RWTexture2D,而我们更常用的是RWStructuredBuffer(RW在这里表示可读写)。
之后是很关键的一行:[numthreads(8,8,1)]
这里首先要说一下Compute Shader执行的线程模型。DirectCompute将并行计算的问题分解成了多个线程组,每个线程组内又包含了多个线程。
[numthreads(8,8,1)]的意思是在这个线程组中分配了8x8x1=64个线程,当然我们也可以直接使用
因为三维线程模型主要是为了方便某些使用情景,和性能关系不大,硬件在执行时仍然是把所有线程当做一维的。
至此,我们已经在shader中确定了每个线程组内包括几个线程,但是我们还没有分配线程组,也没有开始执行这个shader。
和一般的shader不同,compute shader和图形无关,因此在使用compute shader时不会涉及到mesh、material这些内容。相反,compute shader的设置和执行要在c#脚本中进行。
在c#脚本中准备、传送数据,分配线程组并执行compute shader,最后数据再从GPU传递回CPU。
不过,这里有一个问题需要说明。虽然现在将计算转移到GPU后计算能力已经不再是瓶颈,但是数据的转移此时变成了首要的限制因素。而且在Dispatch之后直接调用GetData可能会造成CPU的阻塞。因为CPU此时需要等待GPU计算完毕并将数据传递回CPU,所以希望日后Unity能够提供一个异步版本的GetData。
最后将行为模拟的逻辑从CPU转移到GPU之后,模拟10,000个boid组成的大群组在我的笔记本上已经能跑在30FPS上下了。
03 工程实现
C#代码如下
GPUBoid脚本 :
using UnityEngine;
public struct GPUBoid
{
public Vector3 pos, rot, flockPos;
public float speed, nearbyDis, boidsCount;
}
GPUFlock脚本:
using System;
using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using Random = UnityEngine.Random;
public class GPUFlock : MonoBehaviour
{
#region 字段
public ComputeShader CShader;
public GameObject boidPrefab;
public int boidsCount;
public float spawnRadius;
public GameObject[] boidsGo;
public GPUBoid[] boidsData;
public float flockSpeed;
public float nearbyDis;
private Vector3 targetPos = Vector3.zero;
private int kernelHandle;
#endregion
#region 方法
void Start()
{
this.boidsGo = new GameObject[this.boidsCount];
this.boidsData = new GPUBoid[this.boidsCount];
this.kernelHandle = CShader.FindKernel("CSMain");
for (int i = 0; i < this.boidsCount; i++)
{
this.boidsData[i] = this.CreatBoidData();
this.boidsGo[i] = Instantiate(boidPrefab, this.boidsData[i].pos, Quaternion.Euler(this.boidsData[i].rot)) as GameObject;
this.boidsData[i].rot = this.boidsGo[i].transform.forward;
}
}
GPUBoid CreatBoidData()
{
GPUBoid boidData = new GPUBoid();
Vector3 pos = transform.position + Random.insideUnitSphere * spawnRadius;
Quaternion rot = Quaternion.Slerp(transform.rotation, Random.rotation, 0.3f);
boidData.pos = pos;
boidData.flockPos = transform.position;
boidData.boidsCount = this.boidsCount;
boidData.nearbyDis = this.nearbyDis;
boidData.speed = this.flockSpeed + Random.Range(-0.5f, 0.5f);
return boidData;
}
void Update()
{
this.targetPos += new Vector3(2f, 5f, 3f);
this.transform.localPosition += new Vector3(
(Mathf.Sin(Mathf.Deg2Rad * this.targetPos.x) * -0.2f),
(Mathf.Sin(Mathf.Deg2Rad * this.targetPos.y) * 0.2f),
(Mathf.Sin(Mathf.Deg2Rad * this.targetPos.z) * 0.2f)
);
ComputeBuffer buffer = new ComputeBuffer(boidsCount, 56);
for (int i = 0; i < this.boidsData.Length; i++)
{
this.boidsData[i].flockPos = this.transform.position;
}
buffer.SetData(this.boidsData);
CShader.SetBuffer(this.kernelHandle, "boidBuffer", buffer);
CShader.SetFloat("deltaTime", Time.deltaTime);
CShader.Dispatch(this.kernelHandle, this.boidsCount, 1, 1);
buffer.GetData(this.boidsData);
buffer.Release();
for (int i = 0; i < this.boidsData.Length; i++)
{
this.boidsGo[i].transform.localPosition = this.boidsData[i].pos;
if (!this.boidsData[i].rot.Equals(Vector3.zero))
{
this.boidsGo[i].transform.rotation = Quaternion.LookRotation(this.boidsData[i].rot);
}
}
}
#endregion
}
RotateForDemo脚本
using System.Collections;
using System.Collections.Generic;
using UnityEngine;
public class RotateForDemo : MonoBehaviour {
void Update () {
transform.localRotation = Quaternion.AngleAxis(10 * Time.deltaTime, Vector3.up) * transform.localRotation;
}
}
Shader代码如下:
// 用来在gpu上实现集群效果
//
#pragma kernel CSMain
//封装计算单个boid时所需要的数据
struct Boid
{
float3 pos;
float3 rot;
float3 flockPos;
float speed;
float nearbyDis;
float boidsCount;
};
RWStructuredBuffer<Boid> boidBuffer;
float deltaTime;
[numthreads(128, 1, 1)]
void CSMain(uint3 id : SV_DispatchThreadID)
{
Boid boid = boidBuffer[id.x];
float3 pos = boid.pos;
float3 rot = boid.rot;
//separation
float3 separation = float3(0.0, 0.0, 0.0);
//alignment
float3 alignment = float3(0.0, 0.0, 0.0);
//cohesion
float3 cohesion = boid.flockPos;
float3 tempCohesion = float3(0.0, 0.0, 0.0);
float tempSpeed = 0;
uint nearbyCount = 0;
[loop]
for (int i = 0; i < int(boid.boidsCount); i++)
{
if (i != int(id.x))
{
Boid tempBoid = boidBuffer[i];
if (length(boid.pos - tempBoid.pos) < boid.nearbyDis)
{
separation += boid.pos - tempBoid.pos;
alignment += tempBoid.rot;
tempCohesion += tempBoid.pos;
nearbyCount++;
}
}
}
if (nearbyCount > 0)
{
alignment *= 1 / nearbyCount;
tempCohesion *= 1 / nearbyCount;
}
cohesion += tempCohesion;
float3 direction = alignment + separation + normalize(cohesion - boid.pos);
boid.rot = lerp(boid.rot, normalize(direction), deltaTime * 4);
boid.pos += boid.rot * boid.speed * deltaTime;
boidBuffer[id.x] = boid;
}
效果图
demo地址
https://github.com/chenjd/Unity-Boids-Behavior-on-GPGPU
本项目是学习总结而来地址如下:
陈嘉栋
以上是关于Shader的学习的主要内容,如果未能解决你的问题,请参考以下文章
unity shader学习笔记 shader基础结构以及Properties面板
Cg入门20:Fragment shader - 片段级模型动态变色(实现汽车动态换漆)