iOS性能优化-理论基础

Posted 乌戈勒

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了iOS性能优化-理论基础相关的知识,希望对你有一定的参考价值。

前言

在使用UIKit的过程中,性能优化是永恒的话题。很多分析优化滑动性能的文章,只介绍了优化方法,却对背后的原理避而不谈,本文对其中原理进行了简单的总结!

不妨思考一下下面的问题,自己是否有一个清晰的认识:
1、界面为什么会卡顿?–从屏幕显示图像的原理去分析(丢帧现象)
2、你怎么检测界面存在卡顿?– 参考KMCGeigerCounter(FPS、CADisplayLink、SKView)
3、为什么频繁调整视图层次、添加和移除视图,会很耗CPU性能?–从UIView(frame/bounds/transform)分析CALayer调用这些属性的内部实现解释
4、为什么在后台线程提前计算好视图布局、并且对视图布局进行缓存,这样能解决性能问题?–同上
5、文本展示为什么用CoreText绘制,CoreText相比UILabel好在哪里?–CoreText 对象创建好后,能直接获取文本的宽高等信息,避免了多次计算(调整 UILabel 大小时算一遍、UILabel 绘制时内部再算一遍);CoreText 对象占用内存较少,可以缓存下来以备稍后多次渲染。
6、为什么在setImage之前要先将image进行解码操作?
7、为什么要把控件尽量设置成不透明opaque=YES?–从GPU处理多个视图view/CALayer混合叠加的原理分析
8、为什么设置CALayer 的 border、圆角、阴影、遮罩(mask),CASharpLayer 的矢量图形显示,重写drawRect方法,会影响滑动的流畅性?–从离屏渲染分析
9、什么是离屏渲染?参考文章iOS性能优化-离屏渲染
10、光栅化shouldRasterize和离屏渲染的关系是什么,何时应该使用?
11、怎么对UITableView进行性能优化?–参考FDTemplateLayoutCell预排版、预估高度
12、如何解决CALayer 的 border、圆角、阴影、遮罩这些引起的离屏渲染导致的性能问题?–参考CoreGraphics重绘
13、如何设计一套ios的LRU图片缓存淘汰框架?–参考YYMemoryCache(双向链表)
14、如何解决多线程爆炸的问题?–参考YYDispatchQueuePool(为不同优先级创建和 CPU 数量相同的 serial queue,每次从 pool 中获取 queue 时,会轮询返回其中一个 queue。)

首先理解一下,手机屏幕显示图像的原理是怎样的?

一、屏幕显示图像的原理

计算机系统中 CPU、GPU、显示器的工作方式:
CPU 计算好显示内容提交到 GPU,GPU 渲染完成后将渲染结果放入帧缓冲区,随后视频控制器会按照 VSync 信号逐行读取帧缓冲区的数据,经过可能的数模转换传递给显示器显示。

在最简单的情况下,帧缓冲区只有一个,这时帧缓冲区的读取和刷新都都会有比较大的效率问题。为了解决效率问题,显示系统通常会引入两个缓冲区,即双缓冲机制。在这种情况下,GPU 会预先渲染好一帧放入一个缓冲区内,让视频控制器读取,当下一帧渲染好后,GPU 会直接把视频控制器的指针指向第二个缓冲器。如此一来效率会有很大的提升。

双缓冲虽然能解决效率问题,但会引入一个新的问题。当视频控制器还未读取完成时,即屏幕内容刚显示一半时,GPU 将新的一帧内容提交到帧缓冲区并把两个缓冲区进行交换后,视频控制器就会把新的一帧数据的下半段显示到屏幕上,造成画面撕裂现象。

为了解决这个问题,GPU 通常有一个机制叫做垂直同步(简写也是 V-Sync),当开启垂直同步后,GPU 会等待显示器的 VSync 信号发出后,才进行新的一帧渲染和缓冲区更新。这样能解决画面撕裂现象,也增加了画面流畅度,但需要消费更多的计算资源,也会带来部分延迟。

理解了屏幕显示图像的原理之后,我们就可以分析UI卡顿的原因了。

二、UI卡顿的原因

在 VSync 信号到来后,系统图形服务会通过 CADisplayLink 等机制通知 App,App 主线程开始在 CPU 中计算显示内容,比如视图的创建、布局计算、图片解码、文本绘制等。
随后 CPU 会将计算好的内容提交到 GPU 去,由 GPU 进行变换、合成、渲染。
随后 GPU 会把渲染结果提交到帧缓冲区去,等待下一次 VSync 信号到来时显示到屏幕上。

由于垂直同步的机制,如果在一个 VSync 时间内,CPU 或者 GPU 没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示,而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因。

CPU 和 GPU 不论哪个阻碍了显示流程,都会造成掉帧现象。

知道了UI卡顿的原因之后,我们应该怎么解决卡顿问题呢,接下来分别从 CPU 和 GPU 压力进行评估和优化。

三、UI卡顿的解决方案

1、CPU的压力评估和优化

1.1、对象的创建

对象的创建会分配内存、调整属性、甚至还有读取文件等操作,比较消耗 CPU 资源。

1、CALayer 比 UIView 要轻量许多,那么不需要响应触摸事件的控件,用 CALayer 显示会更加合适。如果对象不涉及 UI 操作,则尽量放到后台线程去创建,但可惜的是包含有 CALayer 的控件,都只能在主线程创建和操作。
2、通过 Storyboard 创建视图对象时,其资源消耗会比直接通过代码创建对象要大非常多,在性能敏感的界面里,Storyboard 并不是一个好的技术选择。
3、懒加载
4、复用

1.2、对象的调整

这里特别说一下 CALayer:CALayer 内部并没有属性,当调用属性方法时,它内部是通过运行时 resolveInstanceMethod 为对象临时添加一个方法,并把对应属性值保存到内部的一个 Dictionary 里,同时还会通知 delegate、创建动画等等,非常消耗资源。UIView 的关于显示相关的属性(比如 frame/bounds/transform)等实际上都是 CALayer 属性映射来的,所以对 UIView 的这些属性进行调整时,消耗的资源要远大于一般的属性。对此你在应用中,应该尽量减少不必要的属性修改。

当视图层次调整时,UIView、CALayer 之间会出现很多方法调用与通知,所以在优化性能时,应该尽量避免调整视图层次、添加和移除视图。

1.3、对象的销毁

通常当容器类持有大量对象时,其销毁时的资源消耗就非常明显,如果对象可以放到后台线程去释放,那就挪到后台线程去。

NSArray *tmp = self.array;
self.array = nil;
dispatch_async(queue, ^
    [tmp class];
);

1.4、布局的计算

不论通过何种技术对视图进行布局,其最终都会落到对 UIView.frame/bounds/center 等属性的调整上。上面也说过,对这些属性的调整非常消耗资源,所以尽量提前计算好布局,在需要时一次性调整好对应属性,而不要多次、频繁的计算和调整这些属性。

1.5、图片的解码

当你用 UIImage 或 CGImageSource 的那几个方法创建图片时,图片数据并不会立刻解码。图片设置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的数据才会得到解码。这一步是发生在主线程的,并且不可避免。

如果想要绕开这个机制,常见的做法是在后台线程先把图片绘制到 CGBitmapContext 中,然后从 Bitmap 直接创建图片。目前常见的网络图片库都自带这个功能(SDWebImage)。

1.6、图像的绘制

图像的绘制通常是指用那些以 CG 开头的方法把图像绘制到画布中,然后从画布创建图片并显示这样一个过程。这个最常见的地方就是 [UIView drawRect:] 里面了。

由于 CoreGraphic 方法通常都是线程安全的,所以图像的绘制可以很容易的放到后台线程进行。一个简单异步绘制的过程大致如下(实际情况会比这个复杂得多,但原理基本一致):

- (void)display 
    dispatch_async(backgroundQueue, ^
        CGContextRef ctx = CGBitmapContextCreate(...);
        // draw in context...
        CGImageRef img = CGBitmapContextCreateImage(ctx);
        CFRelease(ctx);
        dispatch_async(mainQueue, ^
            layer.contents = img;
        );
    );

1.7、文本的渲染

屏幕上能看到的所有文本内容控件,包括 UIWebView,在底层都是通过 CoreText 排版、绘制为 Bitmap 显示的。常见的文本控件 (UILabel、UITextView 等),其排版和绘制都是在主线程进行的,当显示大量文本时,CPU 的压力会非常大。

对此解决方案只有一个,那就是自定义文本控件,用 TextKit 或最底层的 CoreText 对文本异步绘制。
尽管这实现起来非常麻烦,但其带来的优势也非常大,CoreText 对象创建好后,能直接获取文本的宽高等信息,避免了多次计算(调整 UILabel 大小时算一遍、UILabel 绘制时内部再算一遍);CoreText 对象占用内存较少,可以缓存下来以备稍后多次渲染。

1.8、文本的计算

如果一个界面中包含大量文本(比如微博微信朋友圈等),文本的宽高计算会占用很大一部分资源,并且不可避免。

如果你对文本显示没有特殊要求,可以参考下 UILabel 内部的实现方式:用 [NSAttributedString boundingRectWithSize:options:context:] 来计算文本宽高,用 -[NSAttributedString drawWithRect:options:context:] 来绘制文本。
尽管这两个方法性能不错,但仍旧需要放到后台线程进行以避免阻塞主线程。

如果你用 CoreText 绘制文本,那就可以先生成 CoreText 排版对象,然后自己计算了,并且 CoreText 对象还能保留以供稍后绘制使用。

2、GPU的压力评估和优化

相对于 CPU 来说,GPU 能干的事情比较单一:接收提交的纹理(Texture)和顶点描述(三角形),应用变换(transform)、混合并渲染,然后输出到屏幕上。通常你所能看到的内容,主要也就是纹理(图片)和形状(三角模拟的矢量图形)两类。

2.1、视图的混合

当多个视图(或者说 CALayer)重叠在一起显示时,GPU 会首先把他们混合到一起。如果视图结构过于复杂,混合的过程也会消耗很多 GPU 资源。

为了减轻这种情况的 GPU 消耗,应用应当尽量减少视图数量和层次,并在不透明的视图里标明 opaque 属性以避免无用的 Alpha 通道合成。

2.2、图形的生成

CALayer 的 border、圆角、阴影、遮罩(mask),CASharpLayer 的矢量图形显示,通常会触发离屏渲染(offscreen rendering),而离屏渲染通常发生在 GPU 中。当一个列表视图中出现大量圆角的 CALayer,并且快速滑动时,可以观察到 GPU 资源已经占满,而 CPU 资源消耗很少。这时界面仍然能正常滑动,但平均帧数会降到很低。

1、为了避免这种情况,可以尝试开启 CALayer.shouldRasterize 属性,但这会把原本离屏渲染的操作转嫁到 CPU 上去。
2、对于只需要圆角的某些场合,也可以用一张已经绘制好的圆角图片覆盖到原本视图上面来模拟相同的视觉效果。
3、最彻底的解决办法,就是把需要显示的图形在后台线程绘制为图片,避免使用圆角、阴影、遮罩等属性。

2.3、纹理的渲染

所有的 Bitmap,包括图片、文本、栅格化的内容,最终都要由内存提交到显存,绑定为 GPU Texture。不论是提交到显存的过程,还是 GPU 调整和渲染 Texture 的过程,都要消耗不少 GPU 资源。当在较短时间显示大量图片时(比如 TableView 存在非常多的图片并且快速滑动时),CPU 占用率很低,GPU 占用非常高,界面仍然会掉帧。

避免这种情况的方法只能是尽量减少在短时间内大量图片的显示,尽可能将多张图片合成为一张进行显示。

四、内存恶鬼drawRect

drawRect导致内存暴增的真正原因:重写drawRect为何会导致内存大量上涨?

- (void)drawRect:(CGRect)rect 
    if (!self.paths.count) return;
    CGContextRef ctx = UIGraphicsGetCurrentContext();
    for (BHBPaintPath *path in self.paths) 
          CGContextSaveGState(ctx);
          [[UIColor blackColor] set];
          [path stroke]; //关键的一步绘制
          CGContextRestoreGState(ctx);
     

参考文章内存恶鬼drawRect

以上是关于iOS性能优化-理论基础的主要内容,如果未能解决你的问题,请参考以下文章

iOS性能优化-离屏渲染

iOS性能优化-离屏渲染

MySQL 数据库性能优化之SQL优化

java基础入门第二版第三章答案,理论+实战双管齐下!

iOS 性能优化

性能优化:关于缓存的一些思考