什么是 Core Animation 的字节对齐(缓存行对齐)?为什么重要?
Posted
技术标签:
【中文标题】什么是 Core Animation 的字节对齐(缓存行对齐)?为什么重要?【英文标题】:what is byte alignment (cache line alignment) for Core Animation? Why it matters? 【发布时间】:2014-05-21 18:14:25 【问题描述】:我以非惰性方式在滚动视图上加载图像,因此看不到口吃行为。代码有效,FPS接近60。
但是,我不明白 Core Animation 的字节对齐(或缓存行对齐)是什么?
正如here 和here 所述,这是一件很重要的事情。但是,我注意到只要执行here 提到的步骤,字节对齐与否并不重要。
有人知道它到底是什么吗?
【问题讨论】:
【参考方案1】:当 CPU 将某些内容从内存复制到 CPU 缓存中时,它会以块的形式进行。这些块是高速缓存行,它们的大小是固定的。当数据存储在 CPU 缓存中时,它以行的形式存储。使您的数据适合您的目标架构的缓存行大小对性能很重要,因为它会影响数据的局部性。
ARMv7 使用 32 字节缓存线(如 PowerPC)。 A9 处理器使用 64 字节高速缓存行。正因为如此,通过渲染到一个 64 字节边界上且尺寸为 64 字节倍数的矩形,您将看到最大的好处。
另一方面,图形加速器确实更喜欢使用二维的平方幂的图像数据。这与缓存行或字节对齐没有任何关系。这是另一件会对性能产生重大影响的事情。
在您链接到的特定情况下,将调用 Apple API(Core Animation、QT 等)。代表调用者执行这些类型的优化。在 CoreAnimation 的情况下,调用者向它提供它正在为硬件优化的数据。根据 Path 在您链接到的文档中所写的内容,他们建议提供无需优化的 Core Animation 数据(在这种情况下,优化并制作副本)以避免优化步骤。
因此,如果您的图像尺寸是 64 字节的倍数,并且每个尺寸都是 2 的平方幂,那么您就可以了;)将该图像渲染到 64 字节边界上的屏幕区域是也不错,但除了像游戏这样的全屏应用程序之外,并不总是很现实。
也就是说,使用仪器。构建您的应用程序,使用 Instruments 和代表性工作负载对其进行分析(UIAutomation 非常适合此)。如果您看到滚动性能问题,Instruments 将为您提供所需的一切,让您了解瓶颈所在的位置。
老实说,我看到的所有滚动性能问题都没有涉及字节对齐或缓存行。相反,它是其他形式的 Core Animation 滥用(不使用光栅化和缓存),或者在主线程上做了太多其他工作,等等。
Quartz 2D Programming Guide中提到了字节对齐对性能影响的指导
这是 Core Animation 在进行复制时优化图像的格式。如果您已经拥有 Core Animation 所需格式的数据,它将跳过可能昂贵的优化步骤。
如果您想详细了解 ios 图形管道的工作原理,请参阅:
WWDC 2012 Session 238 "iOS App Performance: Graphics and Animations"
WWDC 2012 Session 235 "iOS App Performance: Responsiveness"
WWDC 2011 Session 121 "Understanding UIKit Rendering"
iOS Device Compatibility Reference: OpenGL ES Graphics
【讨论】:
非常好的讨论。 - 关于这个主题还有不止一个优秀的 WWDC 视频。 @matt 你有链接吗? 查找名称中带有“性能”的任何 WWDC 视频 - 带有动画的性能等。以上是关于什么是 Core Animation 的字节对齐(缓存行对齐)?为什么重要?的主要内容,如果未能解决你的问题,请参考以下文章