CUDA 学习(十五)应用程序性能优化

Posted tiemaxiaosu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CUDA 学习(十五)应用程序性能优化相关的知识,希望对你有一定的参考价值。

一、优化策略

        针对程序的性能优化,有以下7个策略:

       策略1:理解问题,并正确分解为串行/ 并行的工作负载。

       策略2:理解并优化内存带宽、延迟和缓存使用的问题。

       策略3:理解与主机端传输数据的玄机。考查锁页内存、零复制内存的表现和某些和某些硬件的带宽限制。

       策略4:理解线程结构和计算能力,并了解它们对性能的影响方式。

       策略5:组合一些通用算法的优化实例,讨论如何实现算法。

       策略6:关注性能分析,定位应用程序的瓶颈所在及其来源。

       策略7:考察如何让应用程序根据各种实现自我调优。


以上是关于CUDA 学习(十五)应用程序性能优化的主要内容,如果未能解决你的问题,请参考以下文章

CUDA 学习(十九)优化策略4:线程使用计算和分支

60 cuda全局性能优化

CUDA C Best Practices Guide 在线教程学习笔记 Part 1

CUDA 中不同块和线程的性能优化

深度学习部署笔记(十五): CUDA_Run_Time_API_parallel_多流并行,以及多流之间互相同步等待的操作方式

CUDA优化之LayerNorm性能优化实践