CUDA 学习(十五)应用程序性能优化
Posted tiemaxiaosu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CUDA 学习(十五)应用程序性能优化相关的知识,希望对你有一定的参考价值。
一、优化策略
针对程序的性能优化,有以下7个策略:
策略1:理解问题,并正确分解为串行/ 并行的工作负载。
策略2:理解并优化内存带宽、延迟和缓存使用的问题。
策略3:理解与主机端传输数据的玄机。考查锁页内存、零复制内存的表现和某些和某些硬件的带宽限制。
策略4:理解线程结构和计算能力,并了解它们对性能的影响方式。
策略5:组合一些通用算法的优化实例,讨论如何实现算法。
策略6:关注性能分析,定位应用程序的瓶颈所在及其来源。
策略7:考察如何让应用程序根据各种实现自我调优。
以上是关于CUDA 学习(十五)应用程序性能优化的主要内容,如果未能解决你的问题,请参考以下文章
CUDA C Best Practices Guide 在线教程学习笔记 Part 1
深度学习部署笔记(十五): CUDA_Run_Time_API_parallel_多流并行,以及多流之间互相同步等待的操作方式