能解释一下CPU和GPU的并行运算和串行运算吗

Posted 2023-04-24

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了能解释一下CPU和GPU的并行运算和串行运算吗相关的知识，希望对你有一定的参考价值。

参考技术A 这就要从设计目标与用途说起了，CPU的设计是追求一种大而全的处理方式，所有的程序都要能很好的完成，不能搞特殊化，所以处理数据的方式是顺序处理，即将任务排队，每个时钟周期只能处理一个任务，这个任务完成后，才执行下一个任务，而GPU则不同，其设计目标是同一时钟周期内尽可能的完成多的但相对简单的任务，即将任务并列起来，处理方式是很多任务同时一次处理，简单的说就是CPU是全能型的高质量处理，追求质量，而GPU则是庞大的较为单一的高速处里，追求速度与吞吐量，这也是串行与并行各自的原理与追求的目标…本回答被提问者采纳

第三篇：GPU 并行编程的运算架构

前言

GPU 是如何实现并行的？它实现的方式较之 CPU 的多线程又有什么分别？

本文将做一个较为细致的分析。

GPU 并行计算架构

GPU 并行编程的核心在于线程，一个线程就是程序中的一个单一指令流，一个个线程组合在一起就构成了并行计算网格，成为了并行的程序，下图展示了多核 CPU 与 GPU 的计算网格：

　　

二者的区别将在后面探讨。

下图展示了一个更为细致的 GPU 并行计算架构:

该图表示，计算网格由多个流处理器构成，每个流处理器又包含 n 多块。

下面进一步对 GPU 计算网格中的一些概念做细致分析。

1. 线程

线程是 GPU 运算中的最小执行单元，线程能够完成一个最小的逻辑意义操作。

2. 线程束

线程束是 GPU 中的基本执行单元。GPU 是一组 SIMD 处理器的集合，因此每个线程束中的线程是同时执行的。这个概念是为了隐藏对显存进行读写带来的延迟所引入的。

目前英伟达公司的显卡此值为 32，不可改动，也不应该对其进行改动。

3. 线程块

一个线程块包含多个线程束，在一个线程块内的所有线程，都可以使用共享内存来进行通信、同步。但一个线程块能拥有的最大线程/线程束，和显卡型号有关。

4. 流多处理器

流多处理器就相当于 CPU 中的核，负责线程束的执行。同一时刻只能有一个线程束执行。

5. 流处理器

流处理器只负责执行线程，结构相对简单。

GPU 和 CPU 在并行计算方面的不同

1. 任务数量

CPU 适合比较少量的任务，而 GPU 则适合做大量的任务。

2. 任务复杂度

CPU 适合逻辑比较复杂的任务，而 GPU 则适合处理逻辑上相对简单的任务 (可用比较少的语句描述)。

3. 线程支持方式

由于 CPU 中线程的寄存器组是公用的，因此CPU 在切换线程的时候，会将线程的寄存器内容保存在 RAM 中，当线程再次启动的时候则会从 RAM 中恢复数据到寄存器。

而 GPU 中的各个线程则各自拥有其自身的寄存器组，因此其切换速度会快上不少。

当然，对于单个的线程处理能力来说，CPU 更强。

4. 处理器分配原则

CPU 一般是基于时间片轮转调度原则，每个线程固定地执行单个时间片；而 GPU 的策略则是在线程阻塞的时候迅速换入换出。

5. 数据吞吐量

GPU 中的每个流处理器就相当于一个 CPU 核，一个 GPU 一般具有 16 个流处理器，而且每个流处理器一次能计算 32 个数。

总结

1. 了解 CUDA 的线程模型是 GPU 并行编程的基础。

2. 根据待处理数据类型来组织线程结构是非常非常重要的，而这并不轻松，尤其是当出现了需要共享的数据时。

以上是关于能解释一下CPU和GPU的并行运算和串行运算吗的主要内容，如果未能解决你的问题，请参考以下文章

您好有个问题请教一下cpu怎么和gpu并行计算处理好日常软件

CPU和GPU的运算机制的差异

GPU是并行计算，CPU是串行计算？为啥这么说？

深度学习基础——硬件知识总结

深度学习用cpu训练和用gpu训练有啥区别？

第三篇：GPU 并行编程的运算架构