ARM Cortex-A72 CPU All In One

Posted xgqfrms

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ARM Cortex-A72 CPU All In One相关的知识,希望对你有一定的参考价值。

ARM Cortex-A72 CPU All In One Raspberry Pi 4B, 4 核心 1.5GHz 64 位 CPU Raspberry Pi 4B, 4 核心 1.8GHz 64 位 CPU

ARM Cortex-A72 CPU All In One

Raspberry Pi 4B, BCM2711 4 核心 1.5GHz 64 位 CPU / Raspberry Pi 4B, BCM2711 4 核心 1.8GHz 64 位 CPU

Cortex-A72

https://developer.arm.com/Processors/Cortex-A72

https://developer.arm.com/documentation/100095/0003/Introduction/About-the-Cortex-A72-processor?lang=en

https://www.anandtech.com/show/9184/arm-reveals-cortex-a72-architecture-details

https://www.anandtech.com/show/8957/arm-announces-cortex-a72

CPU 性能分析

https://www.cpubenchmark.net/cpu.php?cpu=ARM+Cortex-A72+4+Core+1500+MHz&id=3917

Raspberry Pi 4B

https://www.raspberrypi.com/news/raspberry-pi-4-on-sale-now-from-35/

https://www.raspberrypi.com/news/8gb-raspberry-pi-4-on-sale-now-at-75/

1.5GHz => 1.8GHz 超频

每个周期的操作数 ARM Cortex CPU?

【中文标题】每个周期的操作数 ARM Cortex CPU?【英文标题】:Ops per cycle ARM Cortex CPUs? 【发布时间】:2015-02-20 18:06:25 【问题描述】:

我需要 ARM 处理器每个周期可以执行的操作数,尤其是 Cortex-A7、Cortex-A9 和 Cortex-A15 的操作数。 我在网上找不到任何东西!

谢谢

编辑:我需要它来计算理论峰值性能。

【问题讨论】:

您认为什么是操作 【参考方案1】:

我还没有研究过整数,但是对于每个周期的单双浮点操作,这是我迄今为止提出的(来自 flops-per-cycle-for-sandy-bridge-and-haswell-sse2-avx-avx2、peak-flops-per-cycle-for-arm11-and-cortex-a7-cores-in-raspberry-pi-1-and-2 和 Cortex-A9 NEON Media Processing Engine Technical Reference Manual)。

Cortex-A7:

0.5 DP FLOPs/cycle:标量 VMLA.F64 每四个周期。 1.0 DP FLOPs/cycle:标量 VADD.F64 每个周期。 2.0 SP FLOPs/cycle:标量 VMLA.F32 每个周期。 2.0 SP FLOPs/cycle:2 宽 VMLA.F32 每隔一个周期。

Cortex-A9:

1.5 DP FLOPs/cycle:标量 VMLA.F64 + 标量 VADD.F64 每隔一个周期。 4.0 SP FLOPs/cycle:2-wide VMLA.F32 每个周期。

Cortex-A15:

2.0 DP FLOPs/cycle:标量 VMLA.F64(或 VFMA.F64)每个周期。 8.0 SP FLOPs/cycle:每个周期 4-wide VMLA.F32(或 VFMA.F32)。

一个有趣的观察是,对于 Cortex-A7,Neon 浮点并不比 VFP 快。

【讨论】:

引用 Cortex-A7 的 1 DP FLOP/cycle 有点误导。一般来说,当人们在没有进一步上下文的情况下谈论 FLOP 时,其预期含义实际上是“对于乘法和加法的 50/50 混合”,因为这就是 GEMM 所做的(与 FFT 相距不远,尽管好的 FFT 通常会稍微加法-偏见)。 @StephenCanon,好点,我对此进行了辩论。我实际上在那里有 VMLA.F64,但将其删除。让我把它放回去。 @StephenCanon,我想知道我是否做出了错误的结论。我在nullprogram.com/blog/2015/07/10 上运行了代码,在我的 Raspberry Pi2 上使用 GCC 4.6 (raspian) 和 GCC 5.2 (arch) 时,Neon 的速度提高了大约两倍。我没有对时序进行稳健的测试(作者的时序数字有很大的误差),但它似乎大约是两倍,这意味着 Neon 比 Cortex-A7 上的 VFP 更快。请注意,到 10 月之前我几乎没有时间进行大量 SOing,所以在那之前我不会做出太多回应。【参考方案2】:

只看最常见的地方。

你有它:http://en.wikipedia.org/wiki/List_of_ARM_microarchitectures

【讨论】:

以上是关于ARM Cortex-A72 CPU All In One的主要内容,如果未能解决你的问题,请参考以下文章

Redis之父表示ARM服务器没戏!

[cpu]TI cortex-A9 查看cpu的频率

每个周期的操作数 ARM Cortex CPU?

在 ARM Cortex-A8 上启用 MMU 时出现问题。 CPU是S5PV210

你能帮我理解 ARM Cortex-A9 上的缓存行为吗?

ARM内核和架构