IOPS 与吞吐量

Posted 2023-02-19

技术标签:

【中文标题】IOPS 与吞吐量【英文标题】：IOPS versus Throughput 【发布时间】：2013-03-23 11:30:20 【问题描述】：

大数据存储中 IOPS 和吞吐量之间的主要区别是什么？文件大小对 IOPS 有影响吗？为什么？

【问题讨论】：

【参考方案1】：

IOPS 衡量每秒读取和写入操作的数量，而吞吐量衡量每秒读取或写入的位数。

虽然它们测量不同的东西，但它们通常相互跟随，因为 IO 操作的大小大致相同。

如果你有大文件，你只需要更多的 IO 操作来读取整个文件。文件大小对 IOPS 没有影响，因为它衡量的是读取或写入的集群数量，而不是文件数量。

如果您有小文件，则会有更多开销，因此虽然 IOPS 和吞吐量看起来不错，但您可能会遇到较低的实际性能。

【讨论】：

谢谢，假设我有一个 100TB 的磁盘，里面有 200KB 的文件。 Chuck 大小为 32KB，每秒传输 4GB 数据。我如何计算这个系统的 IOPs @halilenver：你无法计算它，你测量它。您可以通过将吞吐量除以块大小来计算理论最大值，但实际 IOPS 会更低，因为不同的 IO 操作需要不同的时间。如果您考虑平均寻道时间，您可以有根据地猜测您可以合理地接近理论最大值。我想更多地了解iops和吞吐量之间的区别。是否有任何优化可以增加 iops 但不能增加吞吐量？或相反亦然？就像减少延迟不一定会增加吞吐量一样？ @ErbenMo：降低延迟对 IOPS 和吞吐量的影响大致相同，因为它只是消除了等待时间。例如，如果您更改块大小，这通常会极大地影响 IOPS，但只会轻微影响吞吐量。如果 IOPS 乘以块大小接近吞吐量，那么对于您拥有的文件的大小，您就有一个很好的块大小。如果块大小太小或太大，则会产生大量开销。不一定是以下情况，例如，如果需要读取/写入文件的小块分散在许多块中，那么您可能需要大量的IOPS，而吞吐量却没有跟随IOPS。考虑到 HDD 上昂贵的寻轨工作，随机但小块的读/写会造成很大的麻烦，并且吞吐量不会跟随 IOPS。【参考方案2】：

IOPS - 读写操作的数量，主要用于 AWS 中用于 Cassandra 等数据库的 OLTP 事务。

吞吐量 - 是每秒传输的位数。即每秒传输的数据。主要是大数据hadoop、kafka流等高数据传输应用的单元

【讨论】：

【参考方案3】：

磁盘 IOPS 描述了磁盘上每秒输入/输出操作的计数，与块大小无关。

磁盘吞吐量描述了每秒可以传输多少数据，因此块大小在计算应用程序所需的吞吐量时起着巨大的作用

让我们以 3000 IOPS 和 SQL 数据库引擎为例，数据库引擎的块大小称为page size，对于 SQL Server，它等于 8 KB。如果您想计算实际吞吐量，如果定义了 IOPS，您将得到以下公式：

throughput = [IOPS] * [block size] = 3000 * 8 = 24 000 KB/s = 24 MB/s

【讨论】：

因此它们是相关的。请注意一件事：单个 IO 操作是否总是“大”作为一个块大小？【参考方案4】：

这是我在谈论吞吐量和 IOPS 时想到的类比。

把它想象成：

您有 4 个大小相同的水桶（磁盘块），您想装满或清空水。

您将使用水壶将水转移到水桶中。现在你的问题是：

在给定的时间（每秒），你可以倒（写）或取出（读）多少壶水？这是 IOPS。

在给定时间（每秒），水壶可以连续进出水桶的水量（bit、kb、mb 等）是多少？这是吞吐量。

此外，您倒水和/或取水的过程存在延迟。这是延迟。

在谈论 IOPS 和吞吐量时需要考虑 3 件事：

大小（文件大小/块大小）模式（随机/顺序）混合（读/写）百分比

【讨论】：

举个例子，如果你需要高吞吐量，你总是需要更高的IOPS？或者在队列之间是否有任何其他机制 @kuhajeyan 我认为如果块大小更大（在本例中为大罐子），更少的 IOPS 也可以从高吞吐量中受益。

以上是关于IOPS 与吞吐量的主要内容，如果未能解决你的问题，请参考以下文章