重叠的 IO 或文件映射？

Posted 2023-03-11

技术标签:

【中文标题】重叠的 IO 或文件映射？【英文标题】：Overlapped IO or file mapping? 【发布时间】：2013-02-09 01:33:09 【问题描述】：

在 Windows 应用程序中，我有一个包含文件名和缓冲区的类。您使用文件名构造它，您可以查询对象以查看缓冲区是否已填充，如果没有则返回 nullptr，如果是则返回缓冲区地址。当对象超出范围时，释放缓冲区：

class file_buffer

public:
    file_buffer(const std::string& file_name);
    ~file_buffer();
    void* buffer();

private:
    ...

我想将数据异步放入内存，据我所知，我有两个选择：要么创建缓冲区并通过 ReadFileEx 使用重叠 IO，要么使用 MapViewOfFile 并在另一个线程上触摸地址。

目前我正在使用 ReadFileEx，它会出现一些问题，因为大于约 16MB 的请求很容易失败：我可以尝试拆分请求，但随后会出现同步问题，并且如果对象之前超出范围IO 已完成我有缓冲区清理问题。此外，如果类的多个实例被快速连续创建，事情会变得非常繁琐。

在另一个线程上映射和触摸数据似乎要容易得多，因为我不会遇到上限问题：如果客户端现在绝对必须拥有数据，他们可以简单地取消引用地址，让操作系统担心页面错误并接受阻塞。

这个应用程序需要支持单核机器，所以我的问题是：另一个软件线程上的页面错误会比当前线程上的重叠 IO 更昂贵吗？他们会拖延这个过程吗？重叠的 IO 是否会以相同的方式停止进程，还是有一些我不明白的操作系统魔法？是否仍然使用重叠 IO 执行页面错误？

我已经阅读了以下主题： http://msdn.microsoft.com/en-us/library/aa365199(v=vs.85).aspx（文件管理中的IO概念） http://msdn.microsoft.com/en-us/library/windows/desktop/aa366556(v=vs.85).aspx（文件映射）但我似乎无法推断出如何进行性能权衡。

【问题讨论】：

哇哦！我有风滚草徽章。也许我应该添加 C++ 标签... 【参考方案1】：

您肯定会想要使用内存映射文件。 Overlapped IO (with FILE_FLAG_NO_BUFFERING) 多年来一直被一些人提倡为“将数据放入 RAM 的最快方式”，但这仅在非常人为的情况下和非常具体的条件下才是正确的。在一般情况下，关闭缓冲区缓存是一种严重的反优化。

现在，重叠 IO 没有 FILE_FLAG_NO_BUFFERING具有重叠 IO 的所有怪癖，并且速度慢了大约 50%（原因我仍然无法理解）。

我已经做了一些相当广泛的基准测试a year ago。底线是：内存映射文件更快、更好、更少令人惊讶。

重叠 IO 使用更多 CPU，使用缓冲区缓存时速度要慢得多，在一些有据可查和一些无证条件下（例如加密、压缩和...纯机会？请求大小？请求数）异步恢复为同步?)，在不可预知的时间停止您的应用程序。提交请求有时会花费“有趣”的时间，CancelIO 有时不会取消任何内容，而是等待完成。具有未完成请求的进程是无法杀死的。管理具有突出重叠写入的缓冲区是一项非常重要的额外工作。

文件映射可以正常工作。句号。而且效果很好。没有惊喜，没有有趣的东西。触摸每一页的开销非常小，并且交付速度与磁盘能够交付的速度一样快，并且它利用了缓冲区缓存。您对单核 CPU 的关注没有问题。如果触摸线程出现故障，它就会阻塞，并且与往常一样，当一个线程阻塞时，另一个线程会获得 CPU 时间。

我什至现在在写入时使用文件映射，只要我有多个字节要写入。这有点不简单（必须手动增长/预分配文件和映射，并在关闭时截断为实际长度），但对于一些辅助类，它是完全可行的。写入 500 MiB 的数据，这需要“零时间”（您基本上是在执行 memcpy，实际的写入发生在后台，任何时间之后，甚至在您的程序完成之后）。即使您知道这是操作系统自然而然会做的事情，它的效果也令人惊叹。当然，在操作系统写出所有页面之前最好不要出现电源故障，但对于任何类型的写入都是如此。磁盘上还没有的东西磁盘上还没有——真的没有什么比这更要说的了。如果您必须确定这一点，则必须等待磁盘同步完成，即使这样，您也不能确定在等待同步时灯不会熄灭。这就是生活。

【讨论】：

【参考方案2】：

我并没有声称比你更了解这一点，因为你似乎做了一些发明。并且完全确定您需要进行实验。但这是我对这些问题的理解，顺序相反：

幕后

不会

程序员

内存在完全进入内存之前就可以使用内存可以/将由进程的多个实例共享如果内存在缓存中，它将立即就绪，而不是很快。如果数据是只读的，你可以保护内存不被写入，捕捉错误。

【讨论】：

感谢您的意见；它符合我对这种情况的看法。我更喜欢内存映射方法，但我已经调试、测试过代码并且出售替代品需要性能改进。 @hatcat：如果您还没有使用它，您也可以在打开文件时尝试使用FILE_FLAG_SEQUENTIAL_SCAN。它可以提高重叠和映射 IO 的性能。

以上是关于重叠的 IO 或文件映射？的主要内容，如果未能解决你的问题，请参考以下文章