Rust futures: async fn 中的 thread::sleep 和阻塞调用

Posted 跨链技术践行者

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Rust futures: async fn 中的 thread::sleep 和阻塞调用相关的知识,希望对你有一定的参考价值。

原文:Rust futures: thread::sleep and blocking calls inside async fn

URL: https://blog.hwc.io/posts/rust-futures-threadsleep-and-blocking-calls-inside-async-fn/

近来,关于 Rust 的futuresasync/await如何工作(“blockers”,哈哈),我看到存在一些普遍的误解。很多新用户为async/await带来的重大改进而感到兴奋,但是却被一些基本问题所困扰。即使有了async/await,并发依然很难。文档还在进一步充实,阻塞/非阻塞之间的交互很棘手。希望本文对你有所帮助。

(本篇主要是关于特定的痛点;有关 Rust 中的异步编程的概述,请转至本书

TLDR(Too Long Didn't Read):小心在async fn中使用昂贵的阻塞调用!如果不确定, 鉴于 Rust std库中几乎所有都是阻塞的,所以就要注意哪些调用是耗时的!

虽然我认为任何人都可能犯这个错误(在引入足够的负载来显著地阻塞线程之前,往往察觉不到),但是初学者尤为如此。下面的场景可能有点冗长,但我认为有必要展示一下在async fn中实现阻塞调用是多么容易。

不要用 std::thread::sleep sleep

在研究了一个简单的示例之后,Rust 异步新手可能要做的第一件事就是去验证程序真正实现了异步。因此,我们使用 Rust 异步书籍中的示例:

use futures::join;
async fn get_book_and_music() -> (Book, Music) {    let book_fut = get_book();    let music_fut = get_music();    join!(book_fut, music_fut)}

复制代码

即使你在 get_book 和 get_music 内部打日志,也无法通过简单的方式来判断它们是同时运行的,因为任何一次运行都可能产生恰好与代码顺序匹配的输出。你必须多次运行该程序,才能查看日志记录顺序是否可以翻转(如果不翻转怎么办?)。

如果想看到 get_book 和 get_music 是 100%同时运行,你可能会想到记录它们的开始时间,并查看开始时间是否相同。但是,等等,如果开始时间仍然是串行的,但 fn 运行得如此之快,看起来仍然像是并发该怎么办?

引入一个延迟!比如(清楚起见,使用伪码):

async fn get_book() {    println!("book start: time {}", current_time());    std::thread::sleep(one_second);    println!("book end: time {}", current_time());}

复制代码

在 get_book 和 get_music 内部延迟 1 秒,我们希望,如果是并发的话,则会看到以下的输出:

book start: time 0.00 

music start: time 0.00 

book end: time 1.00 

music start: time 1.00

如果是串行,我们预期是:

book start: time 0.00 

book end: time 1.00 

music start: time 1.00 

music end: time 2.00

你认为会发生什么, 串行或并发?

你已经读了这篇文章的标题,可能会猜到 get_book 和 get_music 是按顺序执行的。但为什么!?异步 fn 中的所有内容不是都应该同时运行吗?

在继续解释之前,可以看个问题已经多次被问到:

reddit 1 reddit 2 reddit 3 stackoverflow 1

因此,如果你也犯了这个错误,不用担心,其他许多人也有同样的经历。

什么搞错了?为什么 async 不行?

我不会在这里深入讨论futuresasync/await本书是一个很好的起点)。我只想指出造成困惑的两个可能的根源:

std::thread::sleep 会阻塞?

对于新手来说,std::thread::sleep会造成阻塞可能并不是显而易见的。尽管事后看起来很明显,但是当尝试掌握全新的程序执行范式时,却很容易忽略。

即使你大致了解并发,也可能不知道thread::sleep是具体如何实现的。一些上层推理加上一些示例(例如上述)可能会帮助你理解。但是文档中并没有明说“此调用是阻塞的,你不应该在异步上下文中使用它”,并且非系统程序员可能不会过多地考虑“将当前线程置于睡眠状态”。

(具有讽刺意味的是,如果人们的异步编程的心智模型是让Future进入“睡眠”状态从而得以让其他工作发生,那么thread::sleep可能会特别令人困惑)。

async 可以做什么?

但是有些人可能会说:“如果thread::sleep阻塞了怎么办?不是把它放在async fn中就好了吗?”

为了理解那些在线讨论,(就要知道)他们的想法是以为async可以使代码块或函数内部的所有内容异步。

首先,我想说这是有意义的;async/await存在的部分原因是它使每个人都容易进行异步操作。而且,如果你从较高的层次上理解了并发模型(事件循环,通常是尝试不阻塞线程),那么可能没有特定的理由导致async不能仅仅通过使事物定义为异步来起作用。那绝对是最简单,最符合人体工程学的方式。

不幸的是,这不是 Rust 的async范式的工作方式。async功能很强大,但从本质上讲,它只是提供了一种更好的处理Futures 的方法。而且Future不只是自动将阻塞调用移到一边以允许完成其他工作;它要结合使用具备轮询和异步运行时这种完全独立的系统,才能进行异步舞蹈。在该系统内进行的任何阻塞调用仍将处于阻塞状态。

这可能会造成一些困惑,因为async/await允许我们编写看起来更像常规(阻塞)代码的代码。那就是async/awaitawait部分进入的地方。当你在async块中awaitfuture 时,它能够将自己安排在线程外并为其他任务让路。阻塞代码可能看起来很相似,但是由于它不是 future,所以无法await,也无法为其他任务腾出空间。

因此,下面不会阻塞,但是await可以让你编写看起来与阻塞调用非常相似的代码:

async {    let f = get_file_async().await;    let resp = fetch_api_async().await;}

复制代码

下面在每行调用时阻塞:

async {    let f = get_file_blocking();    let resp = fetch_api_blocking();}

复制代码

下面将不能通过编译:

async {    let f = get_file_blocking().await;    let resp = fetch_api_blocking().await;}

复制代码

在这里什么也没有发生(您必须在async内部awaitfutures!):

async {    let f = get_file_async();    let resp = fetch_api_async();}

复制代码

总的来说,最好将async视为允许在函数或块中 await 的东西,但实际上并不会使任何东西异步。

如何不阻塞

如果想要异步 fn 取消阻塞该怎么办?

你可以找到一个异步替代方案:当thread::sleep阻塞时,你可以使用它们(取决于你选择的运行时生态系统):

tokioasync_std都为其他阻塞操作(例如文件系统和 tcp 流访问)提供了异步替代方法。

另一个选择是将阻塞调用移到另一个线程。

这要求你的运行时具有专用于卸载阻塞调用的机制(例如线程池)。

我还提出了一些问题,试图防止其他人陷入这个陷阱:

以上是关于Rust futures: async fn 中的 thread::sleep 和阻塞调用的主要内容,如果未能解决你的问题,请参考以下文章

Rust定时组件async-rs / futures-timer实现原理

如何实现对`async fn(&mut self)`进行轮询的`Future`?

指定 Rust 闭包的生命周期

Rust编程语言里的future

将同步 Rust IO 驱动程序转换为 `async`

Future<void> async 与 Dart 中的简单 void async