map 和 mapAsync 的区别

Posted

技术标签:

【中文标题】map 和 mapAsync 的区别【英文标题】:Difference between map and mapAsync 【发布时间】:2016-05-10 20:12:20 【问题描述】:

谁能解释一下 map 和 mapAsync w.r.t AKKA 流之间的区别? In the documentation据说

涉及外部非流的流转换和副作用 可以使用 mapAsync 或 mapAsyncUnordered 执行基于服务的服务

为什么我们不能简单地在这里映射?我假设 Flow、Source、Sink 本质上都是 Monadic 的,因此 map 应该可以正常工作,w.r.t 这些性质的延迟?

【问题讨论】:

【参考方案1】:

签名

区别在signatures 中最突出:Flow.map 接受一个返回类型T 的函数,而Flow.mapAsync 接受一个返回类型Future[T] 的函数。

实例

例如,假设我们有一个函数,它根据用户 ID 查询数据库以获取用户的全名:

type UserID   = String
type FullName = String

val databaseLookup : UserID => FullName = ???  //implementation unimportant

给定一个 UserID 的 akka 流 Source 值,我们可以在流中使用 Flow.map 来查询数据库并将全名打印到控制台:

val userIDSource : Source[UserID, _] = ???

val stream = 
  userIDSource.via(Flow[UserID].map(databaseLookup))
              .to(Sink.foreach[FullName](println))
              .run()

这种方法的一个限制是该流一次只能进行 1 个 db 查询。这种串行查询将成为“瓶颈”,并且可能会阻止我们的流中的最大吞吐量。

我们可以尝试通过使用Future 的并发查询来提高性能:

def concurrentDBLookup(userID : UserID) : Future[FullName] = 
  Future  databaseLookup(userID) 

val concurrentStream = 
  userIDSource.via(Flow[UserID].map(concurrentDBLookup))
              .to(Sink.foreach[Future[FullName]](_ foreach println))
              .run()

这个简单的附录的问题在于我们有效地消除了背压。

Sink 只是拉入 Future 并添加了一个foreach println,与数据库查询相比,速度相对较快。该流将不断地将需求传播到源并在Flow.map 内产生更多期货。因此,并发运行的databaseLookup 的数量没有限制。不受约束的并行查询最终可能会使数据库过载。

Flow.mapAsync 救援;我们可以同时访问数据库,同时限制同时查找的数量:

val maxLookupCount = 10

val maxLookupConcurrentStream = 
  userIDSource.via(Flow[UserID].mapAsync(maxLookupCount)(concurrentDBLookup))
              .to(Sink.foreach[FullName](println))
              .run()

还要注意Sink.foreach 变得更简单了,它不再接受Future[FullName],而是只接受FullName

无序异步映射

如果不需要将 UserID 保持到 FullName 的顺序,那么您可以使用 Flow.mapAsyncUnordered。例如:您只需将所有名称打印到控制台,而不关心它们的打印顺序。

【讨论】:

mapAsync 是否类似于将异步边界应用于该特定阶段?根据文档,标记异步边界将在actor中运行每个阶段,只是想知道它是否相同。 使用"com.typesafe.akka" %% "akka-stream" % "2.6.3",试过这个例子,编译错误type mismatch; found : akka.stream.scaladsl.Flow[Boolean,Boolean,akka.NotUsed] required: akka.stream.Graph[akka.stream.FlowShape[String,?],?]。如果有人可以为最新版本的 Akka Streams 更新此示例,我将不胜感激 @RamonJ 你能解释一下 mapAsync 将在哪个线程上执行吗?它会使用与 graph 相同的调度程序的线程吗(akka 流为它创建一个actor,除非你创建异步边界)? @beinghuman 鉴于mapAsync 不接受ExecutionContext,我认为是的,它使用与图表本身相同的调度程序。但是,我还没有阅读代码来确认是这种情况。 @radumanolescu 上述答案中没有任何部分使用Boolean,因此您的错误消息似乎没有使用“this example”。随意问一个***问题,我会尝试看看......

以上是关于map 和 mapAsync 的区别的主要内容,如果未能解决你的问题,请参考以下文章

.map()和.each()的区别

map和map0.5的区别

map,flatMap和flatMapLatest的区别

JS的forEach和map方法的区别,还有一个$each

Map和Collection的区别

JS中Map和Object的区别