Scala将Collection转换为按键映射的最佳方法是什么?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scala将Collection转换为按键映射的最佳方法是什么?相关的知识,希望对你有一定的参考价值。

如果我有c类型的T集合,并且在p上有T属性(比如P类型),那么逐行提取映射的最佳方法是什么?

val c: Collection[T]
val m: Map[P, T]

一种方法如下:

m = new HashMap[P, T]
c foreach { t => m add (t.getP, t) }

但现在我需要一个可变的地图。有没有更好的方法来做到这一点,以便它在一行,我最终得到一个不可变的地图? (显然我可以把上面变成一个简单的库实用程序,就像我在Java中那样,但我怀疑在Scala中没有必要)

答案

您可以使用

c map (t => t.getP -> t) toMap

但请注意,这需要2次遍历。

另一答案

这对我有用:

val personsMap = persons.foldLeft(scala.collection.mutable.Map[Int, PersonDTO]()) {
    (m, p) => m(p.id) = p; m
}

Map必须是可变的,并且Map必须返回,因为添加到mutable Map不会返回map。

另一答案

在集合上使用map(),然后使用toMap

val map = list.map(e => (e, e.length)).toMap
另一答案

您可以使用可变数量的元组构造Map。因此,使用集合上的map方法将其转换为元组集合,然后使用:_ * trick将结果转换为变量参数。

scala> val list = List("this", "maps", "string", "to", "length") map {s => (s, s.length)}
list: List[(java.lang.String, Int)] = List((this,4), (maps,4), (string,6), (to,2), (length,6))

scala> val list = List("this", "is", "a", "bunch", "of", "strings")
list: List[java.lang.String] = List(this, is, a, bunch, of, strings)

scala> val string2Length = Map(list map {s => (s, s.length)} : _*)
string2Length: scala.collection.immutable.Map[java.lang.String,Int] = Map(strings -> 7, of -> 2, bunch -> 5, a -> 1, is -> 2, this -> 4)
另一答案

除了@James Iry的解决方案之外,还可以使用折叠来实现此目的。我怀疑这个解决方案比tuple方法稍快(创建的垃圾对象更少):

val list = List("this", "maps", "string", "to", "length")
val map = list.foldLeft(Map[String, Int]()) { (m, s) => m(s) = s.length }
另一答案

这可以通过如下折叠整个集合而不变地实现并且通过单次遍历来实现。

val map = c.foldLeft(Map[P, T]()) { (m, t) => m + (t.getP -> t) }

解决方案有效,因为添加到不可变Map会返回带有附加条目的新不可变Map,并且此值通过fold操作用作累加器。

这里的权衡是代码与其效率的简单性。因此,对于大型集合,这种方法可能比使用2遍遍实现更合适,例如应用maptoMap

另一答案

另一种解决方案(可能不适用于所有类型)

import scala.collection.breakOut
val m:Map[P, T] = c.map(t => (t.getP, t))(breakOut)

这避免了中间列表的创建,更多信息在这里:Scala 2.8 breakOut

另一答案

你想要实现的是有点不确定。 如果c中的两个或更多项目共享相同的p怎么办?哪个项目将映射到地图中的p

更准确的观察方式是在p和所有c物品之间产生一张地图:

val m: Map[P, Collection[T]]

这可以通过groupBy轻松实现:

val m: Map[P, Collection[T]] = c.groupBy(t => t.p)

如果你仍然想要原始地图,你可以,例如,将p映射到第一个有它的t

val m: Map[P, T] = c.groupBy(t => t.p) map { case (p, ts) =>  p -> ts.head }
另一答案
c map (_.getP) zip c

运作良好,非常直观

另一答案

对于它的价值,这里有两种无意义的方法:

scala> case class Foo(bar: Int)
defined class Foo

scala> import scalaz._, Scalaz._
import scalaz._
import Scalaz._

scala> val c = Vector(Foo(9), Foo(11))
c: scala.collection.immutable.Vector[Foo] = Vector(Foo(9), Foo(11))

scala> c.map(((_: Foo).bar) &&& identity).toMap
res30: scala.collection.immutable.Map[Int,Foo] = Map(9 -> Foo(9), 11 -> Foo(11))

scala> c.map(((_: Foo).bar) >>= (Pair.apply[Int, Foo] _).curried).toMap
res31: scala.collection.immutable.Map[Int,Foo] = Map(9 -> Foo(9), 11 -> Foo(11))
另一答案

这可能不是将列表转换为映射的最有效方法,但它使调用代码更具可读性。我使用隐式转换将mapBy方法添加到List:

implicit def list2ListWithMapBy[T](list: List[T]): ListWithMapBy[T] = {
  new ListWithMapBy(list)
}

class ListWithMapBy[V](list: List[V]){
  def mapBy[K](keyFunc: V => K) = {
    list.map(a => keyFunc(a) -> a).toMap
  }
}

调用代码示例:

val list = List("A", "AA", "AAA")
list.mapBy(_.length)                  //Map(1 -> A, 2 -> AA, 3 -> AAA)

请注意,由于隐式转换,调用者代码需要导入scala的implicitConversions。

以上是关于Scala将Collection转换为按键映射的最佳方法是什么?的主要内容,如果未能解决你的问题,请参考以下文章

Scala:将 Map 映射到元组列表

WrappedArray$ofRef 不能转换为 scala.collection.immutable.Seq

如何将 scala spark.sql.dataFrame 转换为 Pandas 数据框

row.getList java.lang.ClassCastException:java.math.BigDecimal 不能转换为 scala.collection.Seq

在 Java 代码中从 scala.collection.Seq<String> 转换为 java.util.List<String>

在scala中将Spark Dataframe转换为RDD