2021年大数据常用语言Scala(十六):基础语法学习 列表 List 重点掌握

Posted Lansonli

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2021年大数据常用语言Scala(十六):基础语法学习 列表 List 重点掌握相关的知识,希望对你有一定的参考价值。

目录

列表 List 重点掌握

不可变列表定义

可变列表

列表常用操作


列表 List 重点掌握

列表是scala中最重要的、也是最常用的数据结构。List具备以下性质:

  • 可以保存重复的值
  • 有先后顺序

在scala中,也有两种列表,一种是不可变列表、另一种是可变列表

 

不可变列表定义

不可变列表就是列表的元素、长度都是不可变的。

语法

使用List(元素1, 元素2, 元素3, ...)来创建一个不可变列表,语法格式:

val/var 变量名 = List(元素1, 元素2, 元素3...)

使用Nil创建一个不可变的空列表

val/var 变量名 = Nil

使用::方法创建一个不可变列表

val/var 变量名 = 元素1 :: 元素2 :: Nil

[!TIP]

使用::拼接方式来创建列表,必须在最后添加一个Nil

示例一

创建一个不可变列表,存放以下几个元素(1,2,3,4)

参考代码

scala> val a = List(1,2,3,4)
a: List[Int] = List(1, 2, 3, 4)

 

示例二

使用Nil创建一个不可变的空列表

 

参考代码

scala> val a = Nil
a: scala.collection.immutable.Nil.type = List()

 

示例三

使用::方法创建列表,包含-2、-1两个元素

 

参考代码

scala> val a = -2 :: -1 :: Nil
a: List[Int] = List(-2, -1)

可变列表

可变列表就是列表的元素、长度都是可变的。

要使用可变列表,先要导入import scala.collection.mutable.ListBuffer

 

[!NOTE]

  • 可变集合都在mutable包中
  • 不可变集合都在immutable包中(默认导入)

 

定义

使用ListBuffer[元素类型]()创建空的可变列表,语法结构:

val/var 变量名 = ListBuffer[Int]()

使用ListBuffer(元素1, 元素2, 元素3...)创建可变列表,语法结构:

val/var 变量名 = ListBuffer(元素1,元素2,元素3...)

 

示例一

创建空的整形可变列表

 

参考代码

  scala> val a = ListBuffer[Int]()
  a: scala.collection.mutable.ListBuffer[Int] = ListBuffer()

 

示例二

创建一个可变列表,包含以下元素:1,2,3,4

 

参考代码

scala> val a = ListBuffer(1,2,3,4)
a: scala.collection.mutable.ListBuffer[Int] = ListBuffer(1, 2, 3, 4)

 

可变列表操作

  • 获取元素(使用括号访问(索引值))
  • 添加元素(+=)
  • 追加一个列表(++=)
  • 更改元素(使用括号获取元素,然后进行赋值)
  • 删除元素(-=)
  • 转换为List(toList)转换为不可变列表
  • 转换为Array(toArray)转换为定长数组

说一下,

定长数组Array 长度固定, 元素可变

不可变List, 长度固定, 元素不可变

大家不要记混淆了, 怎么记呢, 看名字

定长数组, 就是只是固定长度, 元素可变

不可变List, 不可变了就是都不可变了

 

可变列表示例

定义一个可变列表包含以下元素:1,2,3

获取第一个元素

添加一个新的元素:4

追加一个列表,该列表包含以下元素:5,6,7

删除元素7

将可变列表转换为不可变列表

将可变列表转换为数组

 

参考代码

// 导入不可变列表
scala> import scala.collection.mutable.ListBuffer
import scala.collection.mutable.ListBuffer

// 创建不可变列表
scala> val a = ListBuffer(1,2,3)
a: scala.collection.mutable.ListBuffer[Int] = ListBuffer(1, 2, 3)

// 获取第一个元素
scala> a(0)
res19: Int = 1

// 追加一个元素
scala> a += 4
res20: a.type = ListBuffer(1, 2, 3, 4)

// 追加一个列表
scala> a ++= List(5,6,7)
res21: a.type = ListBuffer(1, 2, 3, 4, 5, 6, 7)

// 删除元素
scala> a -= 7
res22: a.type = ListBuffer(1, 2, 3, 4, 5, 6)

// 转换为不可变列表
scala> a.toList
res23: List[Int] = List(1, 2, 3, 4, 5, 6)

// 转换为数组
scala> a.toArray
res24: Array[Int] = Array(1, 2, 3, 4, 5, 6)

 

列表常用操作

以下是列表常用的操作

  • 判断列表是否为空(isEmpty)
  • 拼接两个列表(++)
  • 获取列表的首个元素(head)和剩余部分(tail)
  • 反转列表(reverse)
  • 获取前缀(take)、获取后缀(drop)
  • 扁平化(flaten)
  • 拉链(zip)和拉开(unzip)
  • 转换字符串(toString)
  • 生成字符串(mkString)
  • 并集(union)
  • 交集(intersect)
  • 差集(diff)

判断列表是否为空

示例

  • 定义一个列表,包含以下元素:1,2,3,4
  • 使用isEmpty判断列表是否为空

参考代码

scala> val a = List(1,2,3,4)
a: List[Int] = List(1, 2, 3, 4)

scala> a.isEmpty
res51: Boolean = false

 

拼接两个列表

示例

  • 有两个列表,分别包含以下元素1,2,3和4,5,6
  • 使用++将两个列表拼接起来

和 ++= 不同的是, ++= 是 追加, 也就是 将一个追加到另一个

++ 是两个串联在一起 形成一个新的, 这个概念不要混淆

如 a ++= b, 最终是a 变化了 加长了

a ++ b 执行完后, a b 均不变, 但结果是a和b的串联, 需要用变量接收

参考代码

scala> val a = List(1,2,3)
a: List[Int] = List(1, 2, 3)

scala> val b = List(4,5,6)
b: List[Int] = List(4, 5, 6)

scala> a ++ b
res52: List[Int] = List(1, 2, 3, 4, 5, 6)

 

获取列表的首个元素和剩余部分

示例

  • 定义一个列表,包含以下几个元素:1,2,3
  • 使用head方法,获取列表的首个元素(返回值是单个元素)
  • 使用tail方法,获取除第一个元素以外的元素,它也是一个列表(返回值是剩余元素列表)

参考代码

scala> val a = List(1,2,3)
a: List[Int] = List(1, 2, 3)

scala> a.head
res4: Int = 1

scala> a.tail
res5: List[Int] = List(2, 3)

 

反转列表

示例

  • 定一个列表,包含以下元素:1,2,3
  • 使用reverse方法将列表的元素反转

注意, 列表本身不会变, 只是生成了一个新结果, 需要被变量接收

scala> val a = List(1,2,3)
a: List[Int] = List(1, 2, 3)

scala> a.reverse
res6: List[Int] = List(3, 2, 1)

 

获取列表前缀和后缀

示例

  • 定义一个列表,包含以下元素:1,2,3,4,5
  • 使用take方法获取前缀(前三个元素):1,2, 3(返回的也是列表)
  • 使用drop方法获取后缀(除前三个以外的元素):4,5(返回的也是列表)

是不是和head 和tail 很像?

我们可以认为head 就是take(1)然后取出值(因为head返回是单个元素, take返回list)

tail 就是 drop(1)

参考代码

scala> val a = List(1,2,3,4,5)
a: List[Int] = List(1, 2, 3, 4, 5)

scala> a.take(3)
res56: List[Int] = List(1, 2, 3)

scala> a.drop(3)
res60: List[Int] = List(4, 5)

 

扁平化(压平)

扁平化表示将列表中的列表中的所有元素放到一个列表中。

 

 

示例

  • 有一个列表,列表中又包含三个列表,分别为:List(1,2)、List(3)、List(4,5)
  • 使用flatten将这个列表转换为List(1,2,3,4,5)

参考代码

scala> val a = List(List(1,2), List(3), List(4,5))
a: List[List[Int]] = List(List(1, 2), List(3), List(4, 5))

scala> a.flatten
res0: List[Int] = List(1, 2, 3, 4, 5)

 

注意, 一次flatten只能解开一层嵌套

如:

scala> l6
res19: List[List[List[Int]]] = List(List(List(1, 2), List(3, 4)), List(List(5, 6), List(7, 8)))

scala> l6.flatten
res20: List[List[Int]] = List(List(1, 2), List(3, 4), List(5, 6), List(7, 8))

如果要解开两层或者多层嵌套呢?

scala> l6.flatten.flatten
res21: List[Int] = List(1, 2, 3, 4, 5, 6, 7, 8)

注意, 如果元素不均衡, 就不好弄了, 需要手动处理了

scala> val l5 = List(List(1 ,2), List(3 ,4), List(List(5, 6), 7))
l5: List[List[Any]] = List(List(1, 2), List(3, 4), List(List(5, 6), 7))

scala> l5.flatten
res17: List[Any] = List(1, 2, 3, 4, List(5, 6), 7)
// 这里有5, 6没有解开, 但是不能继续串 flatten了, 再串一次, 对5, 6有效 对别的元素无效, 会报错, 如:
scala> l5.flatten.flatten
<console>:13: error: No implicit view available from Any => scala.collection.GenTraversableOnce[B].
 l5.flatten.flatten

所以使用flatten要注意, 数据要规范才可用

也就是说, 目前的flatten方法 适合规范数据, 如果是示例中这样的数据 ,可能需要大家自行实现自己的myFlatten方法啦. 相信大家可以做到的

拉链与拉开

  • 拉链:使用zip将两个列表,组合成一个元素为元组的列表
  • 拉开:将一个包含元组的列表,解开成包含两个列表的元组

 

示例

  • 有两个列表
    • 第一个列表保存三个学生的姓名,分别为:zhangsan、lisi、wangwu
    • 第二个列表保存三个学生的年龄,分别为:19, 20, 21
  • 使用zip操作将两个列表的数据"拉"在一起,形成 zhangsan->19, lisi ->20, wangwu->21

参考代码

scala> val a = List("zhangsan", "lisi", "wangwu")
a: List[String] = List(zhangsan, lisi, wangwu)

scala> val b = List(19, 20, 21)
b: List[Int] = List(19, 20, 21)

scala> a.zip(b)
res1: List[(String, Int)] = List((zhangsan,19), (lisi,20), (wangwu,21))


// 注意: 结果是 List 的元素是一个个元组,  然后一个个元组的内容是两个元素(名字,年龄)

 

示例

  • 将上述包含学生姓名、年龄的元组列表,解开成两个列表

参考代码

scala> res1.unzip
res2: (List[String], List[Int]) = (List(zhangsan, lisi, wangwu),List(19, 20, 21))


// 注意: 结果是 一个 元组 包含了两个元素, 这两个元素分别是两个list ,第一个list存放的字符串, 第二个list存放的int
// 也就是如果想要得到zhangsan   需要这样: res2._1(0)  先取元组的元素1, 然后取元素1的元素1
// 注意角标, 元组从1开始, list从0开始

转换字符串

toString方法可以返回List中的所有元素

 

示例

  • 定义一个列表,包含以下元素:1,2,3,4
  • 使用toString输出该列表的元素

参考代码

scala> val a = List(1,2,3,4)
a: List[Int] = List(1, 2, 3, 4)

scala> println(a.toString)
List(1, 2, 3, 4)

List(1, 2, 3, 4) 整体都是string哦, 并不是只是(1, 2, 3, 4)

 

生成字符串

mkString方法,可以将元素以分隔符拼接起来。默认没有分隔符

 

示例

  • 定义一个列表,包含以下元素1,2,3,4
  • 使用mkString,用冒号将元素都拼接起来

参考代码

scala> val a = List(1,2,3,4)
a: List[Int] = List(1, 2, 3, 4)

scala> a.mkString
res7: String = 1234

scala> a.mkString(":")
res8: String = 1:2:3:4

 

并集

union表示对两个列表取并集,不去重

 

示例

  • 定义第一个列表,包含以下元素:1,2,3,4
  • 定义第二个列表,包含以下元素:3,4,5,6
  • 使用union操作,获取这两个列表的并集(类似拼接)
  • 使用distinct操作,去除重复的元素(list的方法, 去重)

参考代码

scala> val a1 = List(1,2,3,4)
a1: List[Int] = List(1, 2, 3, 4)

scala> val a2 = List(3,4,5,6)
a2: List[Int] = List(3, 4, 5, 6)

// 并集操作
scala> a1.union(a2)
res17: List[Int] = List(1, 2, 3, 4, 3, 4, 5, 6)

// 可以调用distinct去重
scala> a1.union(a2).distinct
res18: List[Int] = List(1, 2, 3, 4, 5, 6)

 

交集

intersect表示对两个列表取交集

取出两个列表中一样的元素

 

示例

  • 定义第一个列表,包含以下元素:1,2,3,4
  • 定义第二个列表,包含以下元素:3,4,5,6
  • 使用intersect操作,获取这两个列表的交集
scala> val a1 = List(1,2,3,4)
a1: List[Int] = List(1, 2, 3, 4)

scala> val a2 = List(3,4,5,6)
a2: List[Int] = List(3, 4, 5, 6)

scala> a1.intersect(a2)
res19: List[Int] = List(3, 4)

 

差集

diff表示对两个列表取差集,例如: a1.diff(a2),表示获取a1在a2中不存在的元素

同理 a2.diff(a1) 就是取 a2 在 a1中不存在的元素. 不要混淆.

 

示例

  • 定义第一个列表,包含以下元素:1,2,3,4
  • 定义第二个列表,包含以下元素:3,4,5,6
  • 使用diff获取这两个列表的差集
scala> val a1 = List(1,2,3,4)
a1: List[Int] = List(1, 2, 3, 4)

scala> val a2 = List(3,4,5,6)
a2: List[Int] = List(3, 4, 5, 6)

scala> a1.diff(a2)
res24: List[Int] = List(1, 2)

 

以上是关于2021年大数据常用语言Scala(十六):基础语法学习 列表 List 重点掌握的主要内容,如果未能解决你的问题,请参考以下文章

2021年大数据常用语言Scala(二十六):函数式编程 分组 groupBy

2021年大数据常用语言Scala:基础语法学习 方法

2021年大数据常用语言Scala:基础语法学习 声明变量

2021年大数据常用语言Scala:基础语法学习 循环

2021年大数据常用语言Scala:基础语法学习 字符串

2021年大数据常用语言Scala:基础语法学习 break和continue