Spark记录-Scala数据类型

Posted 信方互联网硬汉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark记录-Scala数据类型相关的知识,希望对你有一定的参考价值。

Scala与Java具有相同的数据类型,具有相同的内存占用和精度。以下是提供Scala中可用的所有数据类型的详细信息的表格:

序号数据类型说明
1 Byte 8位有符号值,范围从-128127
2 Short 16位有符号值,范围从-3276832767
3 Int 32位有符号值,范围从-21474836482147483647
4 Long 64位有符号值,范围从-92233720368547758089223372036854775807
5 Float 32位IEEE 754单精度浮点值
6 Double 64位IEEE 754双精度浮点值
7 Char 16位无符号Unicode字符。范围从U+0000U+FFFF
8 String 一个Char类型序列
9 Boolean 文字值true或文字值false
10 Unit 对应于无值
11 Null null或空引用
12 Nothing 每种其他类型的亚型; 不包括无值
13 Any 任何类型的超类型; 任何对象的类型为Any
14 AnyRef 任何引用类型的超类型

上面列出的所有数据类型都是对象。Scala中没有类似Java中那样的原始类型。 这意味着您可以调用IntLong等方法。

Scala基本文字

Scala用于文字的规则是简单直观的,本节介绍所有基本的Scala文字。

集成文字

整数文字通常为Int类型,或Long类型,后跟Ll后缀。这里有一些整数文字 -

0
035
21 
0xFFFFFFFF 
0777L
Shell

浮点文字

浮点文字的类型为Float,后跟浮点类型后缀Ff,否则为Double类型。 这里有一些浮点文字 -

0.0 
1e30f 
3.14159f 
1.0e100
.1
Shell

布尔文字

布尔文字:truefalseBoolean类型的成员。

符号文字

符号文字‘x是表达式scala.Symbol(“x”)的缩写。符号是一个case类,其定义如下 -

ackage scala
final case class Symbol private (name: String) {
   override def toString: String = "‘" + name
}
Scala

字符文字

字符文字是用引号括起来的单个字符。字符是可打印的Unicode字符或由转义序列描述。 这里有一些字符文字 -

‘a‘ 
‘\u0041‘
‘\n‘
‘\t‘
Shell

字符串文字

字符串文字是双引号中的一系列字符。字符是可打印的Unicode字符或由转义序列描述。 这里有一些字符串文字 -

"Hello,\nWorld!"
"This string contains a \" character."
Shell

多行字符串

多行字符串文字是用三个引号""" ... """括起来的一系列字符。字符序列是任意的,除了它最终可能包含三个或更多个连续的引号。

字符不一定是可打印的; 换行符或其他控制字符也是允许的。这是一个多行字符串文字 -

"""the present string
spans three
lines."""
Scala

Null值

null值的类型为scala.Null,因此与每个引用类型兼容。它表示引用一个特殊的“null”对象的参考值。

转义序列

以下转义序列在字符和字符串文字中被识别。

Unicode为0255之间的字符也可以用八进制转义来表示,即反斜杠“\”后面是一个最多三个八进制字符的序列。以下是显示几个转义序列字符的示例 -

示例

object Test {
   def main(args: Array[String]) {
      println("Hello\tWorld\n\n" );
   }
}
Scala

当上述代码被编译和执行时,它产生以下结果 -

Hello   World

以上是关于Spark记录-Scala数据类型的主要内容,如果未能解决你的问题,请参考以下文章

如何在Spark Scala中以CSV格式编写不同的布局

Scala 中的 Apache Spark 日志记录

在索引 spark-shell/scala 处更改 Array[StructField] 中的数据类型

Spark数据集和scala.ScalaReflectionException:类型V不是类

通过读取具有不同数据类型的 Scala 序列来创建 Spark 数据帧

Spark记录-Scala字符串