Chapter 4. Working with Key/Value Pairs

Posted zhangoliver

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Chapter 4. Working with Key/Value Pairs相关的知识,希望对你有一定的参考价值。

Chapter4 working with key/value pairs

key/values pairs键值对是Spark中非常常见的一种数据类型(type),RDD有时经常操作键值对数据类型。第四章的第一部分内容就是介绍有关键值对的ETL操作:extract,transform,load。第二部分内容介绍的是Spark中的一种高级特征,分布在多个节点nodespairs RDD布局layout:partioning,即分区。使用可控制的分区,可以降低节点间的通信成本,可以是spark的计算速度,这里使用的实例算法就是PageRank。

一、Creating Pair RDDs

 

以上是关于Chapter 4. Working with Key/Value Pairs的主要内容,如果未能解决你的问题,请参考以下文章

Cpp Chapter 11: Working with Classes Part2

Working with Data Sources 4

Working with Excel Files in Python

Spring For Hadoop--Working With HBase

Working with forms

ImageSharp Working with images