[hadoop读书笔记] 第四章 Hadoop I/O操作

Posted Aviva_ye

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[hadoop读书笔记] 第四章 Hadoop I/O操作相关的知识,希望对你有一定的参考价值。

 

P92 压缩

 

 

 

 

 

P102 序列化

序列化:将结构化对象转为字节流便于在网上传输或写到磁盘进行永久性存储的过程

用于进程之间的通信或者数据的永久存储

反序列化:将字节流转为结构化对象的逆过程

Hadoop中的序列化:在Hadoop中,系统中多个节点上进程间的通信是通过远程过程传输RPC来实现的。

RPC协议将消息序列化成二进制流后发送到远程节点,远程节点接着将二进制流反序列化成原始信息。

 

Avro:一个独立于编程语言,并基于 IDL的序列化框架,非常适合用于Hadoop的大规模数据处理

 

以上是关于[hadoop读书笔记] 第四章 Hadoop I/O操作的主要内容,如果未能解决你的问题,请参考以下文章

[hadoop读书笔记] 第一章 初识 Hadoop

[hadoop读书笔记] Hadoop下各技术应用场景

《Hadoop金融大数据分析》读书笔记

[hadoop读书笔记] 第三章 HDFS

《写给大忙人的hadoop2》读书笔记大数据定义

hadoop大数据分析与挖掘实战(读书笔记1)