google三驾马车

Posted 豆芽的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了google三驾马车相关的知识,希望对你有一定的参考价值。

⒈GFS(Google File System)。一个分布式文件系统,隐藏下层负载均衡冗余复制等细节,对上层程序提供一个统一的文件系统API接口。Google根据自己的需求对它进行了特别优化,包括:超大文件的访问,读操作比例远超过写操作,PC机极易发生故障造成节点失效等。GFS把文件分成64MB的块,分布在集群的机器上,使用Linux的文件系统存放。同时每块文件至少有3份以上的冗余。中心是一个Master节点,根据文件索引,找寻文件块。详见Google的工程师发布的GFS论文。
 
 
⒉MapReduce。Google发现大多数分布式运算可以抽象为MapReduce操作。Map是把输入Input分解成中间的Key/Value对,Reduce把Key/Value合成最终输出Output。这两个函数由程序员提供给系统,下层设施把Map和Reduce操作分布在集群上运行,并把结果存储在GFS上。
 
 
⒊BigTable。一个大型的分布式数据库,这个数据库不是关系式的数据库。像它的名字一样,就是一个巨大的表格,用来存储结构化的数据。

以上是关于google三驾马车的主要内容,如果未能解决你的问题,请参考以下文章

大数据的那些事:三驾马车之坑人的MapReduce

一文让您全面了解Hadoop生态体系结构

缘起:BigTable

初识Hadoop架构

Google 引爆大数据时代的三篇论文-《GFS》《BigTable》《MapReduce》

Google 引爆大数据时代的三篇论文-《GFS》《BigTable》《MapReduce》