有关OLAP的一些概念

Posted 圆善的学习园地

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有关OLAP的一些概念相关的知识,希望对你有一定的参考价值。

 

MR引擎:

MapReduce:是一种离线计算框架,将一个算法抽象成Map和Reduce两个阶段进行处理,每个阶段都是用键值对(key/value)作为输入和输出,非常适合数据密集型计算。Map/Reduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节点会周期性地返回它所完成的工作和最新的状态。如果一个节点在设定的时间内没有进行心跳上报,主节点(可以理解为主服务器)就会认为这个节点down掉了,此时就会把分配给这个节点的数据发到别的节点上运算,这样可以保证系统的高可用性和稳定性。因此它是一个很好的计算框架。

TEZ引擎:是基于Hadoop YARN之上的DAG(有向无环图,Directed Acyclic Graph)计算框架。核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output等。这样,这些分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些控制程序组装后,可形成一个大的DAG作业,从而可以减少Map/Reduce之间的文件存储,同时合理组合其子过程,也可以减少任务的运行时间,具体运行过程如下所示:

技术分享

参考资料:

http://www.sohu.com/a/131167936_465944  

以上是关于有关OLAP的一些概念的主要内容,如果未能解决你的问题,请参考以下文章

OLAP、OLTP、数据仓库、分析、分析和数据挖掘如何相关?

有关部署的一些概念

OLAP实践 —— OLAP基本概念理解总计小记

秒懂数据统计数据挖掘大数据OLAP的区别

大数据Kylin:基础概念和Kylin简介

AIX:物理卷及有关概念