数据湖:各模块组件

Posted YoungerChina

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据湖:各模块组件相关的知识,希望对你有一定的参考价值。

        主要基于对现阶段一些常用的大数据开源框架技术的整理,只是一些简单的介绍,并不是详细技术梳理。可能会有疏漏,发现再整理。参考的太多,就不一一列出来了。这只是作为一个梳理,对以后选型或者扩展的做个参考。

系统平台 (HadoopCDHHDP

监控管理 (CMHueAmbariDr.ElephantGangliaZabbixEagle

文件系统 (HDFSGPFSCephGlusterFSSwift BeeGFSAlluxio

资源调度 (YARNMesos、)

协调框架 (ZooKeeper EtcdConsul

数据存储 (HBaseCassandraScyllaDB MongoDBAccumulo Redis IgniteArrow GeodeCouchDBKuduCarbonData

数据处理 (MapReduceSparkFlinkStormTezSamzaApexBeamHeron

查询分析(HiveSparkSQLPrestoKylinImpalaDruidElasticSearchHAWQLuceneSolrPhoenix

数据收集 (FlumeFilebeatLogstashChukwa

数据交换 (Sqoop KettleDataX NiFi

消息系统 (PulsarKafkaRocketMQActiveMQRabbitMQ

任务调度 (AzkabanOozieAirflow

数据治理 (Ranger SentryAtlas) 可视化 (Kibana D3.jsECharts

数据挖掘 (Mahout MADlib Spark MLTensorFlowKeras

云平台 (Amazon S3GCPMicrosoft Azure

以上是关于数据湖:各模块组件的主要内容,如果未能解决你的问题,请参考以下文章

数据湖:数据湖技术架构演进

数据湖04:数据湖技术架构演进

react生命周期

阿里云贾扬清:数据湖正成为企业数据应用创新标配

最新大厂数据湖面试题,知识点总结

最新大厂数据湖面试题,知识点总结