开源大数据:Databricks Lakehouse
Posted ejinxian
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了开源大数据:Databricks Lakehouse相关的知识,希望对你有一定的参考价值。
Lakehouse是一种结合了数据湖和数据仓库优势的新范式,解决了数据湖的局限性。Lakehouse使用新的系统设计:直接在用于数据湖的低成本存储上实现与数据仓库中类似的数据结构和数据管理功能。如果你现在需要重新设计数据仓库,现在有了廉价且高可靠(以对象存储的格式)的存储可用,不妨考虑使用Lakehouse
数据仓库、数据湖以及 data lakehouse 比较
Lakehouse架构
Lakehouse可定义为基于低成本,可直接访问存储的数据管理系统,该系统还提供传统的分析型DBMS管理和性能功能,例如ACID事务,数据版本,审计,索引,缓存和查询优化
Lakehouse结合了数据湖和数据仓库的主要优势:开放格式的低成本存储可通过前者的各种系统访问,而后者则具有强大的管理和优化功能
参考
以上是关于开源大数据:Databricks Lakehouse的主要内容,如果未能解决你的问题,请参考以下文章
Spark开源框架精彩学习资源分享——DT大数据梦工厂王家林