开源大数据:Databricks Lakehouse

Posted ejinxian

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了开源大数据:Databricks Lakehouse相关的知识,希望对你有一定的参考价值。

Lakehouse是一种结合了数据湖和数据仓库优势的新范式,解决了数据湖的局限性。Lakehouse使用新的系统设计:直接在用于数据湖的低成本存储上实现与数据仓库中类似的数据结构和数据管理功能。如果你现在需要重新设计数据仓库,现在有了廉价且高可靠(以对象存储的格式)的存储可用,不妨考虑使用Lakehouse

数据仓库、数据湖以及 data lakehouse 比较

Lakehouse架构

        Lakehouse可定义为基于低成本,可直接访问存储的数据管理系统,该系统还提供传统的分析型DBMS管理和性能功能,例如ACID事务,数据版本,审计,索引,缓存和查询优化

        Lakehouse结合了数据湖和数据仓库的主要优势:开放格式的低成本存储可通过前者的各种系统访问,而后者则具有强大的管理和优化功能

参考

Databricks Lakehouse 官网 

以上是关于开源大数据:Databricks Lakehouse的主要内容,如果未能解决你的问题,请参考以下文章

免费下载!《Databricks数据洞察:从入门到实践》

Spark开源框架精彩学习资源分享——DT大数据梦工厂王家林

大数据架构变革进行时:为什么腾讯看好开源Apache Iceberg?

使用Databricks进行零售业需求预测的应用实践

使用Databricks进行零售业需求预测的应用实践

详谈 Delta Lake 系列技术专题 之 特性(Features)