某互联网金融公司离线数仓变迁

Posted 光于前裕于后

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了某互联网金融公司离线数仓变迁相关的知识,希望对你有一定的参考价值。

本篇是数仓专栏的第一篇文章,一直想开个数仓专栏,但怕自己认知不够,误导了读者。
目前本人有了一点积累,但也比较浅显,权当记笔记了,欢迎大家批评指正~


本篇简单描述一下我们公司离线数仓各版本的特点和问题


这个xx(请付广告费)可以一键转思维导图

还有多种模板

离线数仓1.0
特点:全部全量快照表
问题:存储 计算压力

离线数仓2.0
特点:按表类型划分为增量表、拉链表和全量快照表,每一层动态加载
问题:新业务需求来的急且快,从ODS层向上一层层建设过于缓慢

数据湖
特点:读时模式 数据使用时定义模型结构(Schema)
问题:对团队code能力有一定要求

以上是关于某互联网金融公司离线数仓变迁的主要内容,如果未能解决你的问题,请参考以下文章

美团外卖离线数仓建设实践

Flink CDC 系列 - Flink MongoDB CDC 在 XTransfer 的生产实践

离线数仓之数据监控-Prometheus

离线数仓:什么是数据仓库

离线数仓和实时数仓的区别

使用 Docker 搭建离线数仓环境