数据仓库中维度的多个来源

Posted

技术标签:

【中文标题】数据仓库中维度的多个来源【英文标题】:Multiple sources for dimensions in Data Warehouse 【发布时间】:2021-11-15 07:54:00 【问题描述】:

我目前正在研究一个金融风险数据仓库。对于我的附属维度,我正在对来自一个源系统的数据进行排序。然而,经过业务分析师的进一步研究,我们发现了一个遗留应用程序,它还保存了银行在数据仓库中也需要的抵押信息。除了两个源系统共享的一些共同属性之外,遗留应用程序包含的属性比我当前的附带维度中已经定义的属性要多得多。因此,在仓库中加入这些新信息的最佳方式是什么?我正在考虑扩展当前的抵押品维度,但是每次我找到一个新的来源时我都需要这样做,这很可能是考虑到银行的规模。或者,创建一个名为 dimCollat​​eralAdditionalInfo 的新维度并在其中添加额外属性更好吗?

【问题讨论】:

【参考方案1】:

正如我们常说的那样,DWH 模型随着时间的推移而不断演变,因为新的业务需求会随着时间的推移而出现。最重要的是检查新属性是否值得添加以及它们是否呈现分析轴。

您可以将所有信息存储在 dimCollat​​eral 中,并且您需要考虑在优化方面正确管理此维度(索引、数据类型...)

或者您可以创建一个包含附加信息的扩展维度 dimCollat​​eralExtension ,它将与主维度具有一对一的关系 暗淡的抵押品

【讨论】:

我选择了附带扩展维度选项。谢谢

以上是关于数据仓库中维度的多个来源的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库 - 多个部门的重复维度成员

维度建模数据仓库生命周期简介

数据仓库建模

数据仓库中的时间和日期维度

关于数据仓库建模,看这篇文章就够了

数据仓库和数据集市建模体系化总结