数据仓库暗表中的选项维度信息

Posted

技术标签:

【中文标题】数据仓库暗表中的选项维度信息【英文标题】:Option Dimensional Information in Data Warehouse Dim Tables 【发布时间】:2016-08-03 15:42:16 【问题描述】:

我正在创建一个数据仓库并遇到了一个有趣的问题...

我有 DimQualification 和 DimUnit 表。单位是资格的一部分。

但是有些单位是可选的。在说明 DimUnit 表中的所有可用单位时,我对如何最好地向客户展示选择感到困惑。

FactAttendance - 出勤率

最好在事实表中放置多行(资格和单位)还是有其他选择?

【问题讨论】:

你是说 FactAttendance 是 1 to Many DimQualification 是 1 to Many DimUnit 吗?如果是这样,我认为您必须在事实考勤中拥有多条记录。或者,如果有那么多列的 Max number of Qualification,我更喜欢第一个。 没错,一个人可以做多个资质,一个资质是由多个单元组成的。我以为会是这种情况,但最好检查一下。谢谢福尔摩斯四世 有多少单位可供选择? 【参考方案1】:

除了在事实表中放置多行之外,另一种选择是在事实表中为每个事实设置一行,为每个单元设置一个单独的列。该列将是与该事实相关联的该单元的数量的计数。像这样的:

FactID  Unit1Count  Unit2Count  Unit3Count ...

【讨论】:

【参考方案2】:

我现在已经看了一些东西,并决定有一种方法可以实现这一点,而不会降低事实表中的多行所创建的速度。

我将创建另一个事实表来保存从 FactAttendance 表中选择的所有单元,而不是为每个单元创建多行,我们可以立即有效地识别选择的单元。

【讨论】:

以上是关于数据仓库暗表中的选项维度信息的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库星型模式的维度表和事实表中的数据如何?

数据仓库中的低基数维度

聊聊数据仓库中的缓慢变化维度(SCD)

使用触发器链接到数据仓库中事实表中的时间维度是个好主意吗?

Hadoop之数据仓库设计

Hadoop之数据仓库设计