星型模式 - 外部标识符事实或维度?

Posted

技术标签:

【中文标题】星型模式 - 外部标识符事实或维度?【英文标题】:Star Schema - External Identifier fact or dimension? 【发布时间】:2016-08-11 08:57:48 【问题描述】:

这是我在星型架构设计中遇到的一个问题。

概述是我们跟踪嵌入了全球唯一标识符(标签)的包裹。这些标签中的每一个都会创建一系列按时间顺序排列的事件。我认为事件是事实,并将连续变量值作为事实表中的列。尺寸类似于包装类型。

我不确定标签标识符是应该在维度中还是直接在事实表中。我们目前正在跟踪超过 500 万个唯一标签。

这么大的尺寸可取吗?

【问题讨论】:

如果标签标识符是识别包的主要业务关键,它应该保留在事实表中。 【参考方案1】:

这是一个退化维度,您应该将此列保留在事实表中。

http://www.kimballgroup.com/data-warehouse-business-intelligence-resources/kimball-techniques/dimensional-modeling-techniques/degenerate-dimension/ http://www.kimballgroup.com/2003/06/design-tip-46-another-look-at-degenerate-dimensions/

【讨论】:

以上是关于星型模式 - 外部标识符事实或维度?的主要内容,如果未能解决你的问题,请参考以下文章

使用 Python 从 csv 文件创建星型模式

在星型模式中,事实和维度之间的外键约束是不是必要?

星型架构[事实 1:n 维度]...如何?

数据仓库星型模式的维度表和事实表中的数据如何?

星型架构[事实 1:n 维度]...怎么样?

从单个 csv 文件在 Hadoop Hive 中创建星型模式(维度和事实表)