代理键作为维度的属性

Posted

技术标签:

【中文标题】代理键作为维度的属性【英文标题】:Surrogate Key as a attribute of a Dimension 【发布时间】:2014-05-30 16:49:11 【问题描述】:

在数据建模中,一个维度是否可以接受另一个维度的代理键作为属性,还是应该始终作为业务键?

我有一个项目维度,它有一个部门编号作为属性。我也有一个部门维度。 Item Dimension 是否可以将 SK 保存到 Department Dimension 或仅保存业务 key?

【问题讨论】:

【参考方案1】:

通常您会避免在表中同时使用自然键和代理键作为外键,因为这是多余的并且可能导致数据不一致。示例:有人更新了自然键并忘记更新代理键。

但是,在您标记请求的数据仓库中,冗余并不是一个问题。通常有一个带有大量插入、更新和删除的事务处理系统,然后是数据仓库。数据仓库从处理系统中获得了所有数据的精美排列,并且没有上面提到的更新。如果数据是冗余的,谁在乎?它简化了数据访问。您甚至可以将员工-部门联接存储为一个表,其中所有部门数据都是冗余的。数据仓库就是要轻松快速地访问数据,从而使报告变得更容易。冗余外键在数据仓库中没有问题。

【讨论】:

以上是关于代理键作为维度的属性的主要内容,如果未能解决你的问题,请参考以下文章

数仓中指标-标签,维度-度量,自然键-代理键等各名词深度解析

数仓中指标-标签,维度-度量,自然键-代理键等各名词深度解析

OLAP:为啥事实表和维度表之间的所有外键都应该是代理键?

维度建模:如何创建没有代理主键的表?

代理键是如何在 hive 中处理的

查找代理键和填充事实表