如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?

Posted

技术标签:

【中文标题】如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?【英文标题】:How do I make a simple day dimension table for data warehousing star schema with postgresql? 【发布时间】:2020-02-28 00:29:26 【问题描述】:

我将如何在 postgreSQL 中为星型模式创建和填充简单的 DAY 维度表? 这是一个数据仓库的入门课程,所以它只有几个领域,但大多数在线示例都非常复杂,对于初学者来说似乎非常复杂。这不是为了作业 - 这是为了学习,因为我正在尝试使用事实表制作我自己的简单星型模式,以便我可以开始熟悉它。

谁能给我一个简单的例子,说明我如何用几个字段创建表(day_key 作为代理键,一个描述日期的字符串,以及一些表示天或月的整数值)所以我至少可以开始了解吗?

【问题讨论】:

【参考方案1】:

一个非常简单的 DAY 维度表,应该适用于大多数版本的 PostgreSQL(我使用的是 10.5)。这应该可以帮助刚接触数据仓库的人制定一个基本的日常维度,以便在刚开始使用时使用。

创建日程表

CREATE TABLE day (
    day_key SERIAL PRIMARY KEY, -- SERIAL is an integer that will auto-increment as new rows added
    description VARCHAR(40), -- a 'string' for a description
    full_date DATE, -- an actual date type
    month_number INTEGER,
    month_name VARCHAR(40),
    year INTEGER
);

在 Day 维度中插入行

INSERT INTO day(description, full_date, month_number, month_name, year)
SELECT 
to_char(days.d, 'FMMonth DD, YYYY'), 
days.d::DATE, 
to_char(days.d, 'MM')::integer, 
to_char(days.d, 'FMMonth'), 
to_char(days.d, 'YYYY')::integer 
from (
    SELECT generate_series(
        ('2019-01-01')::date, -- 'start' date
        ('2019-12-31')::date, -- 'end' date
        interval '1 day'  -- one for each day between the start and day
        )) as days(d);

结果

注意事项

基本上,您只是使用嵌套SELECT generate_series(... 生成的行插入到 Day 表中。 我两次使用上述FM 来删除在某些日期格式中自动生成的一些空白填充。 我建议您在第一次执行此操作时删除 INSERT INTO day(...) 行,以确保每列的格式与您在将其插入表之前的格式一致。

这正是我所看到的常用的——查看 PostgreSQL 文档有一些更彻底和更好的examples 更多方法来格式化日期类型并获得各种有用的维度。

【讨论】:

以上是关于如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?的主要内容,如果未能解决你的问题,请参考以下文章

使用星型模式数据仓库进行报告与分析

数据仓库星型模式的维度表和事实表中的数据如何?

Postgresql星型模式透视查询?

大数据仓库还需要星型模式吗?

「数据仓库架构」数据仓库的三种模式建模技术

将非星型模式数据库转换为星型模式数据库