如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?
Posted
技术标签:
【中文标题】如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?【英文标题】:How do I make a simple day dimension table for data warehousing star schema with postgresql? 【发布时间】:2020-02-28 00:29:26 【问题描述】:我将如何在 postgreSQL 中为星型模式创建和填充简单的 DAY 维度表? 这是一个数据仓库的入门课程,所以它只有几个领域,但大多数在线示例都非常复杂,对于初学者来说似乎非常复杂。这不是为了作业 - 这是为了学习,因为我正在尝试使用事实表制作我自己的简单星型模式,以便我可以开始熟悉它。
谁能给我一个简单的例子,说明我如何用几个字段创建表(day_key 作为代理键,一个描述日期的字符串,以及一些表示天或月的整数值)所以我至少可以开始了解吗?
【问题讨论】:
【参考方案1】:一个非常简单的 DAY 维度表,应该适用于大多数版本的 PostgreSQL(我使用的是 10.5)。这应该可以帮助刚接触数据仓库的人制定一个基本的日常维度,以便在刚开始使用时使用。
创建日程表
CREATE TABLE day (
day_key SERIAL PRIMARY KEY, -- SERIAL is an integer that will auto-increment as new rows added
description VARCHAR(40), -- a 'string' for a description
full_date DATE, -- an actual date type
month_number INTEGER,
month_name VARCHAR(40),
year INTEGER
);
在 Day 维度中插入行
INSERT INTO day(description, full_date, month_number, month_name, year)
SELECT
to_char(days.d, 'FMMonth DD, YYYY'),
days.d::DATE,
to_char(days.d, 'MM')::integer,
to_char(days.d, 'FMMonth'),
to_char(days.d, 'YYYY')::integer
from (
SELECT generate_series(
('2019-01-01')::date, -- 'start' date
('2019-12-31')::date, -- 'end' date
interval '1 day' -- one for each day between the start and day
)) as days(d);
结果
注意事项:
基本上,您只是使用嵌套SELECT generate_series(...
生成的行插入到 Day 表中。
我两次使用上述FM
来删除在某些日期格式中自动生成的一些空白填充。
我建议您在第一次执行此操作时删除 INSERT INTO day(...)
行,以确保每列的格式与您在将其插入表之前的格式一致。
这正是我所看到的常用的——查看 PostgreSQL 文档有一些更彻底和更好的examples 更多方法来格式化日期类型并获得各种有用的维度。
【讨论】:
以上是关于如何使用 postgresql 为数据仓库星型模式制作简单的日维度表?的主要内容,如果未能解决你的问题,请参考以下文章