如何用 Pentaho Kettle 填充我的事实表

Posted

技术标签:

【中文标题】如何用 Pentaho Kettle 填充我的事实表【英文标题】:How to populate my fact table with Pentaho Kettle 【发布时间】:2015-07-20 14:01:36 【问题描述】:

我想使用 PDI 将包含许多列的 csv 文件中的数据加载到我在 SQL Server 上设计和实现的数据集市中,但我不知道如何将维度的外键加载到我的事实表中,你能告诉我如何实现我的目标吗?

这是我的数据集市的星型模式:

包含原始数据的csv文件是由除了主键之外的所有维度的列一起组成的,并且包含在fact : handling_time中的列也存在于csv文件中。

【问题讨论】:

【参考方案1】:

你找到答案了吗?此任务是数据仓库中必不可少的常见任务之一,它适用于您使用的每个工具,推荐的方法是使用“查找”,您可以对数据源中的每个事务执行查找(键值搜索)到您的维度表,其中键是事务数据源中的标识符,值是维度表中的代理键。

【讨论】:

以上是关于如何用 Pentaho Kettle 填充我的事实表的主要内容,如果未能解决你的问题,请参考以下文章

Pentaho Kettle 是不是创建维度表和事实表

使用 pentaho 数据集成加载事实表

使用 pentaho 数据集成加载事实表 - 减少 ktr 的运行时间

Linux 环境 Pentaho 中缺少步骤插件

Pentaho - 如何根据 Kettle 属性文件设置工作转换

在 Pentaho Kettle 中应用 Pivot