如何用 Pentaho Kettle 填充我的事实表
Posted
技术标签:
【中文标题】如何用 Pentaho Kettle 填充我的事实表【英文标题】:How to populate my fact table with Pentaho Kettle 【发布时间】:2015-07-20 14:01:36 【问题描述】:我想使用 PDI 将包含许多列的 csv 文件中的数据加载到我在 SQL Server 上设计和实现的数据集市中,但我不知道如何将维度的外键加载到我的事实表中,你能告诉我如何实现我的目标吗?
这是我的数据集市的星型模式:
包含原始数据的csv文件是由除了主键之外的所有维度的列一起组成的,并且包含在fact : handling_time中的列也存在于csv文件中。
【问题讨论】:
【参考方案1】:你找到答案了吗?此任务是数据仓库中必不可少的常见任务之一,它适用于您使用的每个工具,推荐的方法是使用“查找”,您可以对数据源中的每个事务执行查找(键值搜索)到您的维度表,其中键是事务数据源中的标识符,值是维度表中的代理键。
【讨论】:
以上是关于如何用 Pentaho Kettle 填充我的事实表的主要内容,如果未能解决你的问题,请参考以下文章
使用 pentaho 数据集成加载事实表 - 减少 ktr 的运行时间