SCD 类型 2 的 T-SQL 语法
Posted
技术标签:
【中文标题】SCD 类型 2 的 T-SQL 语法【英文标题】:T-SQL Syntax for SCD Type 2 【发布时间】:2012-02-13 23:52:54 【问题描述】:我目前正在尝试完成将 scd 类型 2 数据加载到维度中的查询的最后一部分。 根据下面提供的数据,我想生成一个可以插入到维度中的输出,除了 过期的旧记录和跟踪历史记录等。数据是这样的,我拥有属性已更改的最新记录。更改的值与 dateOfchange (即更改发生的日期)一起在 Lookup 列中找到。这个 dateOfchange 显然应该成为最新记录的 validTo 日期。
样本数据如下:
CREATE TABLE #tstDimPortfolio
(
[ID][INT] IDENTITY (1,1) NOT NULL,
[UPI] [varchar](20) NOT NULL,
[MF_CODE] [varchar](10) NULL,
[BH_Code] [varchar](10) NULL,
[CR_Code] [varchar](10) NULL,
[ValidFrom][varchar](10) NOT NULL,
[ValidTo][varchar](10) NULL,
[IsCurrent] [CHAR] (1) NULL,
[DateofChange] [varchar](10) NULL,
[LookupMF_CODE] [varchar](10) NULL,
[LookupBH_Code] [varchar](10) NULL,
[LookupCR_Code] [varchar](10) NULL,
)
INSERT INTO #tstDimPortfolio
SELECT 'B06531','B06531','','B06531','20111230',NULL,'Y','20120101','','B06531', ''
UNION ALL
SELECT 'BLI003','','BLI003','BBL_WORLD','20111230',NULL,'Y','20120102','BLI004','', ''UNION ALL
SELECT 'BLI003','','BLI003','BBL_WORLD','20111230',NULL,'Y','20120103','BLI005','', ''UNION ALL
SELECT 'BLI027','BLI027','L147','BBL_GBN','20111230',NULL,'Y','20120104','','L146', ''
有了这个数据,新的输出应该是
UPI MF_CODE BH_Code CR_Code ValidFrom ValidTo IsCurrent
_______________________________________________________________________
B06531 B06531 B06531 20111230 20120101 N
B06531 B06531 B06531 B06531 20120101 NULL Y
BLI003 BLI003 BBL_WORLD 20111230 20120102 N
BLI003 BLI004 BLI003 BBL_WORLD 20120102 20120103 N
BLI003 BLI005 BLI003 BBL_WORLD 20120103 NULL Y
BLI027 BLI027 L147 BBL_GBN 20111230 20120104 N
BLI027 BLI027 L146 BBL_GBN 20120104 NULL Y
任何想法
【问题讨论】:
@Mitch Wheat 首先必须在 t-sql 中完成。我们没有 ssis 的那一刻,它就像通过存储过程所做的那样。我尝试使用以下方法将表连接到自身: @Mitch Wheat 首先必须在 t-sql 中完成。我们没有 ssis 的那一刻,它就像通过存储过程所做的那样。我已经尝试在 upi 和 dateOfchange 当我说“你试过什么?”我的意思是告诉我们你已经写了什么..... 【参考方案1】:我对这张桌子上的自然键是什么感到困惑。是“UPI”吗?如果是这样,您有两条 UPI 相同的记录 (BLI003),但它们都处于活动状态,这绝不应该是这种情况。
无论如何,假设它是 UPI。如果我们要更新 B06531,请将您的更新放入表格中:
CREATE TABLE #tstDimPortfolioUpdates
(
[ID][INT] IDENTITY (1,1) NOT NULL,
[UPI] [varchar](20) NOT NULL,
[MF_CODE] [varchar](10) NULL,
[BH_Code] [varchar](10) NULL,
[CR_Code] [varchar](10) NULL,
[ValidFrom][varchar](20) NOT NULL,
[ValidTo][varchar](15) NULL,
[IsCurrent] [CHAR] (1) NULL,
[DateofChange] [varchar](10) NULL,
[LookupMF_CODE] [varchar](10) NULL,
[LookupBH_Code] [varchar](10) NULL,
[LookupCR_Code] [varchar](10) NULL,
)
INSERT INTO #tstDimPortfolioUpdates
SELECT 'B06531','B06531','B06531','B06531','20120102',NULL,'Y','20120102','','B06531', ''
通过更改 ValidTo、IsCurrent 和 DateOfChange 值来设置不再处于活动状态的任何记录
UPDATE dp
SET ValidTo = '20120101', IsCurrent = 'N', DateOfChange = '20120101'
FROM #tstDimPortfolio dp
INNER JOIN #tstDimPortfolioUpdates up ON dp.UPI = up.UPI
AND dp.IsCurrent = 'Y'
插入新记录
INSERT INTO #tstDimPortfolio (UPI, MF_Code, BH_Code, CR_Code, ValidFrom, ValidTo
,IsCurrent, DateOfChange, LookupMF_Code, LookupBH_Code, LookupCR_Code)
SELECT UPI, MF_Code, BH_Code, CR_Code, ValidFrom, ValidTo
,IsCurrent, DateOfChange, LookupMF_Code, LookupBH_Code, LookupCR_Code
FROM #tstDimPortfolioUpdates
仔细检查更新是否正确
SELECT * FROM #tstDimPortfolio
ORDER BY UPI
【讨论】:
【参考方案2】:我设法使用递归 cte 获得了所需的结果。 UPI 是自然密钥。然而,事件实际上来自一个单独的文件,该文件被旋转并连接到维度上。 (BLI003) 有 2 行,因为它有两个事件。 sql如下:
CREATE TABLE #tstDimPortfolio
(
[ID][INT] IDENTITY (1,1) NOT NULL,
[UPI] [varchar](20) NOT NULL,
[MF_CODE] [varchar](10) NULL,
[BH_Code] [varchar](10) NULL,
[CR_Code] [varchar](10) NULL,
[ValidFrom][varchar](10) NOT NULL,
[ValidTo][varchar](10) NULL,
[IsCurrent] [CHAR] (1) NULL,
[DateofChange] [varchar](10) NULL,
[LookupMF_CODE] [varchar](10) NULL,
[LookupBH_Code] [varchar](10) NULL,
[LookupCR_Code] [varchar](10) NULL,
)
INSERT INTO #tstDimPortfolio
SELECT 'B06531','B06531','','B06531','20111230',NULL,'Y','20120101','','B06531', ''UNION ALL
SELECT 'BLI003','','BLI003','BBL_WORLD','20111230',NULL,'Y','20120102','BLI004','', ''UNION ALL
SELECT 'BLI003','','BLI003','BBL_WORLD','20111230',NULL,'Y','20120103','','BLI005', ''UNION ALL
SELECT 'BLI027','BLI027','L147','BBL_GBN','20111230',NULL,'Y','20120104','','L146', ''
SELECT ROW_NUMBER() OVER (PARTITION BY UPI ORDER BY UPI, DateofChange) Sequence,
UPI,
CASE WHEN LookupMF_CODE <> '' THEN LookupMF_CODE ELSE MF_CODE END MF_CODE,
CASE WHEN LookupMF_CODE <> '' THEN LookupBH_Code ELSE BH_Code END BH_Code,
CASE WHEN LookupCR_Code <> '' THEN LookupCR_Code ELSE CR_Code END CR_Code,
ValidFrom, ValidTo, IsCurrent, DateofChange,
LookupMF_CODE,
LookupBH_CODE,
LookupCR_CODE
INTO #Dimension_Table
FROM #tstDimPortfolio
;WITH AddedDim AS
(SELECT * FROM
(
SELECT
ROW_NUMBER() OVER (PARTITION BY UPI ORDER BY UPI, DateofChange) Sequence,
UPI,
CASE WHEN LookupMF_CODE <> '' THEN LookupMF_CODE ELSE MF_CODE END MF_CODE,
CASE WHEN LookupBH_CODE <> '' THEN LookupBH_Code ELSE BH_Code END BH_Code,
CASE WHEN LookupCR_Code <> '' THEN LookupCR_Code ELSE CR_Code END CR_Code,
DateofChange AS ValidFrom,
ValidTo,
IsCurrent
FROM #tstDimPortfolio
)A
WHERE SEQUENCE = 1
UNION ALL
SELECT
DT.Sequence
, DT.UPI
,CASE WHEN DT.LookupMF_CODE <> '' THEN DT.LookupMF_CODE ELSE DM.MF_CODE END MF_CODE
,CASE WHEN DT.LookupBH_CODE <> '' THEN DT.LookupBH_Code ELSE DM.BH_Code END BH_Code
,CASE WHEN DT.LookupCR_Code <> '' THEN DT.LookupCR_Code ELSE DM.CR_Code END CR_Code
,DT.DateofChange AS ValidFrom
,DT.ValidTo
,DT.IsCurrent
FROM #Dimension_Table dt inner join
AddedDim dm
on DT.UPI = DM.UPI
AND dt.Sequence = DM.Sequence + 1
)
选择 * 进入#temp 来自AddedDim
【讨论】:
以上是关于SCD 类型 2 的 T-SQL 语法的主要内容,如果未能解决你的问题,请参考以下文章