填充事实表(数据仓库)和查询
Posted
技术标签:
【中文标题】填充事实表(数据仓库)和查询【英文标题】:Populating Fact Tables(Data Warehouse) and Querying 【发布时间】:2021-02-01 21:38:48 【问题描述】:我不确定如何查询我的事实表(covid 和疫苗接种),我用虚拟数据填充了维度,我应该将事实表留空吗?据我所知,当我编写查询时,它们会被填充。
我不确定如何查询我尝试过不同方法的表,但我得到一个空结果。 下面是架构的链接。 我想找出每个“应变”(我的应变表总共有 3 个应变)引起的去年的“TotalDeathsUK”(事实表 COVID)。
【问题讨论】:
如果您编写 查询(即select
),它将不会填充任何表,因此您的空结果是正确的。您必须使用 INSERT
或类似名称来填充表格。
【参考方案1】:
您可以使用MERGE 填充您的事实表COVIDFact
:
MERGE
INTO factcovid
using (
SELECT centerid,
dateid,
patientid,
strainid
FROM yourstagingfacttable ) AS f
ON factcovid.centerid = f.centerid AND factcovid.dateid=f.dateid... //the join columns
WHEN matched THEN
do nothing WHEN NOT matched THEN
INSERT VALUES
(
f.centerid,
f.dateid,
f.patientid,
f.strainid
)
对于VaccinationsFact
:
MERGE
INTO vaccinations
using (
SELECT centerid,
dateid,
patientid,
vaccineid
FROM yourstagingfacttable ) AS f
ON factcovid.centerid = f.centerid //join condition(s)
WHEN matched THEN
do nothing WHEN NOT matched THEN
INSERT VALUES
(
f.centerid,
f.dateid,
f.patientid,
f.vaccineid
)
对于TotalDeathUK
度量:
SELECT S.[Name] AS Strain, COUNT(CF.PatientID) AS [Count of Deaths] FROM CovidFact AS CF
LEFT JOIN Strain AS S ON S.StrainID=CF.StrainID
LEFT JOIN Time AS T ON CF.DateID=T.DateID
LEFT JOIN TreatmentCenter AS TR ON TR.CenterID=CF.CenterID
LEFT JOIN City AS C ON C.CityID = TR.CityID
WHERE C.Country LIKE 'UK' AND T.Year=2020
AND Result LIKE 'Death' // you should add a Result column to check if the Patient survived or died
GROUP BY S.[Name]
【讨论】:
以上是关于填充事实表(数据仓库)和查询的主要内容,如果未能解决你的问题,请参考以下文章