数据仓库与数据挖掘

Posted 莫青铜

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库与数据挖掘相关的知识,希望对你有一定的参考价值。

1、简述数据仓库的设计步骤。

数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。

 

2、简述星型模式和雪花模式的区别。

一个事实、一组维表

一个事实、维表接维表

 

3、数据仓库三种模式之间的关系。

星型、雪花、星座

 

4、在设计数据仓库时,为什么确定事实表的粒度非常重要?

事实与粒度相匹配。

 

5、以下关于数据粒度的叙述中哪些是错误。

(1)粒度是指数据仓库小数据单元的详细程度和级别。

(2)数据越详细,粒度就越小,抽象级别也就越高。

(3)数据综合度越高,粒度就越大,抽象级别也就越高。

(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

 

6、以下关于数据仓库开发特点的叙述中哪些是错误的。

(1)数据仓库开发要从数据出发。

业务需求

(2)数据仓库使用的需求在开发出来后才会明确。

先明确,再开发。设计时要能够应对未来的变化。

(3)数据仓库开发一个不断循环的过程。

(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。

7、以下关于数据仓库设计的说法中哪些是正确的。

(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。

(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。

(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。

(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。

8、维表中维有哪些类型?

结构维、信息维、分区维、分类维、退化维、一致维、父子维

 

9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?

多级汇总、深入洞察、不同用户不同维、灵活

10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?

节省I/O开销

 

思考:

1、源变化。

急:先处理、再分责

 

2、bottom-up/top-down

top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。

周期长、见效慢;风险高。

bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。

数据逐步清洗提炼。

以上是关于数据仓库与数据挖掘的主要内容,如果未能解决你的问题,请参考以下文章

争议 | 数据仓库的融合:实时数据仓库与历史数据仓库,应统一建模还是分开建模?

数据仓库与操作数据库有何联系和区别?

数据库与数据仓库的区别

笔记数据仓库与数据挖掘数据仓库与联机分析处理

数据仓库DM DW OLAP之间的联系与区别

数据仓库系列数据仓库的特点与架构分类--数仓与数据库究竟有什么区别??