数据分析师必备的数据仓库相关知识——Smartbi

Posted Smartbi大数据

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析师必备的数据仓库相关知识——Smartbi相关的知识,希望对你有一定的参考价值。

一、数据仓库是什么?

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

二、数据仓库有哪些特点?

1、效率高

数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。

2、扩展性

之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

3、面向主题

操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。每一个主题对应一个宏观的分析领域。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

4、集成性

面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

5、反映变化

操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

三、数据仓库的一些常见认识误区

1、数据仓库的建设是一次性工程。数据仓库实际上需要每年、每月、每周甚至每日都要进行更新,不是说一次性录入了历史的数据就可以完成的工作。

2、数据仓库是一个很大的仓库。其实衡量一个数据仓库的质量如何,并不是用数据量来衡量的,有一些优质的数据仓库项目,数据量并不是很大。

3、只要数据仓库建立和使用了,问题就解决了。

4、聚焦于内部的档案型数据,而忽视了外部数据以及图象、音频和视频文件的潜在价值。

5、数据仓库是将所有的业务数据存在一起的。数据仓库的一个目标是将分散的业务整合在一起的,但它往往是有目的地按分析需去实施的,并不是将全部的业务数据统统都集成在一起。

以上是关于数据分析师必备的数据仓库相关知识——Smartbi的主要内容,如果未能解决你的问题,请参考以下文章

分析师必备硬技能之数据仓库知识,5分钟帮你理解!

Smartbi研究院分享:数据仓库的五大特点

科技加速,RapidsDB与Smartbi通过双向认证!

Smartbi小麦

必备技能之数据仓库的理解

数据仓库面试知识点