关于数据仓库工程师的一般面试题目

Posted 勿忘初心

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于数据仓库工程师的一般面试题目相关的知识,希望对你有一定的参考价值。

相信会对即将投身于数据仓库事业中的同行们有点帮助!不过这只是针对初级数据仓库工程师的基本问题。

本题只代表自己对数据仓库的肤浅认识,不代表任何公司的面试题目。

对于高级数据仓库工程师的问题更侧重于各种工具的细枝末节。

对于数据仓库架构师的问题更侧重于数据仓库的架构和总体认识。

对于数据仓库项目经理的问题除了以上的问题外,就是一般项目管理的技能了吧。


关于数据仓库部分的面试问题!

什么叫数据仓库?(相信inmon的数据仓库概念的四个特点是最基本的吧,当然需要加上自己的理解)

数据仓库和数据库有什么区别?(事务性数据库和决策支持数据库的区别,当然包括目标、用途、设计等等)

什么叫OLAP?用途是什么?(OLAP指多维数据库了,主要用于多维分析了;包括三种实现方式)

什么叫维度和度量值?(一个是出发点,一个是观察值)

数据仓库的基本架构是什么?(数据源,ETL,data stage,ODS,data warehouse,datamart,OLAP等等,可能为针对每一个结构进行发问啊)

什么叫缓慢维度变化?(为了表现和记录基础数据变化情况在数据仓库中的记录,包括三大类维度处理方式,缓慢变化维包括三小类)

什么叫查找表,为什么使用替代键?(其实目的和上面一样,从基础表到缓慢维度表的过程中的一种实现途径)

如何实现增量抽取?(主要采用时间戳方式,提供数据抽取和处理的性能)

用过什么ETL工具(informatica,ssis,owb,datastage),以及该工具简单讲述特点。

ETL都包括那些组成部分(工作流和数据流,数据流包括若干组件处理ETL的各个环节)

用过什么报表工具(bo,hyperion,congo,reporing servce),以及该工具基本特点。

数据仓库项目最重要或需要注意的是什么,以及如何处理?(一般答数据质量,主要是数据源数据质量分析,数据清洗转换,当然也可以定量分析)


关于数据库部分的面试题(不是要DBA的,但是还是要具备DBA的部分知识结构)

用过什么数据库(SQLServer,Oracle),并能够讲述其物理和逻辑结构,以Oracle为主

能够写基本的SQL语句,分组函数和关联,通常会给几个例子的

如何进行性能优化,只要能答索引的基本原理以及各种索引的区别就行了


事实上数据仓库和DBA或者其他技术不同,没有什么绝对的答案,只要能表达和描述清楚自己的观点就行了


以上是关于关于数据仓库工程师的一般面试题目的主要内容,如果未能解决你的问题,请参考以下文章

关于《数据仓库知识体系》的超全指南(建议收藏)

数据仓库开发工程师面试经典问题及解答

大数据面试题锦集 | 数据仓库工具HIVE篇

橙心优选-数据仓库高级工程师面试

数据仓库与BI面试常见题目

大数据 SQL 题目