多维计算分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了多维计算分析相关的知识,希望对你有一定的参考价值。

参考技术A 458.单选题 by 帆软-Royide

FineBI产品定义的数据类型不包含以下哪一种?

包含:文本、数值、时间

459.判断题 by 帆软-Royide

FineBI在实现数据钻取的时候需要预先对数据进行分层处理,否则无法进行数据钻取。(√)

460.单选题 by 帆软-Royide

对于todate()函数表达式的书写,以下哪种写法是正确的?(A)

A.todate("2017-01-01","yyyy-MM-dd")

B.todate(2017-01-01,"yyyy-MM-dd")

C.todate("2017-01-01",yyyy-MM-dd)

D.todate(2017-01-01,yyyy-MM-dd)

461.判断题 by 帆软-Royide

FineBI的数据图表之间可以不通过设置直接自动联动。(√)

462.判断题 by 帆软-Royide

取消勾选二次计算,会先计算再过滤,不对维度过滤结果再计算。(√,选中二次计算时,先过滤再计算。)

463.判断题 by 帆软-Royide

FineBI中的指标如果想进行维度区间/自定义分组,不能直接拖拽到组件区域中,需要先转化为维度方可再进行指标分组。(√)

464.单选题 by 帆软-Royide

对于FineBI中新增表达式if(3==3,1,2),那么最终输出的结果值会是?(1)

465.判断题 by 帆软-Royide

同比环比的快速计算,不会因为时间控件的过滤而导致不在区间内的数据同比环比无法计算.(×)

466.判断题 by 帆软-Royide

假设有一张维度表和一张明细表,维度表中有省份字段,包括北京、江苏、广东;明细表也有省份字段,但是只有江苏和广东,还有销售金额字段。维度表和明细表建立好1:N的关联关系之后,前端分析用汇总表拉取维度表的省份字段,明细表的销售金额字段,那么汇总表格会统计出北京、江苏、广东每个地区的销售金额。(×)

467.判断题 by 帆软-Royide

FineBI中如果想维度旋转操作,需要新建钻取目录,相同钻取层级中的维度方可互相切换旋转。(√)

468.判断题 by 帆软-Royide

FineBI产品在新增公式列的时候,除了使用内置的函数公式之外,还可以支持开发人员调用提供的API接口进行函数自定义。(√)

471.判断题 by 帆软-Royide

文本控件只能放置文本类型的字段进行数据筛选。(×,可以按数值字段,组件,表格等筛选)

472.判断题 by 帆软-Royide

数值类型只能放置数值类型的数据进行筛选。(√)

473.判断题 by 帆软-Royide

时间控件只能放置时间类型的字段进行时间筛选。(√,时间过滤组件为组件类型中的一种,是用于过滤时间的组件,数据来源只能是时间类型。)

474.判断题 by 帆软-Royide

当前维度百分比可以用来计算当前指标在该指标所有值中的占比。(×,在维度汇总中的百分比)

475.判断题 by 帆软-Royide

目前FineBI的跳转功能只能选择固定的字段传递参数,不能通过地址组合参数进行任意传递。(×)

476.单选题 by 帆软-Royide

假设有一张维度表和一张明细表,维度表中有省份字段,包括北京、江苏、广东;明细表也有省份字段,但是只有江苏和安徽,还有销售金额字段。维度表和明细表建立好1:N的关联关系之后,前端分析用汇总表拉取维度表的省份字段,明细表的销售金额字段,那么汇总表格只会统计出哪几个地区的销售金额?(D.江苏)

商务智能数据仓库 ( 多维数据模型 | 多维数据分析 )

商务智能系列文章目录

【商务智能】数据预处理
【商务智能】数据仓库 ( 多维数据模型 | 多维数据分析 )



前言

上一篇博客 【商务智能】数据预处理 中讲解了数据预处理操作 , 本篇博客介绍 数据仓库 , 数据仓库与传统数据库区别 , 多维数据模型 等 ;





一、数据仓库 与 传统数据库 区别


数据仓库特征 :

  • 面向主题
  • 集成
  • 不可更新
  • 随时间不断变化

数据仓库定义 : 数据仓库 是 用于 更好地 支持 企业 / 组织 决策分析处理 , 面向主题的 , 集成的 , 不可更新的 , 随时间不断变化的 数据集合 ;


传统的数据库 又称为 操作型数据库 , 如 Oracle , MySQL 等数据库 ;


操作型数据分析型数据
数据粒度细节的综合的
数据时效存储瞬间准确过去的历史数据
是否只读可更新不可更新
需求可知操作时实现知道需求操作时事先不知道需求
生命周期生命周期符合 SDLC完全不同的生命周期
性能要求性能要求高性能要求低
操作大小同一时刻操作一个单元的数据同一时刻操作一个集合的数据
数据大小单次操作数据量小单次操作数据量大
驱动力量事务驱动分析驱动
具体用途面向应用面向分析
应用场景支持日常操作支持管理需求
数据内容业务相关数据决策相关数据
数据模型关系,层次结构关系, 多维数据结构
数据访问随机读写操作只有查询操作
工作负载事物处理量大, 每个事物涉及记录很少查询小, 每次需要查询大量数据
事务输出很少很大
系统停机灾难性的系统宕机延迟决策




二、数据仓库系统体系结构


数据仓库系统体系结构 :

  • 数据源
  • 集成工具
  • 数据仓库
  • 数据仓库服务器
  • OLAP 服务器
  • 元数据
  • 元数据管理工具
  • 数据集市
  • 前台分析工具




三、多维数据模型


多维数据模型 : 从 业务分析 角度 , 对数据进行 逻辑建模 的方法 ; 具有 简单 , 易于理解 , 方便查询 ;

多维数据模型 又称为 维度数据模型 , 由 维度表 和 事实表 构成 ;


1、星型模式


星型模式 : 中间有一个表 , 称为 事实表 , 周围有很多小表 , 这些表称为 维表 ;


星型模式 缺点 :

① 星型模式 不支持 维 的层结构 ;

  • 单一维表 : 每个 维 只有一个维表 , 所有的 维层属性 都放在一个表中 , 没有进行规范化 ;
  • 单一维表 示例 : 以上述 “商品” 事实表的 时间 对应的维表 为例 , 将 年 , 月 , 日 , 时 , 分 , 秒 等字段放在同一个 维表 中 , 时间维 可以变成 多个维表 , 如只包含 年月日的维表 , 只包含 年 月 的维表 等 ;

② 数据冗余 :

  • 数据冗余 : 每个 维表 都要表示所有的层 , 每个层有自己的属性 , 有很多数据冗余 ;
  • 数据冗余 示例 : 上述 时间维表 中每个商品 , 都要存储完整的 年 , 月 , 日 , 时 , 分 , 秒 数据 , 实际上商品的 年 , 月 , 等数据 , 很多商品都是相同的 , 只记录一次即可 , 不同所有的商品都记录年月 信息 , 因此产生了大量的冗余数据 ;

③ 不同维层属性名相同查询问题 :

  • 不同维层 , 有相同的属性 , 只能使用 换名 方式进行查询 ;
  • 不同维层 相同属性示例 : 如 商店 事实表中 , 城市 , 省份 , 国家 , 每个层级都有一个经理 Manager , 当 查询 Manager 属性时 , 直接将 城市经理 , 省份经理 , 国家经理 , 都查询出来了 , 无法查询单独一个级别的经理信息 ;

2、雪片模式


对于 维层次 复杂的维

  • 为了 避免 冗余数据占用过多空间
  • 为了 支持 不同维层 相同属性 查询

使用多个维表 描述复杂的维 , 这样在 星型模型 的 星的角上 , 出现了分支 , 类似于雪花形状 , 因此这种变种的 星型模型 称为 “雪片模型” ;


雪片模型 优缺点 :

  • 雪片模型优点 : 雪片模型的维表是规范化的维表 , 雪片模型维表 易于维护 , 节省存储空间 ;
  • 雪片模型缺点 : 雪片模型 查询时 , 需要 进行较多的连接操作 , 影响系统性能 ;

3、事实星座


该模型 比 星型模式 , 雪片模型 更复杂 , 上述两个模型 , 只有一个事实表 , 但是 在事实星座模型中 , 有多个事实表 , 两个事实表 , 可能公用一些维表 ;





四、在线分析处理


在线分析处理 : 一类软件技术 , 分析人员 , 管理人员 利用该技术 , 从 多种视角 , 通过 快速 , 一致 , 交互 的访问数据 , 达到 对数据洞察 ;





五、多维数据分析操作


多维数据分析操作 :

切片 : 在 数据方体 某一维 , 选定一个 维成员 ;

切块 : 在 数据方体 某一维 , 选定 某个区间的 维成员 ;

旋转 : 改变 数据方体 维次序 ;

下钻 : 分析过程中 , 用户需要从 更多维 或者 某个维更细层次上 观察数据 , 前者 增加更多的维 , 后者 在现有维上钻取到更细一层的数据 ;

上卷 : 分析过程中 , 用户需要从 更少维 或者 某个维更粗层次上 观察数据 , 前者 减少一个维后分析 , 后者 上卷到现有的某个维的更高层次进行分析 ;






总结

本博客中从各个角度分析了 数据仓库 与 数据块 的区别 , 简要介绍了数据仓库体系结构 , 多维数据模型的三种模型结构 , 以及在多维数据模型中的数据分析操作 ;

在这里插入图片描述

以上是关于多维计算分析的主要内容,如果未能解决你的问题,请参考以下文章

快速入门pandas进行数据挖掘数据分析[多维度排序数据筛选分组计算透视表]

快速入门pandas进行数据挖掘数据分析[多维度排序数据筛选分组计算透视表]

数据可视化:多维分析之气泡图(新技能get!)

数据分析:工具篇NumPyNumPy介绍

StarRocks 在游族的多维分析场景与落地实践

利用Python进行数据分析——Numpy基础:数组和矢量计算