多维计算分析

Posted 2023-05-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了多维计算分析相关的知识，希望对你有一定的参考价值。

参考技术A 458.单选题 by 帆软-Royide

FineBI产品定义的数据类型不包含以下哪一种？

包含：文本、数值、时间

459.判断题 by 帆软-Royide

FineBI在实现数据钻取的时候需要预先对数据进行分层处理，否则无法进行数据钻取。（√）

460.单选题 by 帆软-Royide

对于todate()函数表达式的书写，以下哪种写法是正确的？（A）

A.todate("2017-01-01","yyyy-MM-dd")

B.todate(2017-01-01,"yyyy-MM-dd")

C.todate("2017-01-01",yyyy-MM-dd)

D.todate(2017-01-01,yyyy-MM-dd)

461.判断题 by 帆软-Royide

FineBI的数据图表之间可以不通过设置直接自动联动。（√）

462.判断题 by 帆软-Royide

取消勾选二次计算，会先计算再过滤，不对维度过滤结果再计算。（√，选中二次计算时，先过滤再计算。）

463.判断题 by 帆软-Royide

FineBI中的指标如果想进行维度区间/自定义分组，不能直接拖拽到组件区域中，需要先转化为维度方可再进行指标分组。（√）

464.单选题 by 帆软-Royide

对于FineBI中新增表达式if(3==3,1,2)，那么最终输出的结果值会是？（1）

465.判断题 by 帆软-Royide

同比环比的快速计算，不会因为时间控件的过滤而导致不在区间内的数据同比环比无法计算.（×）

466.判断题 by 帆软-Royide

假设有一张维度表和一张明细表，维度表中有省份字段，包括北京、江苏、广东；明细表也有省份字段，但是只有江苏和广东，还有销售金额字段。维度表和明细表建立好1:N的关联关系之后，前端分析用汇总表拉取维度表的省份字段，明细表的销售金额字段，那么汇总表格会统计出北京、江苏、广东每个地区的销售金额。（×）

467.判断题 by 帆软-Royide

FineBI中如果想维度旋转操作，需要新建钻取目录，相同钻取层级中的维度方可互相切换旋转。（√）

468.判断题 by 帆软-Royide

FineBI产品在新增公式列的时候，除了使用内置的函数公式之外，还可以支持开发人员调用提供的API接口进行函数自定义。（√）

471.判断题 by 帆软-Royide

文本控件只能放置文本类型的字段进行数据筛选。（×，可以按数值字段，组件，表格等筛选）

472.判断题 by 帆软-Royide

数值类型只能放置数值类型的数据进行筛选。（√）

473.判断题 by 帆软-Royide

时间控件只能放置时间类型的字段进行时间筛选。（√，时间过滤组件为组件类型中的一种，是用于过滤时间的组件，数据来源只能是时间类型。）

474.判断题 by 帆软-Royide

当前维度百分比可以用来计算当前指标在该指标所有值中的占比。（×，在维度汇总中的百分比）

475.判断题 by 帆软-Royide

目前FineBI的跳转功能只能选择固定的字段传递参数，不能通过地址组合参数进行任意传递。（×）

476.单选题 by 帆软-Royide

假设有一张维度表和一张明细表，维度表中有省份字段，包括北京、江苏、广东；明细表也有省份字段，但是只有江苏和安徽，还有销售金额字段。维度表和明细表建立好1:N的关联关系之后，前端分析用汇总表拉取维度表的省份字段，明细表的销售金额字段，那么汇总表格只会统计出哪几个地区的销售金额？（D.江苏）

商务智能数据仓库 ( 多维数据模型 | 多维数据分析 )

商务智能系列文章目录

【商务智能】数据预处理
 【商务智能】数据仓库 ( 多维数据模型 | 多维数据分析 )

前言

上一篇博客【商务智能】数据预处理中讲解了数据预处理操作 , 本篇博客介绍数据仓库 , 数据仓库与传统数据库区别 , 多维数据模型等 ;

一、数据仓库与传统数据库区别

数据仓库特征 :

面向主题
集成
不可更新
随时间不断变化

数据仓库定义 : 数据仓库是用于更好地支持企业 / 组织决策分析处理 , 面向主题的 , 集成的 , 不可更新的 , 随时间不断变化的数据集合 ;

传统的数据库又称为操作型数据库 , 如 Oracle , MySQL 等数据库 ;

	操作型数据	分析型数据
数据粒度	细节的	综合的
数据时效	存储瞬间准确	过去的历史数据
是否只读	可更新	不可更新
需求可知	操作时实现知道需求	操作时事先不知道需求
生命周期	生命周期符合 SDLC	完全不同的生命周期
性能要求	性能要求高	性能要求低
操作大小	同一时刻操作一个单元的数据	同一时刻操作一个集合的数据
数据大小	单次操作数据量小	单次操作数据量大
驱动力量	事务驱动	分析驱动
具体用途	面向应用	面向分析
应用场景	支持日常操作	支持管理需求
数据内容	业务相关数据	决策相关数据
数据模型	关系,层次结构	关系, 多维数据结构
数据访问	随机读写操作	只有查询操作
工作负载	事物处理量大, 每个事物涉及记录很少	查询小, 每次需要查询大量数据
事务输出	很少	很大
系统停机	灾难性的系统宕机	延迟决策

二、数据仓库系统体系结构

数据仓库系统体系结构 :

数据源
集成工具
数据仓库
数据仓库服务器
OLAP 服务器
元数据
元数据管理工具
数据集市
前台分析工具

三、多维数据模型

多维数据模型 : 从业务分析角度 , 对数据进行逻辑建模的方法 ; 具有简单 , 易于理解 , 方便查询 ;

多维数据模型又称为维度数据模型 , 由维度表和事实表构成 ;

1、星型模式

星型模式 : 中间有一个表 , 称为事实表 , 周围有很多小表 , 这些表称为维表 ;

星型模式缺点 :

① 星型模式不支持维的层结构 ;

单一维表 : 每个维只有一个维表 , 所有的维层属性都放在一个表中 , 没有进行规范化 ;
单一维表示例 : 以上述 “商品” 事实表的时间对应的维表为例 , 将年 , 月 , 日 , 时 , 分 , 秒等字段放在同一个维表中 , 时间维可以变成多个维表 , 如只包含年月日的维表 , 只包含年月的维表等 ;

② 数据冗余 :

数据冗余 : 每个维表都要表示所有的层 , 每个层有自己的属性 , 有很多数据冗余 ;
数据冗余示例 : 上述时间维表中每个商品 , 都要存储完整的年 , 月 , 日 , 时 , 分 , 秒数据 , 实际上商品的年 , 月 , 等数据 , 很多商品都是相同的 , 只记录一次即可 , 不同所有的商品都记录年月信息 , 因此产生了大量的冗余数据 ;

③ 不同维层属性名相同查询问题 :

不同维层 , 有相同的属性 , 只能使用换名方式进行查询 ;
不同维层相同属性示例 : 如商店事实表中 , 城市 , 省份 , 国家 , 每个层级都有一个经理 Manager , 当查询 Manager 属性时 , 直接将城市经理 , 省份经理 , 国家经理 , 都查询出来了 , 无法查询单独一个级别的经理信息 ;

2、雪片模式

对于维层次复杂的维

为了避免冗余数据占用过多空间
为了支持不同维层相同属性查询

使用多个维表描述复杂的维 , 这样在星型模型的星的角上 , 出现了分支 , 类似于雪花形状 , 因此这种变种的星型模型称为 “雪片模型” ;

雪片模型优缺点 :

雪片模型优点 : 雪片模型的维表是规范化的维表 , 雪片模型维表易于维护 , 节省存储空间 ;
雪片模型缺点 : 雪片模型查询时 , 需要进行较多的连接操作 , 影响系统性能 ;

3、事实星座

该模型比星型模式 , 雪片模型更复杂 , 上述两个模型 , 只有一个事实表 , 但是在事实星座模型中 , 有多个事实表 , 两个事实表 , 可能公用一些维表 ;

四、在线分析处理

在线分析处理 : 一类软件技术 , 分析人员 , 管理人员利用该技术 , 从多种视角 , 通过 快速 , 一致 , 交互 的访问数据 , 达到对数据洞察 ;

五、多维数据分析操作

多维数据分析操作 :

切片 : 在数据方体某一维 , 选定一个维成员 ;

切块 : 在数据方体某一维 , 选定某个区间的维成员 ;

旋转 : 改变数据方体维次序 ;

下钻 : 分析过程中 , 用户需要从更多维或者某个维更细层次上观察数据 , 前者增加更多的维 , 后者在现有维上钻取到更细一层的数据 ;

上卷 : 分析过程中 , 用户需要从更少维或者某个维更粗层次上观察数据 , 前者减少一个维后分析 , 后者上卷到现有的某个维的更高层次进行分析 ;

总结

本博客中从各个角度分析了数据仓库与数据块的区别 , 简要介绍了数据仓库体系结构 , 多维数据模型的三种模型结构 , 以及在多维数据模型中的数据分析操作 ;

在这里插入图片描述

以上是关于多维计算分析的主要内容，如果未能解决你的问题，请参考以下文章

快速入门pandas进行数据挖掘数据分析[多维度排序数据筛选分组计算透视表]

数据可视化：多维分析之气泡图（新技能get！）

数据分析：工具篇NumPyNumPy介绍

StarRocks 在游族的多维分析场景与落地实践

利用Python进行数据分析——Numpy基础：数组和矢量计算