基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化
Posted wzy0623
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化相关的知识,希望对你有一定的参考价值。
六、Hue数据可视化实例本节先用Impala、DB查询示例说明Hue的数据查询和可视化功能,然后交互式地建立一个定期执行销售订单示例ETL任务的工作流,说明在Hue里是如何操作Oozie工作流引擎的。
1. Impala查询
在Impala OLAP实例一节中执行了一些查询,现在在Hue里执行查询,直观看一下结果的图形化表示效果。
(1)登录Hue,点击 图标进入“我的文档”页面。
(2)点击 创建一个名为“销售订单”的新项目。
(3)点击 进入Impala查询编辑页面,创建一个新的Impala文档。
(4)在Impala查询编辑页面,选择olap库,然后在编辑窗口输入下面的查询语句。
-- 按产品分类查询销售量和销售额
select t2.product_category pro_category,
sum(order_quantity) sum_quantity,
sum(order_amount) sum_amount
from sales_order_fact t1, product_dim t2
where t1.product_sk = t2.product_sk
group by pro_category
order by pro_category;
-- 按产品查询销售量和销售额
select t2.product_name pro_name,
sum(order_quantity) sum_quantity,
sum(order_amount) sum_amount
from sales_order_fact t1, product_dim t2
where t1.product_sk = t2.product_sk
group by pro_name
order by pro_name;
点击“执行”按钮,结果显示按产品分类的销售统计,如下图所示。接着点击“下一页”按钮,结果会显示按产品的销售统计。
以上是关于基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化的主要内容,如果未能解决你的问题,请参考以下文章
基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化