02-开始建表_离线数仓项目

Posted mengbin0546

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了02-开始建表_离线数仓项目相关的知识,希望对你有一定的参考价值。

 

一.  建表,导数据

1. 创建库

create database gmall;

 

2. 创建表start_log,ods层表

drop table if exists ods_start_log;
CREATE EXTERNAL TABLE ods_start_log (`line` string)
PARTITIONED BY (`dt` string)
STORED AS
  INPUTFORMAT com.hadoop.mapred.DeprecatedLzoTextInputFormat
  OUTPUTFORMAT org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
LOCATION /warehouse/gmall/ods/ods_start_log;

3. 导入数据

load data inpath /origin_data/gmall/log/topic_start/2020-06-29 into table gmall.ods_start_log partition(dt=2020-06-29);

 

创建event_log

drop table if exists ods_event_log;
CREATE EXTERNAL TABLE ods_event_log(`line` string)
PARTITIONED BY (`dt` string)
STORED AS
  INPUTFORMAT com.hadoop.mapred.DeprecatedLzoTextInputFormat
  OUTPUTFORMAT org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
LOCATION /warehouse/gmall/ods/ods_event_log;

 

 

load data inpath /origin_data/gmall/log/topic_event/2020-06-29 into table gmall.ods_event_log partition(dt=2020-06-29);

 

二.导入数据到ods层中,通过脚本导入

 

以上是关于02-开始建表_离线数仓项目的主要内容,如果未能解决你的问题,请参考以下文章

Flume配置项目 离线数仓项目

离线数仓搭建_12_DWD层业务数据创建

离线数仓搭建_05_电商业务简介与业务数据说明

离线数仓之数据监控-Grafana

实时数仓与离线数仓架构对比Flink消费流程

离线数仓同步数据