02-开始建表_离线数仓项目
Posted mengbin0546
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了02-开始建表_离线数仓项目相关的知识,希望对你有一定的参考价值。
一. 建表,导数据
1. 创建库
create database gmall;
2. 创建表start_log,ods层表
drop table if exists ods_start_log; CREATE EXTERNAL TABLE ods_start_log (`line` string) PARTITIONED BY (`dt` string) STORED AS INPUTFORMAT ‘com.hadoop.mapred.DeprecatedLzoTextInputFormat‘ OUTPUTFORMAT ‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat‘ LOCATION ‘/warehouse/gmall/ods/ods_start_log‘;
3. 导入数据
load data inpath ‘/origin_data/gmall/log/topic_start/2020-06-29‘ into table gmall.ods_start_log partition(dt=‘2020-06-29‘);
创建event_log
drop table if exists ods_event_log; CREATE EXTERNAL TABLE ods_event_log(`line` string) PARTITIONED BY (`dt` string) STORED AS INPUTFORMAT ‘com.hadoop.mapred.DeprecatedLzoTextInputFormat‘ OUTPUTFORMAT ‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat‘ LOCATION ‘/warehouse/gmall/ods/ods_event_log‘;
load data inpath ‘/origin_data/gmall/log/topic_event/2020-06-29‘ into table gmall.ods_event_log partition(dt=‘2020-06-29‘);
二.导入数据到ods层中,通过脚本导入
以上是关于02-开始建表_离线数仓项目的主要内容,如果未能解决你的问题,请参考以下文章