大数据:把HDFS上的数据导入到Hive中
Posted 测试开发鲜货
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据:把HDFS上的数据导入到Hive中相关的知识,希望对你有一定的参考价值。
创建数据库
CREATE SCHEMA qql_hive;
OK
Time taken: 1.022 seconds
列出数据库
show databases;
OK
default
qql_hive
Time taken: 0.08 seconds, Fetched: 4 row(s)
进入数据库
use qql_hive;
OK
Time taken: 0.145 seconds
EXTERNAL_TABLE
;其实就是,在创建表时可以自己指定目录位置(LOCATION);如果删除外部表时,只会删除元数据不会删除表数据;
hive> create external table movies_table
> (
> movieId STRING,
> title STRING,
> genres STRING
> )
> row format delimited fields terminated by ',';
OK
Time taken: 13.303 seconds
hive>
上面的记录,我们并没有指定目录位置。
Hive 默认情况下会将这些表的数据存储在由配置项hive.metastore.warehouse.dir
(例如,/user/hive/warehouse
)所定义的目录的子目录下。
这一步,就要我们的HDFS出场了,路径一步步点进来,就能看到我们的表名了。
接着点进去,上传我们的数据文件。
最后,我们在hive命令行验证一下。
show tables;
OK
movies_table
Time taken: 0.244 seconds, Fetched: 1 row(s)
select * from movies_table limit 10;
OK
movieId title genres
1 Toy Story (1995) Adventure|Animation|Children|Comedy|Fantasy
2 Jumanji (1995) Adventure|Children|Fantasy
3 Grumpier Old Men (1995) Comedy|Romance
4 Waiting to Exhale (1995) Comedy|Drama|Romance
5 Father of the Bride Part II (1995) Comedy
6 Heat (1995) Action|Crime|Thriller
7 Sabrina (1995) Comedy|Romance
8 Tom and Huck (1995) Adventure|Children
9 Sudden Death (1995) Action
Time taken: 3.681 seconds, Fetched: 10 row(s)
好了,以上就是通过hdfs将数据导入hive啦。
最近几天都没有更新,周末去和同事吃饭,给喝断片了,哎,以后真的要控制喝酒了,真的太难受了。周一又去医院补了个牙,大家一定要保护好牙齿啊,最便宜也就是症状最轻的补牙都要200多,如果严重了牙神经不保的程度那么真就是得万把块了。
内卷分队列队,先这么多吧,多了影响阅读体验,排名无先后,没贴的大佬下次见,这次贴了下次不贴,也别见怪就是了:
以上是关于大数据:把HDFS上的数据导入到Hive中的主要内容,如果未能解决你的问题,请参考以下文章