csv数据导入hive

Posted 闭关苦炼内功

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了csv数据导入hive相关的知识,希望对你有一定的参考价值。

首先,Excel文件另存为csv文件(以逗号分隔)

然后修改文件格式为txt格式

然后使用notepad++编辑器修改默认编码为 UTF-8

然后上传txt文件到 linux服务器

然后先确保hive服务端开启

再进入hive客户端
hive

使用hive SQL 创建一个数据库
create databse db_test_1;

使用数据库
use db_test_1;

再创建一张数据表

CREATE TABLE `tb_test_1` (
	`id` string,
	`xingming` string,
	`xingbie` string,
	`address` string
);

然后本地数据导入
LOAD DATA LOCAL INPATH '/opt/test/demo.txt' OVERWRITE INTO TABLE tb_test_1;

也可以先上传到hdfs,通过hdfs导入
hadoop fs -ls /
hadoop fs -mkdir /tmp/
hadoop fs -put /opt/test/demo.txt /tmp/
LOAD DATA INPATH '/tmp/demo.txt' OVERWRITE INTO TABLE tb_test_1;

如果说使用kerberos认证,那么需要先配置hive的票据 hive.service.keytab,并且定时任务自动更新票据有效期

关于kerberos认证,博主后面专门会有一篇文章详细介绍

以上是关于csv数据导入hive的主要内容,如果未能解决你的问题,请参考以下文章

将CSV文件导入到hive数据库

如何周期性把每天日志导入hive

导出hive数据,用逗号分割

如何在使用 EMR/Hive 将数据从 S3 导入 DynamoDB 时处理包含在引号 (CSV) 中的字段

hadoop hdfs csv导入hive表

hadoop hdfs csv导入hive表