从 HIVE 表加载到 HDFS 作为 AVRO 文件

Posted

技术标签:

【中文标题】从 HIVE 表加载到 HDFS 作为 AVRO 文件【英文标题】:Load from HIVE table into HDFS as AVRO file 【发布时间】:2014-07-15 11:00:49 【问题描述】:

我想从 HIVE 表中加载一个文件到 HDFS(作为 .avro 文件)。 目前,我可以将表作为文件从 HIVE 移动到 HDFS,但我无法指定目标文件的特定格式。有人可以帮我吗??

【问题讨论】:

【参考方案1】:

所以你的问题是真的

如何将 Hive 表转换为不同的存储格式?

创建一个与 avro 表具有相同字段和类型的新表,并更改输入格式。然后从旧表插入到新表中。

INSERT OVERWRITE TABLE newtable SELECT * FROM oldtable

【讨论】:

感谢您的意见。我的问题是如何将文件从 HIVE 表加载到 HDFS 中。 HDFS 中的目标文件应该是 avro 文件。根据您的输入,我只是在转换 HIVE 表的输入格式。 @Jomy : 如果使用 avro 存储创建表,则数据 存储在 HDFS 中,通常在 "/user/hive/warehouse//" 你可以把数据文件复制出来。

以上是关于从 HIVE 表加载到 HDFS 作为 AVRO 文件的主要内容,如果未能解决你的问题,请参考以下文章

Hive:将hdfs中的gziped CSV作为只读加载到表中

将 avro 转换为镶木地板(也许使用 hive?)

Sqoop 导入具有 avro 格式的换行符的数据,然后使用 hive 查询

hive使用教程(2)--数据导入导出、查询与排序

如何从Oracle到hive

Pig - 读取存储为 Avro 的 Hive 表