Hive 'Load' 命令不考虑字段分隔符

Posted

技术标签:

【中文标题】Hive \'Load\' 命令不考虑字段分隔符【英文标题】:Hive 'Load' command not considering Field DelimiterHive 'Load' 命令不考虑字段分隔符 【发布时间】:2017-04-17 10:30:37 【问题描述】:

我正在尝试在 Hortonworks Sandbox 和 C3 Cluster 上使用 Hive CLI 创建一个配置单元表。在我的“CREATE TABLE”命令中,我指定了以下内容:

FIELDS TERMINATED BY '\u0010' ​

然后我使用“LOAD”命令加载表。这在 Sandbox 中提供了正确的 Hive 表,但在 C3 集群上,这会在第一列中附加所有字段,并为其余列提供 NULL 值。 请帮我解决以下问题。

谢谢

【问题讨论】:

【参考方案1】:

有一个带有 unicode 文字的 bug 应该在 2.1 版中修复

改用十进制或八进制表示法。

... fields terminated by '\020'      (Octal)
... fields terminated by '16'        (Decimal)

【讨论】:

以上是关于Hive 'Load' 命令不考虑字段分隔符的主要内容,如果未能解决你的问题,请参考以下文章

hive load数据时如何设定为分隔符?

Hive 常用命令 | 表操作 | 分区操作 | 数据导入 | 权限处理 | 查看锁 | 解锁 | 多字符分隔符建表

hive字段分隔符和数组分隔符

hive 在 load data 时,能指定加载的文件使用的列分隔符吗

在hive中遇到的错误

hive建表-指定文件类型和压缩类型以及字段分隔符