Hive histogram_numeric 函数输出无效字符

Posted

技术标签:

【中文标题】Hive histogram_numeric 函数输出无效字符【英文标题】:Hive histogram_numeric function outputs invalid character 【发布时间】:2014-08-12 15:04:30 【问题描述】:

我正在使用 hive 的 histogram_numeric 函数,我想将我的选择查询输出到文件。 但是我在文件中得到了无效的字符,我不能用它来绘制数据。

这是我的代码:

INSERT OVERWRITE LOCAL DIRECTORY '/home/cloudera/queries/histograms/q1'
      ROW FORMAT DELIMITED                                                           
      FIELDS TERMINATED BY ','                                                       
     select explode(histogram_numeric(operationTime,30)) from transaction;   

结果我得到:

3.1968591661070107"someInvalidCharacter"196572.0
14.41629947203365"someInvalidCharacter"725191.0
27.84241052482667"someInvalidCharacter"27069.0

但我希望使用“,”而不是“someInvalidCharacter”。

可能是什么问题

【问题讨论】:

【参考方案1】:

每个 Hive LanguageManual, histogram_numeric 创建一个结构数组。尝试使用inline 来“爆炸”您的输出,而不是使用explode

【讨论】:

以上是关于Hive histogram_numeric 函数输出无效字符的主要内容,如果未能解决你的问题,请参考以下文章

如何写hive的udf函数

Hive脚本、Hive API、Hive 自定义函数

查询hive中都有哪些自定义函数

hive参数传递,hive常用函数

hive参数传递,hive常用函数

hive窗口函数总结