将 JSON 格式表加载到 Pig 中

Posted

技术标签:

【中文标题】将 JSON 格式表加载到 Pig 中【英文标题】:Load JSON format table into Pig 【发布时间】:2014-03-04 12:01:03 【问题描述】:

我有一个用 Hive 创建的表。它需要一个JSON 格式的数据(我已经使用SERDE 来创建它)。

我想知道是否可以从这个表中加载数据到Pig,然后进行一些转换。

这是我的 JSON 数据:

"id":"1", "word":"2" ,"flag":1.

你有什么线索吗?


我试过了

A = LOAD ‘data.json’
USING PigJsonLoader();

但没有成功。这是我得到的错误:

[main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1200:意外字符 ''

我转向

json_objects = LOAD 'hdfs://user/cloudera/test.json' 
               USING org.apache.pig.piggybank.storage.JsonLoader();

但它说:

无法解析 org.apache.pig.piggybank.storage.JsonLoader 使用 导入:[, org.apache.pig.builtin., org.apache.pig.impl.builtin.].

【问题讨论】:

How do I parse JSON in Pig?的可能重复 【参考方案1】:

您的错误的原因是该类不存在。如果您在 0.12.1 版本中运行 pig,您将在 http://pig.apache.org/docs/r0.12.1/api/org/apache/pig/piggybank/storage/package-summary.html 找到有关贡献的 piggybank 的文档

【讨论】:

以上是关于将 JSON 格式表加载到 Pig 中的主要内容,如果未能解决你的问题,请参考以下文章

数据正在转换为二进制格式,同时使用 Apache pig 将数据加载到 monet db

将 Pig 输出转换为 JSON 格式

使用 Pig 加载 Json 数据

使用 Pig 将 Json 数据转换为特定的表格格式

Pig - 生成 JSON 文件的结构格式

将 json 文件加载到 PIG 中