在猪中找到原子的长度

Posted

技术标签:

【中文标题】在猪中找到原子的长度【英文标题】:Finding length of atom in pig 【发布时间】:2014-07-21 09:22:56 【问题描述】:

在关系中查找原子长度的猪脚本是什么

说下面是我的输入文件

abcd,10

abc,20

myinput = LOAD 'file' AS(str:chararray,num:int);

sized = FOREACH myinput GENERATE str, LENGTH(str) as my_length ,num;

转储大小;

上面的脚本抛出了一些错误

我只需要找到一个原子的相关长度。

有人可以帮忙

【问题讨论】:

【参考方案1】:

改变

myinput = LOAD 'file' AS(str:chararray,num:int); 

myinput = LOAD '/root/stack/data/atom' using PigStorage(',') as (str:chararray,num:int);

原因:默认加载函数期望'tab'作为分隔符。

sized = FOREACH myinput GENERATE str, LENGTH(str) as my_length ,num; 

 sized = FOREACH myinput GENERATE str, SIZE(str) as my_length ,num;

【讨论】:

以上是关于在猪中找到原子的长度的主要内容,如果未能解决你的问题,请参考以下文章

在猪中增加映射器

在猪中正确加载日期时间

如何在猪中读取json数据?

多列组合在猪中唯一

在猪中使用 AvroStorage()

无法在猪中处理 Xml