无法从 python 中的 pigutil 导入 outputSchema
Posted
技术标签:
【中文标题】无法从 python 中的 pigutil 导入 outputSchema【英文标题】:Unable to import outputSchema from pigutil in python 【发布时间】:2016-06-12 07:20:51 【问题描述】:这可能是一个非常基本的问题,我是猪和蟒蛇领域的新手。 我正在尝试从 pigutil 导入 outputSchema。
在 python UDF 中,outputSchema 的使用如下:-
@outputSchema('HistorySchema:bagt:(SomeKey:int,ScdColumnNew:chararray,ScdColumnOld:int, activeFlag:chararray, EndDate:int, ChangeDate:int)')
我在尝试运行并检查 Python 命令行编辑器时遇到错误。
NameError: name 'outputSchema' is not defined
使用语句导入一次
from pigutil import outputSchema
出现以下错误:-
ImportError: No module named org.apache.pig
我在这里想要实现的是编写一个 UDF,它将从 Pig 中的单个元组返回 2 个元组。我已经尝试过使用两个不同的生成语句然后将两者合并的方法,但是它的性能很重,因此选择了 UDF。
【问题讨论】:
【参考方案1】:从 pig_util 导入输出架构
http://help.mortardata.com/technologies/pig/writing_python_udfs#toc_4UsingtheoutputSchemaDecoratorinPython
【讨论】:
以上是关于无法从 python 中的 pigutil 导入 outputSchema的主要内容,如果未能解决你的问题,请参考以下文章
C 中的嵌入式 python:有没有办法从压缩的 python 存档中正确导入 numpy?
导入sklearn时Python出错..无法从'joblib.logger'导入名称'Logger'