用于命令行脚本和导入模块的 Python“模板”模块
Posted
技术标签:
【中文标题】用于命令行脚本和导入模块的 Python“模板”模块【英文标题】:Python "template" module for both command line scripts and imported module 【发布时间】:2018-09-06 04:40:24 【问题描述】:我想编写一个 python“模板”模块,以便为我的所有脚本提供相同的行为。
行为如下:
如果脚本在命令行中运行,它会接受使用 argparse 处理的参数。这些论点基本上是: 从标准输入、文件或字符串参数中输入json
;
在标准输出或文件中输出json
。
如果脚本作为模块导入,则它具有管理以下情况的类/函数:
接受来自谁调用的对象的输入;
输出一个对象,以便调用它的人可以使用它。
我做了什么:
“模板”部分 template.py
>多亏了这些建议,它在命令行中的行为完全符合我的要求: Python argparse mutually exclusive with stdin being one of the options
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import json,sys,argparse,os
def main():
parser = argparse.ArgumentParser(description='Template for python script managing JSON as input/output format. \
A JSON file can be [], , "string", 123, true, false, null.')
infile=['-i','--input-file']
kwinfile='type':argparse.FileType('r'), 'help':'Input file name containing a valid JSON. Default and priority: standard input.'
jstring=['-j','--json']
kwjstring='type':str, 'nargs':'?', 'help':'Input file name containing a valid JSON. Default and priority: standard input.'
outfile=['-o','--output-file']
kwoutfile='type':argparse.FileType('w'), 'help':'Output file name. Default: standard output.', 'default':sys.stdout
pretty=['-p','--pretty']
kwpretty='action':'store_true', 'help':'If set, JSON output will be formatted in pretty print.'
group = parser.add_mutually_exclusive_group()
group.add_argument(*infile, **kwinfile)
group.add_argument(*jstring, **kwjstring)
parser.add_argument(*outfile, **kwoutfile)
parser.add_argument(*pretty, **kwpretty)
args = parser.parse_args()
return(args)
def input(*data):
args=main()
# if data :
# datain=data[0]
# else :
if not sys.stdin.isatty(): # pipe
data=sys.stdin.read()
else: # no pipe
if not len(sys.argv) > 1 or (args.input_file == None and args.json == None) : # no arguments or no input
data='null'
else :
data = args.json or args.input_file.read()
try:
datain = json.loads(data)
except:
output('script_name':(sys.argv[0]),
'error': 'Input is not a valid JSON.',
'data': data)
sys.exit(0)
return(datain)
def output(*datain) :
args=main()
if datain :
datain=datain[0]
indent = 2 if args.pretty else None
dataout = json.dumps(datain, indent=indent, ensure_ascii=False)
args.output_file.write(dataout+os.linesep)
return(dataout)
if __name__ == "__main__":
main()
我希望这是实现它的最佳方式。
示例“calculate_area”
现在,如果我使用
在脚本中导入它import template as t
def main():
inp=t.input() # "x":8, "y":2
out='area' : inp['x'] * inp['y']
return(t.output(out))
if __name__ == "__main__":
main()
脚本按照我的意愿在命令行中运行:
$ echo '"x":8, "y":2' | ./calculate_area.py -p
"area": 16
“calculate_sqrt”脚本将其作为一个模块进行测试
现在我想要第三个脚本将其作为模块导入。
import template as t
import calculate_area as i
import numpy as np
import json
def main():
inp=json.loads(i.main())
out='sqrt of area' : np.sqrt(inp['area'])
return(t.output(out))
if __name__ == "__main__":
main()
问题从这里开始:
$ echo '"x":8, "y":2' | ./calculate_sqrt.py -p
"area": 16
"sqrt of area": 4.0
为什么我得到两个输入而不是最后一个?
此外:
如何避免在json
中输入?而是说:“如果模块是通过import
调用的,那么输入/输出将通过对象,否则它将通过命令行中的json
”?
我在这里保存了我的代码: https://github.com/orsa-unige/python-templates/tree/simplified-example
【问题讨论】:
在您的Template
代码中,您调用main()
,但不要对返回的args
执行任何操作。在input
和output
中再次调用它,这次节省了args
。但我没有看到对这两个函数的任何调用。
FileType
设置为接受-
表示stdin
或stdout
。这应该让您无需特殊测试即可接受重定向(甚至可能是管道?)输入/输出。
@hpaulj 我不明白...我调用它是为了可以使用args
值
i.main()
产生area
字符串。它返回它,但也写入文件。
如何避免呢?注释掉 args.output_file.write
导致没有输出;将 return
替换为 print
会产生相同的行为
【参考方案1】:
在我看来,这是一个好的基本脚本的大纲:
import json,sys,argparse,os
def parser(argv=None):
# if argv is None, uses the sys.argv[1:]
parser = argparse.ArgumentParser(....)
...
args = parser.parse_args(argv)
return(args)
def input(args, *data):
# if data :
# datain=data[0]
if args.input_file is not None:
# input_file might be sys.stdin (if '-')
data = args.input_file.read()
# stdin should work for < redirection
# I don't know if works for pipe
...
return(datain)
def output(args, *datain) :
if datain :
datain=datain[0]
# output_file might be stdout
....
return(dataout)
def main(args):
datain = input(args, [])
dataout = output(args, datain)
return dataout
if __name__ == "__main__":
args = parser()
main(args)
如果作为脚本调用,它只会运行一次解析器。如果导入,则由导入器脚本来运行此解析器。
parser
可以运行多次,但通常不需要 - 至少在 Namespace
可以传递的情况下不需要。但是每次调用解析器都会打开输入/输出文件。由于以写入模式打开一个文件,可能会导致重叠打开。
解析器可能会被测试:
args = parser(['-i', 'inputfile.py', ....]
另一个脚本可以做
from template import parser, input, output
def main(args):
... input
# do its own thing
... output
# etc
【讨论】:
感谢您的示例。它只允许运行解析器一次。但是现在,当import template as t
时,我必须调用t.input(args,...)
和t.output(args,...)
,而这不是必需的,因为使用模板的所有脚本的参数选项应该相同。
Python 中的导入模块提供了导入器可以使用的函数和类。您的模板模型不合适。如果脚本需要额外的控件怎么办?无论如何,如果多次调用解析器,我建议摆脱FileType
s。仅根据需要自行打开和/或创建文件,最好在with
上下文中。 input
函数不应创建 output
文件。 output
函数不应打开它不使用的input
文件。如果您提供它无法识别的值,解析器不应阻塞。
感谢您的有用建议。我会更新代码以上是关于用于命令行脚本和导入模块的 Python“模板”模块的主要内容,如果未能解决你的问题,请参考以下文章