带有嵌套命名空间的 argparse 子命令

Posted

技术标签:

【中文标题】带有嵌套命名空间的 argparse 子命令【英文标题】:argparse subcommands with nested namespaces 【发布时间】:2013-09-11 04:06:06 【问题描述】:

argparse 是否提供内置工具以使其将组或解析器解析到自己的命名空间中?我觉得我一定是在某个地方遗漏了一个选项。

编辑:这个例子可能不完全是我应该做的来构建解析器来实现我的目标,但它是我目前为止的工作。我的具体目标是能够为子解析器提供解析为命名空间字段的选项组。我对父母的想法只是为了同样的目的使用通用选项。

例子:

import argparse

# Main parser
main_parser = argparse.ArgumentParser()
main_parser.add_argument("-common")

# filter parser
filter_parser = argparse.ArgumentParser(add_help=False)
filter_parser.add_argument("-filter1")
filter_parser.add_argument("-filter2")

# sub commands
subparsers = main_parser.add_subparsers(help='sub-command help')

parser_a = subparsers.add_parser('command_a', help="command_a help", parents=[filter_parser])
parser_a.add_argument("-foo")
parser_a.add_argument("-bar")

parser_b = subparsers.add_parser('command_b', help="command_b help", parents=[filter_parser])
parser_b.add_argument("-biz")
parser_b.add_argument("-baz")

# parse
namespace = main_parser.parse_args()
print namespace

这显然是我得到的:

$ python test.py command_a -foo bar -filter1 val
Namespace(bar=None, common=None, filter1='val', filter2=None, foo='bar')

但这才是我真正追求的:

Namespace(bar=None, common=None, foo='bar', 
          filter=Namespace(filter1='val', filter2=None))

然后更多的选项组已经解析到命名空间中:

Namespace(common=None, 
          foo='bar', bar=None,  
          filter=Namespace(filter1='val', filter2=None),
          anotherGroup=Namespace(bazers='val'),
          anotherGroup2=Namespace(fooers='val'),
          )

我找到了related question here,但它涉及一些自定义解析,似乎只涵盖了一个非常具体的情况。

是否有一个选项可以告诉 argparse 将某些组解析为命名空间字段?

【问题讨论】:

我不确定您希望它如何工作。正如您所写,filter1filter2 位于***解析器中,而不是位于某些名为 filter 的子解析器中。 argparse 怎么知道你希望它充当每个子解析器的子解析器,而实际上它不是? @abarnert:我可能应该根据您的问题重新格式化我的示例。因为正如你所指出的那样,我放在一起的结构确实不合适。我的目标确实是能够将选项组应用于子解析器,并将它们解析到命名空间中。如果它们可以通用就好了,这就是我尝试使用父结构的原因。 所以你正在寻找类似pipgit 等的东西,除了***全局选项和特定于每个子命令的选项外,还有共享选项通过多个不同的子命令(例如,pip--verbose--upgrade--user 选项),并且能够直接表示该共享而不是使其隐式(通过将选项组复制到多个子解析器)? 或者您只是想要 add_argument_group 所做的事情(并且您可以复制组),除了您希望分组的参数出现在结果中的子命名空间中?因为使用后处理器很容易做到这一点:为每个组创建一个子命名空间,迭代主命名空间,以及作为组成员的每个参数,将其移动到子命名空间。但是,如果你也需要的话,使用子解析器会更复杂一些。 @abarnert:是的,你是对的。我应该使用一个参数组,并在事后进行后期处理。感谢您的回答! 【参考方案1】:

如果重点只是将选定的参数放在它们自己的 namespace 中,并且子解析器(和父级)的使用是问题的附带条件,则此自定义操作可能会解决问题。

class GroupedAction(argparse.Action):    
    def __call__(self, parser, namespace, values, option_string=None):
        group,dest = self.dest.split('.',2)
        groupspace = getattr(namespace, group, argparse.Namespace())
        setattr(groupspace, dest, values)
        setattr(namespace, group, groupspace)

有多种方法可以指定group 名称。它可以在定义动作时作为参数传递。它可以作为参数添加。这里我选择从dest解析它(所以namespace.filter.filter1可以得到filter.filter1的值。

# Main parser
main_parser = argparse.ArgumentParser()
main_parser.add_argument("-common")

filter_parser = argparse.ArgumentParser(add_help=False)
filter_parser.add_argument("--filter1", action=GroupedAction, dest='filter.filter1', default=argparse.SUPPRESS)
filter_parser.add_argument("--filter2", action=GroupedAction, dest='filter.filter2', default=argparse.SUPPRESS)

subparsers = main_parser.add_subparsers(help='sub-command help')

parser_a = subparsers.add_parser('command_a', help="command_a help", parents=[filter_parser])
parser_a.add_argument("--foo")
parser_a.add_argument("--bar")
parser_a.add_argument("--bazers", action=GroupedAction, dest='anotherGroup.bazers', default=argparse.SUPPRESS)
...
namespace = main_parser.parse_args()
print namespace

我必须添加default=argparse.SUPPRESS,所以bazers=None 条目不会出现在主命名空间中。

结果:

>>> python PROG command_a --foo bar --filter1 val --bazers val
Namespace(anotherGroup=Namespace(bazers='val'), 
    bar=None, common=None, 
    filter=Namespace(filter1='val'), 
    foo='bar')

如果您需要嵌套命名空间中的默认条目,您可以事先定义命名空间:

filter_namespace = argparse.Namespace(filter1=None, filter2=None)
namespace = argparse.Namespace(filter=filter_namespace)
namespace = main_parser.parse_args(namespace=namespace)

结果和以前一样,除了:

filter=Namespace(filter1='val', filter2=None)

【讨论】:

是的。我将接受这个而不是之前接受的答案,因为这确实使用 argparse 的功能(自定义操作)解决了我的目标。实际上……点符号“dest”正是我最初所希望的。谢谢! 我对您的 GroupedAction 做了一些补充,让它清理***原始属性,并且还可以选择从选项中派生组/字段:pastebin.com/qgQBBuvP @jdi:这正是我所说的通过子类化自定义解析来扩展 argparse 可能更好的意思;我只展示了如何做,因为你的问题暗示你不想这样做。我同意这是一个很好的答案。 @abarnert:我不认为我曾经暗示我不想要一个子类化的选项。实际上恰恰相反。我问的是使用内置设施,子类化确实可以满足。因为它直接与现有的解析逻辑一起工作。尽管我发现这种方法总体上导致了更多的工作,因为当您执行一个自定义操作时,您必须做更多的事情,处理发生的事件、布尔常量等。但它正在工作。 不如创建一个自定义命名空间类,它采用destgroup.dest 一样,并创建所需的嵌套对象?定义的命名空间类非常简单。只要您的新课程与getattrhasattrsetattr 一起使用,它就可以更精彩。【参考方案2】:

我不完全确定你在问什么,但我认为你想要的是 argument group 或 sub-command 将其参数放入子命名空间。

据我所知,argparse 并没有开箱即用。但是,只要您愿意深入挖掘一下,通过对结果进行后处理确实并不难。 (我猜想通过继承ArgumentParser 更容易做到这一点,但你明确表示你不想这样做,所以我没有尝试。)

parser = argparse.ArgumentParser()
parser.add_argument('--foo')
breakfast = parser.add_argument_group('breakfast')
breakfast.add_argument('--spam')
breakfast.add_argument('--eggs')
args = parser.parse_args()

现在,breakfast 选项的所有目的地列表是:

[action.dest for action in breakfast._group_actions]

args中的键值对是:

args._get_kwargs()

所以,我们要做的就是移动匹配的那些。如果我们构建字典来创建命名空间会更容易一些:

breakfast_options = [action.dest for action in breakfast._group_actions]
top_names = name: value for (name, value) in args._get_kwargs()
             if name not in breakfast_options
breakfast_names = name: value for (name, value) in args._get_kwargs()
                   if name in breakfast_options
top_names['breakfast'] = argparse.Namespace(**breakfast_names)
top_namespace = argparse.Namespace(**top_names)

就是这样; top_namespace 看起来像:

Namespace(breakfast=Namespace(eggs=None, spam='7'), foo='bar')

当然,在这种情况下,我们有一个静态组。如果您想要更通用的解决方案怎么办?简单。 parser._action_groups 是所有组的列表,但前两个是全局位置组和关键字组。因此,只需遍历 parser._action_groups[2:],并为每个上面的 breakfast 执行相同的操作。


子命令而不是组呢?类似,但细节不同。如果您保留了每个subparser 对象,那么它就是另一个ArgumentParser。如果没有,但您确实保留了subparsers 对象,它是Action 的一种特殊类型,其choices 是一个字典,其键是子解析器名称,其值是子解析器本身。如果您两者都不保留……从parser._subparsers 开始并从那里弄清楚。

无论如何,一旦您知道如何找到要移动的名称以及要移动它们的位置,这与组相同。


如果除了全局参数和/或组以及子解析器特定的参数和/或组之外,还有一些由多个子解析器共享的组……那么从概念上讲它会变得很棘手,因为每个子解析器最终都有引用到同一个组,你不能把它移到他们所有人。但幸运的是,您只处理一个子解析器(或没有),因此您可以忽略其他子解析器并移动所选子解析器下的任何共享组(以及 不存在的任何组在选定的子解析器中,要么留在顶部,要么扔掉,或者任意选择一个子解析器。

【讨论】:

是的,这几乎回答了我的问题。我首先从查看组开始,它似乎只根据帮助对它们进行分组,开箱即用。因此,您已经解释说它确实需要一些手动后期处理,这很好。只需要看一个这样的例子,表明它是 argparse 所需的方法。谢谢! @jdi:正如我在回答中所说,我认为通过子类化而不是后处理来扩展 argparse 可能在这里更容易。组对象是您可以轻松构建以做更多事情的东西,而对解析器对象几乎没有更改。这可能也更惯用。但无论您觉得哪个更舒服,都可能没问题。【参考方案3】:

嵌套Action 子类对于一种Action 来说很好,但是如果您需要对几种类型(store、store true、append 等)进行子类化,那就麻烦了。这是另一个想法 - 子类命名空间。执行相同的名称拆分和 setattr,但在 Namespace 而不是 Action 中执行。然后只需创建一个新类的实例,并将其传递给parse_args

class Nestedspace(argparse.Namespace):
    def __setattr__(self, name, value):
        if '.' in name:
            group,name = name.split('.',1)
            ns = getattr(self, group, Nestedspace())
            setattr(ns, name, value)
            self.__dict__[group] = ns
        else:
            self.__dict__[name] = value

p = argparse.ArgumentParser()
p.add_argument('--foo')
p.add_argument('--bar', dest='test.bar')
print(p.parse_args('--foo test --bar baz'.split()))

ns = Nestedspace()
print(p.parse_args('--foo test --bar baz'.split(), ns))
p.add_argument('--deep', dest='test.doo.deep')
args = p.parse_args('--foo test --bar baz --deep doodod'.split(), Nestedspace())
print(args)
print(args.test.doo)
print(args.test.doo.deep)

制作:

Namespace(foo='test', test.bar='baz')
Nestedspace(foo='test', test=Nestedspace(bar='baz'))
Nestedspace(foo='test', test=Nestedspace(bar='baz', doo=Nestedspace(deep='doodod')))
Nestedspace(deep='doodod')
doodod

此命名空间的__getattr__(计数和追加等操作需要)可以是:

def __getattr__(self, name):
    if '.' in name:
        group,name = name.split('.',1)
        try:
            ns = self.__dict__[group]
        except KeyError:
            raise AttributeError
        return getattr(ns, name)
    else:
        raise AttributeError

我提出了其他几个选项,但最好是这样。它将存储详细信息放在它们所属的位置,在命名空间中,而不是解析器中。

【讨论】:

太酷了。我什至没有考虑将命名空间子类化。总的来说,我喜欢这个,但是自从你上次回答以来,我发现了一些好处,比如将 ArgumentGroup 之类的子类化以设置与该字段匹配的默认元变量,并注册自定义操作。我确信这个自定义命名空间组合起来很有意义。【参考方案4】:

在这个脚本中,我修改了 argparse._SubParsersAction 的 __call__ 方法。它没有将namespace 传递给子解析器,而是传递一个新的。然后它将它添加到主要的namespace。我只改了__call__的3行。

import argparse

def mycall(self, parser, namespace, values, option_string=None):
    parser_name = values[0]
    arg_strings = values[1:]

    # set the parser name if requested
    if self.dest is not argparse.SUPPRESS:
        setattr(namespace, self.dest, parser_name)

    # select the parser
    try:
        parser = self._name_parser_map[parser_name]
    except KeyError:
        args = 'parser_name': parser_name,
                'choices': ', '.join(self._name_parser_map)
        msg = _('unknown parser %(parser_name)r (choices: %(choices)s)') % args
        raise argparse.ArgumentError(self, msg)

    # CHANGES
    # parse all the remaining options into a new namespace
    # store any unrecognized options on the main namespace, so that the top
    # level parser can decide what to do with them
    newspace = argparse.Namespace()
    newspace, arg_strings = parser.parse_known_args(arg_strings, newspace)
    setattr(namespace, 'subspace', newspace) # is there a better 'dest'?

    if arg_strings:
        vars(namespace).setdefault(argparse._UNRECOGNIZED_ARGS_ATTR, [])
        getattr(namespace, argparse._UNRECOGNIZED_ARGS_ATTR).extend(arg_strings)

argparse._SubParsersAction.__call__ = mycall

# Main parser
main_parser = argparse.ArgumentParser()
main_parser.add_argument("--common")

# sub commands
subparsers = main_parser.add_subparsers(dest='command')

parser_a = subparsers.add_parser('command_a')
parser_a.add_argument("--foo")
parser_a.add_argument("--bar")

parser_b = subparsers.add_parser('command_b')
parser_b.add_argument("--biz")
parser_b.add_argument("--baz")

# parse
input = 'command_a --foo bar --bar val --filter extra'.split()
namespace = main_parser.parse_known_args(input)
print namespace

input = '--common test command_b --biz bar --baz val'.split()
namespace = main_parser.parse_args(input)
print namespace

这会产生:

(Namespace(command='command_a', common=None, 
    subspace=Namespace(bar='val', foo='bar')), 
['--filter', 'extra'])

Namespace(command='command_b', common='test', 
    subspace=Namespace(baz='val', biz='bar'))

我使用parse_known_args 来测试额外的字符串是如何传回主解析器的。

我删除了 parents 的东西,因为它没有向这个命名空间更改添加任何内容。它只是定义多个子解析器使用的一组参数的一种方便方法。 argparse 不会记录哪些参数是通过parents 添加的,哪些是直接添加的。它不是分组工具

argument_groups 也无济于事。帮助格式化程序使用它们,但parse_args 不使用它们。

我可以继承_SubParsersAction(而不是重新分配__call__),但我会更改main_parse.register

【讨论】:

这是一个很酷的例子,说明如何通过猴子补丁对其进行解析......虽然缺点是它使用已知/未知的 args 方法,这意味着过滤器没有记录或通过 argparse 管理.【参考方案5】:

从 abarnert 的回答开始,我整理了以下 MWE++ ;-) 来处理具有相似选项名称的多个配置组。

#!/usr/bin/env python2
import argparse, re

cmdl_skel = 
    'description'       : 'An example of multi-level argparse usage.',
    'opts'              : 
        '--foo' : 
            'type'    : int,
            'default' : 0,
            'help'    : 'foo help main',
        ,
        '--bar' : 
            'type'    : str,
            'default' : 'quux',
            'help'    : 'bar help main',
        ,
    ,
    # Assume your program uses sub-programs with their options. Argparse will
    # first digest *all* defs, so opts with the same name across groups are
    # forbidden. The trick is to use the module name (=> group.title) as
    # pseudo namespace which is stripped off at group parsing
    'groups' : [
           'module'        : 'mod1',
            'description'   : 'mod1 description',
            'opts'          : 
                '--mod1-foo, --mod1.foo'  : 
                    'type'    : int,
                    'default' : 0,
                    'help'    : 'foo help for mod1'
                ,
            ,
        ,
           'module'        : 'mod2',
            'description'   : 'mod2 description',
            'opts'          : 
                '--mod2-foo, --mod2.foo'  : 
                    'type'    : int,
                    'default' : 1,
                    'help'    : 'foo help for mod2'
                ,
            ,
        ,
    ],
    'args'              : 
        'arg1'  : 
            'type'    : str,
            'help'    : 'arg1 help',
        ,
        'arg2'  : 
            'type'    : str,
            'help'    : 'arg2 help',
        ,
    



def parse_args ():
    def _parse_group (parser, opt, **optd):
        # digest variants
        optv = re.split('\s*,\s*', opt)
        # this may rise exceptions...
        parser.add_argument(*optv, **optd)

    errors = 
    parser = argparse.ArgumentParser(description=cmdl_skel['description'],
                formatter_class=argparse.ArgumentDefaultsHelpFormatter)

    # it'd be nice to loop in a single run over zipped lists, but they have
    # different lenghts...
    for opt in cmdl_skel['opts'].keys():
        _parse_group(parser, opt, **cmdl_skel['opts'][opt])

    for arg in cmdl_skel['args'].keys():
        _parse_group(parser, arg, **cmdl_skel['args'][arg])

    for grp in cmdl_skel['groups']:
        group = parser.add_argument_group(grp['module'], grp['description'])
        for mopt in grp['opts'].keys():
            _parse_group(group, mopt, **grp['opts'][mopt])

    args = parser.parse_args()

    all_group_opts = []
    all_group_names = 
    for group in parser._action_groups[2:]:
        gtitle = group.title
        group_opts = [action.dest for action in group._group_actions]
        all_group_opts += group_opts
        group_names = 
            # remove the leading pseudo-namespace
            re.sub("^%s_" % gtitle, '', name) : value
                for (name, value) in args._get_kwargs()
                    if name in group_opts
        
        # build group namespace
        all_group_names[gtitle] = argparse.Namespace(**group_names)

    # rebuild top namespace
    top_names = 
        name: value for (name, value) in args._get_kwargs()
            if name not in all_group_opts
    
    top_names.update(**all_group_names)
    top_namespace = argparse.Namespace(**top_names)

    return top_namespace


def main():
    args = parse_args()

    print(str(args))
    print(args.bar)
    print(args.mod1.foo)


if __name__ == '__main__':
    main()

那么你可以这样称呼它(助记符:--mod1-... 是“mod1”的选项等):

$ ./argparse_example.py one two --bar=three --mod1-foo=11231 --mod2.foo=46546
Namespace(arg1='one', arg2='two', bar='three', foo=0, mod1=Namespace(foo=11231), mod2=Namespace(foo=46546))
three
11231

【讨论】:

【参考方案6】:

根据@abarnert 的回答,我编写了一个简单的函数来满足 OP 的要求:

from argparse import Namespace, ArgumentParser


def parse_args(parser):
    assert isinstance(parser, ArgumentParser)
    args = parser.parse_args()

    # the first two argument groups are 'positional_arguments' and 'optional_arguments'
    pos_group, optional_group = parser._action_groups[0], parser._action_groups[1]
    args_dict = args._get_kwargs()
    pos_optional_arg_names = [arg.dest for arg in pos_group._group_actions] + [arg.dest for arg in optional_group._group_actions]
    pos_optional_args = name: value for name, value in args_dict if name in pos_optional_arg_names
    other_group_args = dict()

    # If there are additional argument groups, add them as nested namespaces
    if len(parser._action_groups) > 2:
        for group in parser._action_groups[2:]:
            group_arg_names = [arg.dest for arg in group._group_actions]
            other_group_args[group.title] = Namespace(**name: value for name, value in args_dict if name in group_arg_names)

    # combine the positiona/optional args and the group args
    combined_args = pos_optional_args
    combined_args.update(other_group_args)
    return Namespace(**combined_args)

你只需给它ArgumentParser 实例,它就会根据参数的组结构返回一个嵌套的NameSpace

【讨论】:

【参考方案7】:

请查看PyPi 上的argpext module,它可能会对您有所帮助!

【讨论】:

以上是关于带有嵌套命名空间的 argparse 子命令的主要内容,如果未能解决你的问题,请参考以下文章

使用其他命名空间/字典更新 argparse 命名空间

添加空的默认 XML 命名空间 xmlns="" 属性?

带有 argparse 的 fish 函数的命名参数

类定义中的 Python argparse 命名空间

如何创建 Python 命名空间(argparse.parse_args 值)?

Python argparse:可以命名或定位的命令行参数