Python中的lambda表达式内的赋值

Posted

技术标签:

【中文标题】Python中的lambda表达式内的赋值【英文标题】:Assignment inside lambda expression in Python 【发布时间】:2011-09-11 01:00:22 【问题描述】:

我有一个对象列表,我想使用filterlambda 表达式删除除一个之外的所有空对象。

例如,如果输入是:

[Object(name=""), Object(name="fake_name"), Object(name="")]

...那么输出应该是:

[Object(name=""), Object(name="fake_name")]

有没有办法给lambda 表达式添加赋值?例如:

flag = True 
input = [Object(name=""), Object(name="fake_name"), Object(name="")] 
output = filter(
    (lambda o: [flag or bool(o.name), flag = flag and bool(o.name)][0]),
    input
)

【问题讨论】:

没有。但你不需要这个。实际上,我认为即使可行,实现这一目标也是一种非常模糊的方式。 为什么不直接将常规的旧函数传递给过滤器? 我想使用 lambda,所以它会是一个非常紧凑的解决方案。我记得在 OCaml 中,我可以在返回表达式之前链接打印语句,认为这可以在 Python 中复制 在开发链式管道的流程中非常痛苦,然后意识到:“哦,我想创建一个临时变量以使流程更清晰”或“我想记录这个中间步骤" : 然后你必须跳到其他地方创建一个函数来执行它:并且 name 该函数并跟踪它 - 即使它只在一个地方使用。 另请参阅Assignment inside lambda expression in Python - Stack Overflow 了解特殊情况(C 中的++ 或 -- 运算符) 【参考方案1】:

The assignment expression operator := added in Python 3.8 支持在 lambda 表达式中赋值。由于语法原因,此运算符只能出现在带括号的 (...)、括号 [...] 或括号 ... 表达式中。例如,我们将能够编写以下内容:

import sys
say_hello = lambda: (
    message := "Hello world",
    sys.stdout.write(message + "\n")
)[-1]
say_hello()

在 Python 2 中,可以将本地赋值作为列表推导的副作用。

import sys
say_hello = lambda: (
    [None for message in ["Hello world"]],
    sys.stdout.write(message + "\n")
)[-1]
say_hello()

但是,在您的示例中无法使用其中任何一个,因为您的变量 flag 位于外部范围内,而不是 lambda 的范围内。这与lambda 无关,它是Python 2 中的一般行为。Python 3 允许您使用defs 内部的nonlocal 关键字解决此问题,但不能在内部使用nonlocal lambdas.

有一个解决方法(见下文),但是当我们讨论这个主题时......


在某些情况下,您可以使用它来执行 lambda 内的所有操作:

(lambda: [
    ['def'
        for sys in [__import__('sys')]
        for math in [__import__('math')]

        for sub in [lambda *vals: None]
        for fun in [lambda *vals: vals[-1]]

        for echo in [lambda *vals: sub(
            sys.stdout.write(u" ".join(map(unicode, vals)) + u"\n"))]

        for Cylinder in [type('Cylinder', (object,), dict(
            __init__ = lambda self, radius, height: sub(
                setattr(self, 'radius', radius),
                setattr(self, 'height', height)),

            volume = property(lambda self: fun(
                ['def' for top_area in [math.pi * self.radius ** 2]],

                self.height * top_area))))]

        for main in [lambda: sub(
            ['loop' for factor in [1, 2, 3] if sub(
                ['def'
                    for my_radius, my_height in [[10 * factor, 20 * factor]]
                    for my_cylinder in [Cylinder(my_radius, my_height)]],

                echo(u"A cylinder with a radius of %.1fcm and a height "
                     u"of %.1fcm has a volume of %.1fcm³."
                     % (my_radius, my_height, my_cylinder.volume)))])]],

    main()])()

一个半径为 10.0cm、高为 20.0cm 的圆柱体的体积为 6283.2cm³。 一个半径为20.0cm、高40.0cm的圆柱体的体积为50265.5cm³。 一个半径为 30.0cm、高为 60.0cm 的圆柱体的体积为 169646.0cm³。

请不要。


...回到你原来的例子:虽然你不能在外部范围内对flag 变量执行赋值,但你可以使用函数来修改之前赋值的值。

例如,flag 可以是我们使用setattr 设置其.value 的对象:

flag = Object(value=True)
input = [Object(name=''), Object(name='fake_name'), Object(name='')] 
output = filter(lambda o: [
    flag.value or bool(o.name),
    setattr(flag, 'value', flag.value and bool(o.name))
][0], input)
[Object(name=''), Object(name='fake_name')]

如果我们想适应上述主题,我们可以使用列表推导来代替setattr

    [None for flag.value in [bool(o.name)]]

但实际上,在严肃的代码中,如果您要进行外部赋值,您应该始终使用常规函数定义而不是 lambda

flag = Object(value=True)
def not_empty_except_first(o):
    result = flag.value or bool(o.name)
    flag.value = flag.value and bool(o.name)
    return result
input = [Object(name=""), Object(name="fake_name"), Object(name="")] 
output = filter(not_empty_except_first, input)

【讨论】:

此答案中的最后一个示例不会产生与示例相同的输出,但在我看来示例输出不正确。 简而言之,这可以归结为:使用.setattr() 和类似方法(例如,字典 也应该这样做)将副作用破解到函数代码中,很酷的代码由@JeremyBanks 显示:) 感谢assignment operator 上的注释!【参考方案2】:

您不能真正维护 filter/lambda 表达式中的状态(除非滥用全局命名空间)。但是,您可以使用在 reduce() 表达式中传递的累积结果来实现类似的效果:

>>> f = lambda a, b: (a.append(b) or a) if (b not in a) else a
>>> input = ["foo", u"", "bar", "", "", "x"]
>>> reduce(f, input, [])
['foo', u'', 'bar', 'x']
>>> 

当然,您可以稍微调整一下条件。在这种情况下,它会过滤掉重复项,但您也可以使用 a.count(""),例如,仅限制空字符串。

不用说,你可以这样做,但你真的不应该这样做。 :)

最后,你可以用纯 Python 做任何事情lambda: http://vanderwijk.info/blog/pure-lambda-calculus-python/

【讨论】:

【参考方案3】:

没有必要使用 lambda,当您可以删除 所有 null 的时候,如果输入大小发生变化,则将其放回去:

input = [Object(name=""), Object(name="fake_name"), Object(name="")] 
output = [x for x in input if x.name]
if(len(input) != len(output)):
    output.append(Object(name=""))

【讨论】:

我认为你的代码有一个小错误。第二行应该是output = [x for x in input if x.name] 元素的顺序可能很重要。【参考方案4】:

普通赋值 (=) 在 lambda 表达式中是不可能的,尽管可以与 setattr 和朋友一起执行各种技巧。

然而,解决您的问题实际上非常简单:

input = [Object(name=""), Object(name="fake_name"), Object(name="")]
output = filter(
    lambda o, _seen=set():
        not (not o and o in _seen or _seen.add(o)),
    input
    )

这会给你

[Object(Object(name=''), name='fake_name')]

如您所见,它保留了第一个空白实例,而不是最后一个。如果您需要最后一个,请反转进入filter 的列表,并反转来自filter 的列表:

output = filter(
    lambda o, _seen=set():
        not (not o and o in _seen or _seen.add(o)),
    input[::-1]
    )[::-1]

这会给你

[Object(name='fake_name'), Object(name='')]

需要注意的一件事:为了使其与任意对象一起使用,这些对象必须正确实现 __eq____hash__,如 here 所述。

【讨论】:

【参考方案5】:

更新

[o for d in [] for o in lst if o.name != "" or d.setdefault("", o) == o]

或使用filterlambda

flag = 
filter(lambda o: bool(o.name) or flag.setdefault("", o) == o, lst)

上一个答案

好的,你还在坚持使用 filter 和 lambda 吗?

似乎这会更好地与字典理解一起使用,

o.name : o for o in input.values()

我认为 Python 不允许在 lambda 中赋值的原因类似于它不允许在理解中赋值的原因,这与这些东西在 C 方面进行评估的事实有关因此可以提高我们的速度。至少这是我阅读one of Guido's essays后的印象。

我的猜测是,这也违背了在 Python 中使用一个正确的方式做任何一件事的哲学。

【讨论】:

所以这并不完全正确。它不会保留顺序,也不会保留非空字符串对象的副本。【参考方案6】:

TL;DR:使用函数式惯用语时最好编写函数式代码

正如许多人所指出的,在 Python 中不允许进行 lambda 赋值。一般来说,在使用功能性习语时,您最好以功能性方式思考,这意味着尽可能没有副作用和任务。

这是使用 lambda 的函数式解决方案。为了清楚起见,我已将 lambda 分配给 fn(而且因为它有点长)。

from operator import add
from itertools import ifilter, ifilterfalse
fn = lambda l, pred: add(list(ifilter(pred, iter(l))), [ifilterfalse(pred, iter(l)).next()])
objs = [Object(name=""), Object(name="fake_name"), Object(name="")]
fn(objs, lambda o: o.name != '')

您也可以通过稍微改变一些东西来处理迭代器而不是列表。您还有一些不同的导入。

from itertools import chain, islice, ifilter, ifilterfalse
fn = lambda l, pred: chain(ifilter(pred, iter(l)), islice(ifilterfalse(pred, iter(l)), 1))

您始终可以重新组织代码以减少语句的长度。

【讨论】:

【参考方案7】:

如果我们可以代替flag = True 进行导入,那么我认为这符合标准:

>>> from itertools import count
>>> a = ['hello', '', 'world', '', '', '', 'bob']
>>> filter(lambda L, j=count(): L or not next(j), a)
['hello', '', 'world', 'bob']

或者过滤器最好写成:

>>> filter(lambda L, blank_count=count(1): L or next(blank_count) == 1, a)

或者,只是一个简单的布尔值,没有任何导入:

filter(lambda L, use_blank=iter([True]): L or next(use_blank, False), a)

【讨论】:

【参考方案8】:

在迭代期间跟踪状态的 Python 方法是使用生成器。 itertools 的方式很难理解恕我直言,试图破解 lambdas 来做到这一点是很愚蠢的。我会尝试:

def keep_last_empty(input):
    last = None
    for item in iter(input):
        if item.name: yield item
        else: last = item
    if last is not None: yield last

output = list(keep_last_empty(input))

总体而言,可读性每次都胜过紧凑性。

【讨论】:

【参考方案9】:

不,您不能在 lambda 中放置赋值,因为它有自己的定义。如果您使用函数式编程,那么您必须假设您的值是不可变的。

一种解决方案是以下代码:

output = lambda l, name: [] if l==[] \
             else [ l[ 0 ] ] + output( l[1:], name ) if l[ 0 ].name == name \
             else output( l[1:], name ) if l[ 0 ].name == "" \
             else [ l[ 0 ] ] + output( l[1:], name )

【讨论】:

【参考方案10】:

如果您需要一个 lambda 来记住调用之间的状态,我会推荐在本地命名空间中声明的函数或具有重载 __call__ 的类。既然我对您尝试做的事情的所有警告都已排除,我们可以得到您查询的实际答案。

如果你真的需要让你的 lambda 在调用之间有一些内存,你可以这样定义它:

f = lambda o, ns = "flag":True: [ns["flag"] or o.name, ns.__setitem__("flag", ns["flag"] and o.name)][0]

那么您只需将f 传递给filter()。如果你真的需要,你可以通过以下方式取回flag 的值:

f.__defaults__[0]["flag"]

或者,您可以通过修改globals() 的结果来修改全局命名空间。不幸的是,你不能修改本地命名空间,就像修改locals() 的结果不会影响本地命名空间一样。

【讨论】:

或者直接使用原来的 Lisp:(let ((var 42)) (lambda () (setf var 43))).【参考方案11】:

您可以使用绑定函数来使用伪多语句 lambda。然后,您可以使用封装类为 Flag 启用分配。

bind = lambda x, f=(lambda y: y): f(x)

class Flag(object):
    def __init__(self, value):
        self.value = value

    def set(self, value):
        self.value = value
        return value

input = [Object(name=""), Object(name="fake_name"), Object(name="")]
flag = Flag(True)
output = filter(
            lambda o: (
                bind(flag.value, lambda orig_flag_value:
                bind(flag.set(flag.value and bool(o.name)), lambda _:
                bind(orig_flag_value or bool(o.name))))),
            input)

【讨论】:

【参考方案12】:

有点混乱的解决方法,但是 lambdas 中的赋值无论如何都是非法的,所以这并不重要。您可以使用内置的 exec() 函数从 lambda 内部运行赋值,例如以下示例:

>>> val
Traceback (most recent call last):
  File "<pyshell#31>", line 1, in <module>
    val
NameError: name 'val' is not defined
>>> d = lambda: exec('val=True', globals())
>>> d()
>>> val
True

【讨论】:

【参考方案13】:

首先,您不需要为您的工作使用本地分配,只需检查上述答案

其次,使用 locals() 和 globals() 获取变量表然后更改值很简单

检查此示例代码:

print [locals().__setitem__('x', 'Hillo :]'), x][-1]

如果您需要更改向环境添加全局变量,请尝试将 locals() 替换为 globals()

python 的 list comp 很酷,但大多数传统项目不接受这个(比如 flask :[)

希望对你有帮助

【讨论】:

您不能使用locals(),它在文档中明确指出更改它实际上不会更改本地范围(或者至少不会总是)。另一方面,globals() 按预期工作。 @JPvdMerwe 试试看,不要盲从文档。并且 lambda 中的分配已经打破规则 不幸的是它只能在全局命名空间中工作,在这种情况下你真的应该使用globals()。 pastebin.com/5Bjz1mR4(在 2.6 和 3.2 中测试)证明了这一点。

以上是关于Python中的lambda表达式内的赋值的主要内容,如果未能解决你的问题,请参考以下文章

python进阶日记(lambda函数)

带有正则表达式的 Python lambda

为啥 Python 的 `lambda` 表达式中不允许赋值?

Python中的lambdamapfilterreducezip

lambda 表达式中的赋值

主网001提案|销毁Lambda研发团队持有的7亿LAMB投票通过