为啥全局变量是邪恶的? [关闭]

Posted

技术标签:

【中文标题】为啥全局变量是邪恶的? [关闭]【英文标题】:Why are global variables evil? [closed]为什么全局变量是邪恶的? [关闭] 【发布时间】:2013-10-10 02:25:37 【问题描述】:

我试图找出为什么使用global 被认为在python(以及一般编程)中是不好的做法。有人可以解释一下吗?包含更多信息的链接也将不胜感激。

【问题讨论】:

【参考方案1】:

这与 Python 无关;全局变量在任何编程语言中都是不好的。

但是,全局常量在概念上与全局变量不同;全局常量是完全无害的。在 Python 中,两者之间的区别纯粹是按照惯例:CONSTANTS_ARE_CAPITALIZEDglobals_are_not

全局变量不好的原因是它们使函数具有隐藏(不明显、令人惊讶、难以检测、难以诊断)的副作用,从而导致复杂性增加,可能导致Spaghetti code。

但是,即使在函数式编程中,合理地使用全局状态(局部状态和可变性也是如此)是可以接受的,无论是用于算法优化、降低复杂性、缓存和记忆,还是用于移植源自主要命令式代码库的结构的实用性。

总而言之,您的问题可以通过多种方式得到解答,因此您最好的选择就是在 Google 上搜索“为什么全局变量不好”。一些例子:

Global Variables Are Bad - Wiki Wiki Web Why is Global State so Evil? - Software Engineering Stack Exchange Are global variables bad?

如果您想更深入地了解为什么会出现副作用以及许多其他启发性的东西,您应该学习函数式编程:

Side effect (computer science) - Wikipedia Why are side-effects considered evil in functional programming? - Software Engineering Stack Exchange Functional programming - Wikipedia

【讨论】:

【参考方案2】:

是的,理论上,全局变量(以及一般的“状态”)是邪恶的。实际上,如果您查看 python 的包目录,您会发现那里的大多数模块都以一堆全局声明开头。显然,人们对它们没有任何问题。

特别是对于 python,全局变量的可见性仅限于一个模块,因此没有“真正的”全局变量会影响整个程序——这使得它们的危害更小。还有一点:没有const,所以当你需要一个常量时,你必须使用一个全局变量。

在我的实践中,如果我碰巧修改了函数中的全局变量,我总是使用global 声明它,即使技术上不需要这样做,例如:

cache = 

def foo(args):
    global cache

    cache[args] = ...

这使得全局变量的操作更容易追踪。

【讨论】:

在很多方面,python中的模块类似于单例类,模块全局类似于类属性。 @CorleyBrigman:单例类实际上经常遇到通常归因于全局变量的相同问题 :) python 模块的可见性不限于一个模块。它们在整个解释器中都可用,并且(重要的是)那里的变化会影响整个解释器。它不像您创建实例的字符串......就像修改所有字符串实例一样。猴子修补气味。 大多数模块不是从定义全局except常量开始的。全局变量不好意味着 variables / global state 不是常量。 使用全局变量是一个可怕的想法,一个原因可能是无法正确测试更新“某处”存在的任意字典的函数。具有全局变量的代码库实际上无法证明是有效的。【参考方案3】:

关于这个话题的个人观点是,在函数逻辑中使用全局变量意味着其他一些代码可以改变该函数的逻辑和预期输出,这将使调试变得非常困难(尤其是在大型项目中)并且会也让测试更难。

此外,如果您考虑其他人阅读您的代码(开源社区、同事等),他们将很难理解全局变量的设置位置、更改的位置以及对该全局变量的期望变量而不是孤立的函数,它的功能可以通过读取函数定义本身来确定。

(可能)违反纯函数定义

我相信干净且(几乎)没有错误的代码应该具有尽可能纯的功能(请参阅pure functions)。纯函数是具有以下条件的函数:

    函数总是在给定相同参数值的情况下评估相同的结果值。函数结果值不能依赖于在程序执行过程中或程序的不同执行之间可能发生变化的任何隐藏信息或状态,也不能依赖于来自 I/O 设备的任何外部输入(通常——见下文)。 结果评估不会导致任何语义上可观察到的副作用或输出,例如可变对象的突变或输出到 I/O 设备。

拥有全局变量至少违反了上述其中一项,因为外部代码可能会导致意外结果。

对纯函数的另一个明确定义:“纯函数是将其所有输入作为显式参数并产生其所有输出作为显式结果的函数。” [1]。拥有全局变量违反了纯函数的概念,因为输入和可能的输出之一(全局变量)并未明确给出或返回。

(可能)违反单元测试 F.I.R.S.T 原则

进一步说,如果您考虑单元测试和 FIRST 原则(Fast 测试,I独立测试,Repeatable, Self-Validating 和 Timely)可能会违反独立测试原则(这意味着测试不相互依赖)。

拥有一个全局变量(并非总是如此),但在大多数情况下(至少到目前为止我所看到的情况)是准备并将结果传递给其他函数。这也违反了这个原则。如果全局变量以这种方式使用(即函数 X 中使用的全局变量必须首先在函数 Y 中设置),则意味着要对函数 X 进行单元测试,您必须先运行测试/运行函数 Y。

全局变量作为常量

另一方面,正如其他人已经提到的那样,如果将全局变量用作“常量”变量可能会稍微好一些,因为该语言不支持常量。但是,我总是更喜欢使用类并将“常量”作为类成员,而根本不使用全局变量。如果您有两个不同的类需要共享一个全局变量的代码,那么您可能需要重构您的解决方案并使您的类独立。

我认为不应该使用全局变量。但如果使用它们,作者应该考虑一些原则(可能是上面提到的那些以及其他软件工程原则和良好实践),以获得更干净且几乎没有错误的代码。

【讨论】:

我喜欢“作为常量的全局变量是个问题”……因为如果你在做 OO 设计……确实如此。为什么除了 IdCreator 类之外的任何人都需要知道 ID_LEN ?【参考方案4】:

它们是必不可少的,屏幕就是一个很好的例子。然而,在多线程环境中或涉及许多开发人员时,实际上经常会出现这样的问题:谁(错误地)设置或清除了它?根据架构的不同,分析的成本可能很高并且经常需要。虽然读取全局变量是可以的,但写入它必须受到控制,例如通过单个线程或线程安全类。因此,全球 vars 产生了对高开发成本的恐惧,其后果可能是它们本身被认为是邪恶的。因此,一般来说,保持全局变量的数量较少是一种很好的做法。

【讨论】:

以上是关于为啥全局变量是邪恶的? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

JS全局变量是全局对象的属性,函数局部变量为啥就不是函数的属性呢?

C语言所有变量都默认为auto,全局变量不能为auto,那全局变量默认为啥?

为啥typescript不能直接引用第三方js库的全局变量?

如果“实用程序”类是邪恶的,我应该把我的通用代码放在哪里? [关闭]

为啥lua语言中使用全局变量就会造成内存泄漏

为啥多处理工作者不能更改全局变量? [复制]