Python 中那些令人防不胜防的坑

Posted bianchenjiaoshou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 中那些令人防不胜防的坑相关的知识,希望对你有一定的参考价值。

前言
文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者: Rocky0429

在学习 Python 的过程中,我为它的简洁优雅而痴迷,但它又是如此的调皮,在提供了很多舒服的功能特性之外,又悄悄挖了很多带有迷惑性的坑,令人防不胜防…

人不能两次踏入同一条河流,在无数次踩进同样的坑里之后,我觉得我有必要整理一下,一为自警,二为给大家提个醒,希望你不要和我犯相同的错误。
技术图片

0x00 走丢的外部变量

首先我们先来看这么一个例子:


e = 429

try:
   raise Exception()
except Exception as e:
   pass

print(e)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

PS:except Exception as e 可以捕获除了与程序退出(sys.exit())相关之外的所有异常。

PS:如果你缺乏最新python实战教程,可以去小编的Python技术.裙 :一久五其二二流一思(数字的谐音)转换下可以找到了

在继续向下看之前,你可以先思考一下上述例子可能出现的结果是什么,也可以自己尝试着在编译器里输入一下。思考完了请继续往下看。

出现的结果如下:


Traceback (most recent call last):
 File "test.py", line 8, in <module>
   print(e)
NameError: name ‘e‘ is not defined
  • 1
  • 2
  • 3
  • 4

竟然报错了,那么这到底是为什么呢? 

其实这是因为在 Python3 中使用 as 分配异常的时候,在 except 的末尾将会把这个异常清除掉(在 Python2 中则不会出现这样的情况)。这就好像将上面的示例变成下面的样子:


e = 429

try:
   raise Exception()
except Exception as e:
   try:
       pass
   finally:
       del e

print(e)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

通过上面的变形代码,我们可以很清楚的看明白发生这一切的根源是什么:因为 e 被删除了。这也变相的告诉我们,如果想要在 except 后面引用 e,必须将它先赋值给其它变量。 

这样看来,是变量 e 执行了 except 子句而被删除,但是为什么 e 会去执行 except 子句呢?仅仅是因为 e 和 as 后面的 e 长的一毛一样?


答案是否定的,其实这个是因为子句在 Python 中没有独立的作用域,所以上述示例中的所有内容都处于同一个作用域里,所以变量 e 会因为执行了 except 子句而被删除。



0x01 同样是加,却不一定等价

在我们来表示「加」这个概念的时候,一般我们会用两种方式:a = a + b或者是 a += b 。在很多人的概念里这两个其实就是一种,不分彼此,比如之前我就是这么认为的,直到有一天有人拿着下面的坑过来让我踩... 

首先我们先来看第一个例子:


>>> a = [1,2,3]
>>> b = a
>>> a = a + [4,5,6]
  • 1
  • 2
  • 3

一个很简单的例子,你知道此时的 a 和 b 分别是多少么?请先自己思考一下再继续向下看:


>>> a
[1, 2, 3, 4, 5, 6]
>>> b
[1, 2, 3]
  • 1
  • 2
  • 3
  • 4

估计很多人都会答对,表达式 a = a + [4,5,6] ,等号右边其实是形成了一个新的列表,最后让 a 引用了这个新的列表,而 b = a 引用的是之前的 a,所以 b 保持不变。 

明白了上面的例子,我们接下来再看一个稍微有点区别的例子:


>>> a = [1,2,3]
>>> b = a
>>> a += [4,5,6]
  • 1
  • 2
  • 3

上面的例子和文章开头的例子区别在从 + 变成了 +=,按照我们惯性思维去想,肯定以为这俩例子就是一个东西的两种不同写法而已,可实际上真的是这样吗?让我们来看一下此时的 a,b: 
>>> a
[1, 2, 3, 4, 5, 6]
>>> b
[1, 2, 3, 4, 5, 6]
  • 1
  • 2
  • 3
  • 4

咦?同样是印象里的「加」,好像真的哪里有点不一样诶。。 

通过上面我们就可以看出 a = a + b 和 a += b 并不总是表现相同,起码在列表上就是这么表现的。在这里的 a += [4,5,6] 实际上使用的是 extend 函数,所以 a 和 b 仍然指向已被修改的同一列表。


既然在这里说到了 + 和 +=,索性再多补充一点:在使用「加」的概念来连接字符串的时候,+= 其实比 + 的速度更快。


下面我们来实际的演示一下用 + 连接三个字符串:


>>> import timeit
>>> timeit.timeit("a = a + b + c", setup="a=‘a‘*10000;b=‘b‘*10000;c=‘c‘*10000",number=100)
0.07921688999340404
>>> timeit.timeit("a += b + c", setup="a=‘a‘*10000;b=‘b‘*10000;c=‘c‘*10000",number=100)
0.002059974998701364
  • 1
  • 2
  • 3
  • 4
  • 5

上面的两个结果很容易看出来,在处理速度上,+= 比 + 处理的速度要快的多。出现这样现象的原因是 += 执行的是追加操作,追加操作的话就会比 + 少了一个销毁然后新建的动作,比如在 a += b + c 上 a 就不会被销毁。 

0x02 不一般的小括号

很多学过别的编程语言的同学,很容易会忽略小括号 “()” 在 Python 中的一个重要表现,那就是小括号还能表示“元组” 这一不可变数据类型。


>>> type(())
<class ‘tuple‘>
>>> tur = (1, 2)
>>> type(tur)
<class ‘tuple‘>
  • 1
  • 2
  • 3
  • 4
  • 5

但是如果小括号内只有一个元素的话,比如像下面这样,它就是小括号内的元素类型: 
>>> tur = (1)
>>> type(tur)
<class ‘int‘>
  • 1
  • 2
  • 3

天呐个天... 

那么如果想要表示一个元素的元组咋整呢?要像下面这样:


>>> tur = (1, )
>>> type(tur)
<class ‘tuple‘>
  • 1
  • 2
  • 3

加个逗号 “,” 就 ok 啦... 

0x03 列表的删除没有那么简单

假如我们有一个列表,我想删除列表中的元素: 
>>> lst = [1, 2, 3, 4, 5]
>>> for i in lst:
... lst.remove(i)
  • 1
  • 2
  • 3

在刚开始学习 Python 之初,这是很多同学容易想到的做法,然而我们来看一下程序运行完以后的结果: 
>>> lst
[2, 4]
  • 1
  • 2

看到这个结果,我...

技术图片


这是为啥子呢?是因为在 for 循环中,如果我们删除了 index = 0 (即 1)的值,原本 index = 1 及其之后的值会向前补位,所以当前 index = 1 的值为之前 index = 2 的值。


列表的删除操作我们经常要用,所以大家要打起十二分的精神来对它。



0x04 is not 不分家

is not 在 Python 中是一伙的,用的时候要靠在一起,分开以后就是两个东西,结果会不一样…


>>> [1, 2, 3] is not None
True
>>> [1, 2, 3] is (not None)
False
 
  • 1
  • 2
  • 3
  • 4

这就在于,is not 是个单独的二元运算符,当它两侧的变量指向同一个对象的时候,结果为 False,否则结果为 True,希望引起大家的注意.

以上是关于Python 中那些令人防不胜防的坑的主要内容,如果未能解决你的问题,请参考以下文章

那些年在python中踩过的坑之error: command gcc failed with exi

致敬那些年对nginx踩过的坑

Python多线程多进程那些事儿看这篇就够了~~

那些年深度学习所踩过的坑-第一坑

那些年在某厂踩过的坑

那些短小精悍的&奇葩的&令人感到惊讶的JavaScript代码----更新中