20个Python使用小技巧,建议收藏~

Posted 骨灰级收藏家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了20个Python使用小技巧,建议收藏~相关的知识,希望对你有一定的参考价值。

1、易混淆操作

本节对一些 Python 易混淆的操作进行对比。

1.1 有放回随机采样和无放回随机采样

import random
random.choices(seq, k=1)  # 长度为k的list,有放回采样
random.sample(seq, k)     # 长度为k的list,无放回采样

1.2 lambda 函数的参数

func = lambda y: x + y          # x的值在函数运行时被绑定
func = lambda y, x=x: x + y     # x的值在函数定义时被绑定

1.3 copy 和 deepcopy

import copy
y = copy.copy(x)      # 只复制最顶层
y = copy.deepcopy(x)  # 复制所有嵌套部分

复制和变量别名结合在一起时,容易混淆:

a = [1, 2, [3, 4]]

# Alias.
b_alias = a  
assert b_alias == a and b_alias is a

# Shallow copy.
b_shallow_copy = a[:]  
assert b_shallow_copy == a and b_shallow_copy is not a and b_shallow_copy[2] is a[2]

# Deep copy.
import copy
b_deep_copy = copy.deepcopy(a)  
assert b_deep_copy == a and b_deep_copy is not a and b_deep_copy[2] is not a[2]

对别名的修改会影响原变量,(浅)复制中的元素是原列表中元素的别名,而深层复制是递归的进行复制,对深层复制的修改不影响原变量。

2、常用工具

2.1 读写 CSV 文件

import csv
# 无header的读写
with open(name, 'rt', encoding='utf-8', newline='') as f:  # newline=''让Python不将换行统一处理
    for row in csv.reader(f):
        print(row[0], row[1])  # CSV读到的数据都是str类型
with open(name, mode='wt') as f:
    f_csv = csv.writer(f)
    f_csv.writerow(['symbol', 'change'])

# 有header的读写
with open(name, mode='rt', newline='') as f:
    for row in csv.DictReader(f):
        print(row['symbol'], row['change'])
with open(name, mode='wt') as f:
    header = ['symbol', 'change']
    f_csv = csv.DictWriter(f, header)
    f_csv.writeheader()
    f_csv.writerow('symbol': xx, 'change': xx)

注意,当 CSV 文件过大时会报错:_csv.Error: field larger than field limit (131072),通过修改上限解决

import sys
csv.field_size_limit(sys.maxsize)

csv 还可以读以 \\t 分割的数据

f = csv.reader(f, delimiter='\\t')

2.2 迭代器工具

itertools 中定义了很多迭代器工具,例如子序列工具:

import itertools
itertools.islice(iterable, start=None, stop, step=None)
# islice('ABCDEF', 2, None) -> C, D, E, F

itertools.filterfalse(predicate, iterable)         # 过滤掉predicate为False的元素
# filterfalse(lambda x: x < 5, [1, 4, 6, 4, 1]) -> 6

itertools.takewhile(predicate, iterable)           # 当predicate为False时停止迭代
# takewhile(lambda x: x < 5, [1, 4, 6, 4, 1]) -> 1, 4

itertools.dropwhile(predicate, iterable)           # 当predicate为False时开始迭代
# dropwhile(lambda x: x < 5, [1, 4, 6, 4, 1]) -> 6, 4, 1

itertools.compress(iterable, selectors)            # 根据selectors每个元素是True或False进行选择
# compress('ABCDEF', [1, 0, 1, 0, 1, 1]) -> A, C, E, F

序列排序:

sorted(iterable, key=None, reverse=False)

itertools.groupby(iterable, key=None)              # 按值分组,iterable需要先被排序
# groupby(sorted([1, 4, 6, 4, 1])) -> (1, iter1), (4, iter4), (6, iter6)

itertools.permutations(iterable, r=None)           # 排列,返回值是Tuple
# permutations('ABCD', 2) -> AB, AC, AD, BA, BC, BD, CA, CB, CD, DA, DB, DC

itertools.combinations(iterable, r=None)           # 组合,返回值是Tuple
itertools.combinations_with_replacement(...)
# combinations('ABCD', 2) -> AB, AC, AD, BC, BD, CD

多个序列合并:

itertools.chain(*iterables)                        # 多个序列直接拼接
# chain('ABC', 'DEF') -> A, B, C, D, E, F

import heapq
heapq.merge(*iterables, key=None, reverse=False)   # 多个序列按顺序拼接
# merge('ABF', 'CDE') -> A, B, C, D, E, F

zip(*iterables)                                    # 当最短的序列耗尽时停止,结果只能被消耗一次
itertools.zip_longest(*iterables, fillvalue=None)  # 当最长的序列耗尽时停止,结果只能被消耗一次

2.3 计数器

计数器可以统计一个可迭代对象中每个元素出现的次数。

import collections
# 创建
collections.Counter(iterable)

# 频次
collections.Counter[key]                 # key出现频次
# 返回n个出现频次最高的元素和其对应出现频次,如果n为None,返回所有元素
collections.Counter.most_common(n=None)

# 插入/更新
collections.Counter.update(iterable)
counter1 + counter2; counter1 - counter2  # counter加减

# 检查两个字符串的组成元素是否相同
collections.Counter(list1) == collections.Counter(list2)

2.4 带默认值的 Dict

当访问不存在的 Key 时,defaultdict 会将其设置为某个默认值。

import collections
collections.defaultdict(type)  # 当第一次访问dict[key]时,会无参数调用type,给dict[key]提供一个初始值

2.5 有序 Dict

import collections
collections.OrderedDict(items=None)  # 迭代时保留原始插入顺序

3、高性能编程和调试

3.1 输出错误和警告信息

向标准错误输出信息

import sys
sys.stderr.write('')

输出警告信息

import warnings
warnings.warn(message, category=UserWarning)  
# category的取值有DeprecationWarning, SyntaxWarning, RuntimeWarning, ResourceWarning, FutureWarning

控制警告消息的输出

$ python -W all     # 输出所有警告,等同于设置warnings.simplefilter('always')
$ python -W ignore  # 忽略所有警告,等同于设置warnings.simplefilter('ignore')
$ python -W error   # 将所有警告转换为异常,等同于设置warnings.simplefilter('error')

3.2 代码中测试

有时为了调试,我们想在代码中加一些代码,通常是一些 print 语句,可以写为:

# 在代码中的debug部分
if __debug__:
    pass

一旦调试结束,通过在命令行执行 -O 选项,会忽略这部分代码:

$ python -0 main.py

3.3 代码风格检查

使用 pylint 可以进行不少的代码风格和语法检查,能在运行之前发现一些错误

pylint main.py

3.4 代码耗时

耗时测试

$ python -m cProfile main.py

测试某代码块耗时

# 代码块耗时定义
from contextlib import contextmanager
from time import perf_counter

@contextmanager
def timeblock(label):
    tic = perf_counter()
    try:
        yield
    finally:
        toc = perf_counter()
        print('%s : %s' % (label, toc - tic))

# 代码块耗时测试
with timeblock('counting'):
    pass

代码耗时优化的一些原则

专注于优化产生性能瓶颈的地方,而不是全部代码。

避免使用全局变量。局部变量的查找比全局变量更快,将全局变量的代码定义在函数中运行通常会快 15%-30%。

避免使用.访问属性。使用 from module import name 会更快,将频繁访问的类的成员变量 self.member 放入到一个局部变量中。

尽量使用内置数据结构。str, list, set, dict 等使用 C 实现,运行起来很快。

避免创建没有必要的中间变量,和 copy.deepcopy()。

字符串拼接,例如 a + ':' + b + ':' + c 会创造大量无用的中间变量,':',join([a, b, c]) 效率会高不少。另外需要考虑字符串拼接是否必要,例如 print(':'.join([a, b, c])) 效率比 print(a, b, c, sep=':') 低。

学习Python,这29个实用小技巧你如果不知道的话,那亏大了!纯干货,建议收藏

前言

先收藏,再点赞,今后好运定不断!

各位CSDN上的朋友们大家好,先厚脸皮讨要个三连支持吧!希望这篇文章能帮助到你!

好了!废话不多说,直接上干货:

1、使用字典来存储选择操作

我们能构造一个字典来存储表达式:

In [70]: stdacl = { 
    ...: 'sum':lambda x,y : x + y,
    ...: 'subtract':lambda x,y : x - y 
    ...: } 
 
In [73]: stdacl['sum'](9,3) 
Out[73]: 12
 
In [74]: stdacl['subtract'](9,3) 
Out[74]: 6

2、一行代码计算任何数的阶乘

python3环境:

In [75]: import functools
 
In [76]: result = ( lambda k : functools.reduce(int.__mul__,range(1,k+1),1))(3) 
 
In [77]: result
Out[77]: 6

3、找到列表中出现最频繁的数

 
In [82]: test = [1,2,3,4,2,2,3,1,4,4,4] 
 
In [83]: print(max(set(test),key=test.count)) 
4

4、重置递归限制

Python 限制递归次数到 1000,我们可以重置这个值:

import sys
 
x=1001
print(sys.getrecursionlimit())
 
sys.setrecursionlimit(x)
print(sys.getrecursionlimit())
 
#1-> 1000
#2-> 100

5、原地交换两个数字

Python 提供了一个直观的在一行代码中赋值与交换(变量值)的方法,请参见下面的示例:

In [1]: x,y = 10 ,20 
 
In [2]: print(x,y)
10 20
 
In [3]: x, y = y, x 
 
In [4]: print(x,y)
20 10

赋值的右侧形成了一个新的元组,左侧立即解析(unpack)那个(未被引用的)元组到变量 和 。

一旦赋值完成,新的元组变成了未被引用状态并且被标记为可被垃圾回收,最终也完成了变量的交换。


6、链状比较操作符

比较操作符的聚合是另一个有时很方便的技巧:

In [5]: n = 10 
 
In [6]: result = 1 < n < 20 
 
In [7]: result 
Out[7]: True
 
In [8]: result = 1 > n <= 9 
 
In [9]: result 
Out[9]: False

7、使用三元操作符来进行条件赋值

三元操作符是 if-else 语句也就是条件操作符的一个快捷方式:

[表达式为真的返回值] if [表达式] else [表达式为假的返回值]

这里给出几个你可以用来使代码紧凑简洁的例子。下面的语句是说“如果 y 是 9,给 x 赋值 10,不然赋值为 20”。如果需要的话我们也可以延长这条操作链。

x = 10 if (y == 9) else 20

同样地,我们可以对类做这种操作:

x = (classA if y == 1 else classB)(param1, param2)

在上面的例子里 classA 与 classB 是两个类,其中一个类的构造函数会被调用.

下面是另一个多个条件表达式链接起来用以计算最小值的例子:

In [10]: def small(a,b,c):
    ...:     return a if a<=b and a<=c else ( b if b<=a and b<=c else c) 
    ...: 
 
In [11]: small(1,0,1)
Out[11]: 0
 
In [12]: small(1,2,3)
Out[12]: 1

我们甚至可以在列表推导中使用三元运算符:

In [14]: [ m**2 if m > 10 else m**4 for m in range(20) ] 
Out[14]: 
[0,1,16,81,256,625,1296,2401,4096,6561,10000,121,144,169,196,225,256,289,324,61]

8、检查一个对象的内存使用

在 Python 2.7 中,一个 32 比特的整数占用 24 字节,在 Python 3.5 中利用 28 字节。为确定内存使用,我们可以调用 getsizeof 方法:

python2.7import sys
    x=1
    print(sys.getsizeof(x))
     
    #-> 24

python3:

    In [86]: import sys 
     
    In [87]: x = 1
     
    In [88]: sys.getsizeof(x) 
    Out[88]: 28

9、使用slots来减少内存开支

你是否注意到你的 Python 应用占用许多资源特别是内存?有一个技巧是使用 slots 类变量来在一定程度上减少内存开支。


```python
   import sys
    class FileSystem(object):
     
        def __init__(self, files, folders, devices):
            self.files = files
            self.folders = folders
            self.devices = devices
    print(sys.getsizeof( FileSystem ))
     
    class FileSystem1(object):
     
        __slots__ = ['files', 'folders', 'devices']
        def __init__(self, files, folders, devices):
            self.files = files
            self.folders = folders
            self.devices = devices
     
    print(sys.getsizeof( FileSystem1 ))
    #In Python 3.5
    #1-> 1016
    #2-> 888

很明显,你可以从结果中看到确实有内存使用上的节省,但是你只应该在一个类的内存开销不必要得大时才使用 slots。只在对应用进行性能分析后才使用它,不然地话,你只是使得代码难以改变而没有真正的益处。


10、使用lambda来模仿输出方法

 In [89]: import sys 
     
    In [90]: lprint = lambda *args: sys.stdout.write("".join(map(str,args))) 
     
    In [91]: lprint("python","tips",1000,1001) 
    Out[91]: pythontips1000100118

11、从两个相关的序列构建一个字典

In [92]: t1 = (1,2,3) 
 
In [93]: t2 =(10,20,30) 
 
In [94]: dict(zip(t1,t2)) 
Out[94]: {1: 10, 2: 20, 3: 30}

12、一行代码搜索字符串的多个前后缀

In [95]: print("http://www.google.com".startswith(("http://", "https://")))
True
 
In [96]: print("http://www.google.co.uk".endswith((".com", ".co.uk")))
True

13、在Python中实现一个真正的switch-case语句

下面的代码使用一个字典来模拟构造一个switch-case。

   In [104]: def xswitch(x):
         ...:     return xswitch._system_dict.get(x, None) 
         ...: 
     
    In [105]: xswitch._system_dict = {'files': 10, 'folders': 5, 'devices': 2}
     
    In [106]: print(xswitch('default'))
    None
     
    In [107]: print(xswitch('devices'))
    2

14、多行字符串

基本的方式是使用源于 C 语言的反斜杠:

 In [20]: multistr = " select * from multi_row \\
        ...: where row_id < 5"
    In [21]: multistr
    Out[21]: ' select * from multi_row where row_id < 5'

另一个技巧是使用三引号

In [23]: multistr ="""select * from multi_row 
    ...: where row_id < 5"""
 
In [24]: multistr
Out[24]: 'select * from multi_row \\nwhere row_id < 5'

上面方法共有的问题是缺少合适的缩进,如果我们尝试缩进会在字符串中插入空格。所以最后的解决方案是将字符串分为多行并且将整个字符串包含在括号中:

In [25]: multistr = ("select * from multi_row "
    ...: "where row_id < 5 " 
    ...: "order by age")  
In [26]: multistr
Out[26]: 'select * from multi_row where row_id < 5 order by age'

15、存储列表元素到新的变量中

我们可以使用列表来初始化多个变量,在解析列表时,变量的数目不应该超过列表中的元素个数:【译者注:元素个数与列表长度应该严格相同,不然会报错】

In [27]: testlist = [1,2,3] 
 
In [28]: x,y,z = testlist 
 
In [29]: print(x,y,z) 
1 2 3

16、四种翻转字符串/列表的方式

翻转列表本身

In [49]: testList = [1, 3, 5] 
 
In [50]: testList.reverse() 
 
In [51]: testList
Out[51]: [5, 3, 1]

在一个循环中翻转并迭代输出

In [52]: for element in reversed([1,3,5]):
    ...:     print(element) 
    ...:     
5
3
1

一行代码翻转字符串

In [53]: "Test Python"[::-1]
Out[53]: 'nohtyP tseT'

使用切片翻转列表

[1, 3, 5][::-1]

17.玩转枚举

使用枚举可以在循环中方便地找到(当前的)索引:

In [54]: testList= [10,20,30] 
 
In [55]: for i,value in enumerate(testList):
    ...:     print(i,':',value)
    ...:     
0 : 10
1 : 20
2 : 30

18.在python中使用枚举量

我们可以使用下面的方式来定义枚举量:

In [56]: class Shapes:
    ...:     Circle,Square,Triangle,Quadrangle = range(4) 
    ...:     
 
In [57]: Shapes.Circle
Out[57]: 0
 
In [58]: Shapes.Square
Out[58]: 1
 
In [59]: Shapes.Triangle
Out[59]: 2
 
In [60]: Shapes.Quadrangle
Out[60]: 3

19.从方法中返回多个值

并没有太多编程语言支持这个特性,然而 Python 中的方法确实(可以)返回多个值,请参见下面的例子来看看这是如何工作的:

In [61]: def x():
    ...:     return 1,2,3,4 
    ...: 
 
In [62]: a,b,c,d = x()
 
In [63]: print(a,b,c,d) 
1 2 3 4

20.打印引入模块的文件路径

如果你想知道引用到代码中模块的绝对路径,可以使用下面的技巧:

In [30]: import threading 
 
In [31]: import socket 
 
In [32]: print(threading)
<module 'threading' from '/usr/local/lib/python3.5/threading.py'>
 
In [33]: print(socket) 
<module 'socket' from '/usr/local/lib/python3.5/socket.py'>

21.交互环境下的"_"操作符

这是一个我们大多数人不知道的有用特性,在 Python 控制台,不论何时我们测试一个表达式或者调用一个方法,结果都会分配给一个临时变量: _(一个下划线)。

In [34]: 2 + 3 
Out[34]: 5
 
In [35]: _
Out[35]: 5
 
In [36]: print(_) 
5

“_” 是上一个执行的表达式的输出。


22.字典/集合推导式

与我们使用的列表推导相似,我们也可以使用字典/集合推导,它们使用起来简单且有效,下面是一个例子:

In [37]: testDict = {i : i*i for i in range(5)} 
 
In [38]: testSet = { i*2 for i in range(5)} 
 
In [39]: testDict
Out[39]: {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
 
In [40]: testSet
Out[40]: {0, 2, 4, 6, 8}

注:两个语句中只有一个 <:> 的不同,另,在 Python3 中运行上述代码时,将 改为 。


23、调试脚本

我们可以在 模块的帮助下在 Python 脚本中设置断点,下面是一个例子:

import pdb
pdb.set_trace()

我们可以在脚本中任何位置指定 <pdb.set_trace()> 并且在那里设置一个断点,相当简便。


24、开启文件分享

Python 允许运行一个 HTTP 服务器来从根路径共享文件,下面是开启服务器的命令:(python3环境)

python3 -m http.server

上面的命令会在默认端口也就是 8000 开启一个服务器,你可以将一个自定义的端口号以最后一个参数的方式传递到上面的命令中。

Paste_Image.png

25、检查Python中的对象

我们可以通过调用 dir() 方法来检查 Python 中的对象,下面是一个简单的例子:

In [41]: test = [1,3,5,7]
 
In [42]: print(dir(test)) 
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 以上是关于20个Python使用小技巧,建议收藏~的主要内容,如果未能解决你的问题,请参考以下文章

赶快收藏,好用到起飞的 30 个 Python 小技巧

建议收藏17个XML布局小技巧

建议收藏17个XML布局小技巧

速度收藏20个常用的Python技巧,太赞啦

收藏喜+1!值得使用的100个Python小技巧

31个好用的 Python 字符串方法,建议收藏!