Python基础:Python切片,浅拷贝深拷贝和赋值,排序,Reduce函数
Posted 大饼博士X
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python基础:Python切片,浅拷贝深拷贝和赋值,排序,Reduce函数相关的知识,希望对你有一定的参考价值。
文章目录
整理一下Python常用操作,包括Python切片操作、拷贝、排序、Numpy基础等,会持续更新,主要是自己mark用。主要以Python3来记录。
Python切片操作
经常会需要从某个对象中抽取部分值的情况,Python通过切片操作来实现。包括list、dict、字符串、tuple等都是可以的,且切片原理是一样的。这一部分主要参考了[1]。
索引方式包括:正索引和负索引两部分,如下图所示,以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_index、end_index、step)。当只有一个“:”时,默认第三个参数step=1;当一个“:”也没有时,start_index=end_index,表示切取start_index指定的那个元素。
object[start_index:end_index:step]
-
start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
-
end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。
-
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。
基本用法
>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[0]
0
>>>a[-4]
6
当索引只有一个数时,表示切取某一个元素。
>>>a[:]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
从左往右取全部
>>>a[::]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
从左往右取全部
>>>a[::-1]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
从右往左倒序取,这几个很常用
>>>b = a[::2]
[0, 2, 4, 6, 8]
取偶数
>>>b = a[1::2]
[1, 3, 5, 7, 9]
取奇数
需要注意:“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的a[0]=0、a[-4]=6,元素0和6都是“数值型”,而母对象a却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如a[-1:]=[9],返回的是一个只包含元素“9”的list,而非数值型“9”。
根据索引取部分数据
>>>a[1:6]
[1, 2, 3, 4, 5]
step=1,从左往右取值,start_index=1到end_index=6同样表示从左往右取值。
>>>a[1:6:-1]
[]
输出为空列表,说明没取到数据。
step=-1,决定了从右往左取值,而start_index=1到end_index=6决定了从左往右取值,
两者矛盾,所以为空。
>>>a[:6]
[0, 1, 2, 3, 4, 5]
step=1,表示从左往右取值,而start_index省略时,表示从端点开始,
因此这里的端点是“起点”,即从“起点”值0开始一直取到end_index=6(该点不包括)。
>>>a[:6:-1]
[9, 8, 7]
step=-1,从右往左取值,而start_index省略时,表示从端点开始,
因此这里的端点是“终点”,即从“终点”值9开始一直取到end_index=6(该点不包括)。
>>>a[-1:-6]
[]
step=1,从左往右取值,而start_index=-1到end_index=-6决定了从右往左取值,两者矛盾,所以为空。
索引-1在-6的右边
>>>a[-1:-6:-1]
[9, 8, 7, 6, 5]
step=-1,从右往左取值,start_index=-1到end_index=-6同样是从右往左取值。
>>>a[:-6]
[0, 1, 2, 3]
step=1,从左往右取值,从“起点”开始一直取到end_index=-6(该点不包括)。
>>>a[-6::-1]
[4, 3, 2, 1, 0]
step=-1,从右往左取值,从start_index=-6开始,一直取到“起点”。
>>>a[-1:6:-1]
[9, 8, 7]
start_index=-1在end_index=6的右边,因此从右往左取值,而step=-1同样决定了从右往左取值,因此结果正确。
>>>a[2+1:3*2:7%3]
[3, 4, 5]
即:a[2+1:3*2:7%3] = a[3:6:1]
注意:
-
start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
-
当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
-
step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9),原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有9一个元素。
多层切片
>>>a[:8][2:5][-1:]
[4]
相当于:
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = [4]
理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。
其他对象的切片操作
>>> (0, 1, 2, 3, 4, 5)[:3]
(0, 1, 2)
元组的切片操作
>>>'ABCDEFG'[::2]
'ACEG'
字符串的切片操作
>>>for i in range(1,100)[2::3][-5:]:
print(i)
87
90
93
96
99
就是利用range()函数生成1-99的整数,然后从start_index=2(即3)开始以step=3取值,
直到终点,再在新序列中取最后五个数。
修改单个元素、在某个位置插入元素
>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
修该第四个元素为一个list
>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
插入几个元素,而不是修该,也不是插入一个list
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Python赋值、浅拷贝、深拷贝的区别
[:]和.copy()都属于“浅拷贝”,只拷贝最外层元素,外层元素是独立内存;内层嵌套元素则通过引用方式共享,而非独立分配内存。使用 copy 模块的 copy.copy( 浅拷贝 )和 copy.deepcopy(深拷贝),其中deepcopy是构建了一个完全独立的对象。
1、b = a: 赋值引用,a 和 b 都指向同一个对象。
2、b = a.copy(): 浅拷贝, a 和 b 是一个独立的对象,但他们的子对象(内层嵌套对象)还是指向统一对象(是引用)。
3、b = copy.deepcopy(a): 深度拷贝, a 和 b 完全拷贝了父对象及其子对象,两者是完全独立的。
例子:
>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>b = a[:]
>>>print(b)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #41946376
>>>print(id(b)) #41921864
或
>>>b = a.copy()
>>>print(b)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #39783752
>>>print(id(b)) #39759176
>>>a = [1,2,['A','B']]
>>>print('a='.format(a))
>>>b = a[:]
>>>b[0] = 9 #修改b的最外层元素,将1变成9
>>>b[2][0] = 'D' #修改b的内嵌层元素
>>>print('a='.format(a))
>>>print('b='.format(b))
>>>print('id(a)='.format(id(a)))
>>>print('id(b)='.format(id(b)))
a=[1, 2, ['A', 'B']] #原始a
a=[1, 2, ['D', 'B']] #b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。
b=[9, 2, ['D', 'B']] #修改后的b
id(a)=38669128
id(b)=38669192
深拷贝:
import copy
a = [1, 2, 3, 4, ['a', 'b']] #原始对象
b = a #赋值,传对象的引用
c = copy.copy(a) #对象拷贝,浅拷贝
d = copy.deepcopy(a) #对象拷贝,深拷贝
a.append(5) #修改对象a
a[4].append('c') #修改对象a中的['a', 'b']数组对象
print( 'a = ', a )
print( 'b = ', b )
print( 'c = ', c )
print( 'd = ', d )
输出:
'a = ', [1, 2, 3, 4, ['a', 'b', 'c'], 5]
'b = ', [1, 2, 3, 4, ['a', 'b', 'c'], 5]
'c = ', [1, 2, 3, 4, ['a', 'b', 'c']]
'd = ', [1, 2, 3, 4, ['a', 'b']]
Python常用内置对象的排序
Python中对各种数据结构:列表、元组、字典(list、tuple、dict)进行排序,用到sort、sorted、heapq、Counter等[4]。
sort
sort 是对 list 进行原地址排序,也就是改变原有的 list 。因此,不会增加内存的占用,但会产出数据被修改的副作用
>>>x = [2, 5, 3, 4, 1]
>>>x.sort()
>>>print(x)
[1, 2, 3, 4, 5]
从小到大排序
>>>x = [2, 5, 3, 4, 1]
>>>x.sort(reverse=True)
>>>print(x)
[5, 4, 3, 2, 1]
从大到小排序
sorted
很多时候,我们只是想得到排序的结果,而不想改变原数据。sorted 则没有对原数据进行操作,而是构建一个新的数据,这样就保留了原数据,但会增加内存的占用。不过,sorted 要比 sort 适用更广泛,可以应用于 list 、tuple 和 dict 等数据结构。
x = [2, 5, 3, 4, 1]
y = sorted(x, reverse=True)
print('x:', x)
print('y:', y)
x: [2, 5, 3, 4, 1]
y: [5, 4, 3, 2, 1]
这与 sort 的基础用法很类似,但接下来就是 sorted 强大之处了,可以对字典按照value排序
a = 'a': 2, 'b': 5, 'c': 3, 'd': 4, 'e': 1
b = sorted(a.items(), key=lambda x: x[1], reverse=True)
print(b)
[('b', 5), ('d', 4), ('c', 3), ('a', 2), ('e', 1)]
heapq
有时候,我们需要 动态 地进行排序,快速找出 TOP 的数据,此时 heapq (堆排序)就可以大显身手了。普通排序和sorted比没什么优势,如果遇到动态添加数据的时候,它的优势就显现出来了,比如:在线投票,需要实时出现结果。如果用 sorted 排序,那么每次都需要重排,时间复杂度极高。heapd 可以持续往里面添加,并快速完成新元素的排序。
import heapq
x = [2, 5, 3, 4, 1]
heap = []
for i in x:
heapq.heappush(heap, i)
print(heap[:])
[1, 2, 3, 4, 5]
实现堆排序
print([heapq.heappop(heap) for _ in range(len(x))])
[1, 2,以上是关于Python基础:Python切片,浅拷贝深拷贝和赋值,排序,Reduce函数的主要内容,如果未能解决你的问题,请参考以下文章