2.python基础之—列表,元组,字典,集合,字符串的使用方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.python基础之—列表,元组,字典,集合,字符串的使用方法相关的知识,希望对你有一定的参考价值。

一.关于python序列的简介。

python里面的序列大部分都可以执行,索引,切片,加,乘,检查长度,以及检查某个成员是否存在,甚至还可以找出这个序列中最小的元素和最大的元素,并且序列都是可迭代的。

解释下个人理解的迭代,迭代(iteration),序列中的迭代就是对序列中的每个元素重复执行某些操作/

具体的迭代方式后面会说到。


下面就说说python序列的共有特点。

1.索引

一个序列中,所有的元素都有自己的编号,这个编号是从0开始的,这个编号就是所谓的索引,这些元素可以通过索引来依次访问。下面就拿字符串类型举个例子,字符串在python中也是序列的一种。

test = "suhaozhi"

print test[0] (打印序列中的第一个元素,也就是打印字符串的第一个字符。)

s

根据上面的示例就可以看出,python中的字符串就是由字符组成的序列,索引0指向了序列中的第一个元素,在这个例子中就是s。

python中几乎所有的序列都可以使用这种索引,如果索引是负数时,python会从右边,也就是最后一个元素开始计数,如果想直接取序列中最后一个元素的话,可以直接使用-1。

test = "suhaozhi"

print test[-1]

i


2.分片

如果说索引一次只能访问序列中的一个元素,那么分片就可以通过索引一次访问序列中的一段(一个范围的)元素。

分片操作通过冒号隔开两个索引来实现。

假如说现在定义了一个变量,这个变量里是个字符串,字符串的内容是www.baidu.com,现在要通过分片取出前面的三个字符‘www’,操作方法如下。

url = ‘www.baidu.com‘

print url[0:3]

www

第一个索引“0”是要提取的第一个元素编号(开头)而最后一个索引“3”责是分片之后!剩余部分!的第一个元素号。

分片操作的视线是需要两个索引作为边界,第1个索引的元素是包含在分片内的,第二个不包含在分片内。


那么假如说这个字符串的长度未知,我只想取最后三个字符,该如何操作呢?

url = ‘www.baidu.com‘

print url[-3:]

com

如果分片获取到的部分需要包括结尾的元素,那么后面的索引就需要为空。

这种方法也可以用在开始的元素上。

url = ‘www.baidu.com‘

print url[:3]

www



3.分片之步长。

在对序列进行分片的时候,开始和结束都需要指定,而另一个参数“步长”,这个参数是隐藏的,默认值是1,我们的分片操作就是按照步长来逐个遍历序列中的元素,然后返回开始和结束点之间所有的元素。

比如说以下面这个列表为例:

我们对下面这个列表做一个分片操作。

l1 = [1,2,3,4,5,6,7,8,9,10]

现在要取这个列表中的1到9。

print l1[0:9:1]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

其中0:9:1前面的0:9前面已经解释过了,是开始和结束的位置,最后一个1就是步长参数,不管这个参数写不写,默认就是1。

如果步长被设置为比1大的数,那么就会跳过某些元素,比如说将步长设置为2,就会出现以下效果。

l1 = [1,2,3,4,5,6,7,8,9,10]

print l1[0:9:2]

[1, 3, 5, 7, 9]

每取一个元素都会跳过一个元素。

补充一点!:步长不可以为0,但是可以为负数!如果步长设置为负数,那么就会从右向左开始取元素。

l1 = [1,2,3,4,5,6,7,8,9,10]

print l1[::-1]

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]

如果说开始的元素包括在结果之中,结束的元素,不能在分片之内,当使用一个负数作为步长的时候,开始的索引节点必须大于结束的索引!!!!对于一个正数的步长,python会从序列的头部(左)向右开始提取元素,但是对于负数的步长,则是从序列的尾部(右)开始向左提取元素!!所以说,如果要使用负数作为步长,那么开始的索引要大于结束的索引。


4.序列之间的相加。

相同类型的序列之间是可以合并拼接起来的,只要通过+加号就可以做到。

比如说现在拼接两个列表。

print [1,2,3] + [4,5,6]

[1, 2, 3, 4, 5, 6]

这样,两个相同类型的序列就拼接起来了。

字符串也是如此。

print "hamasaki" + "ayumi"

hamasakiayumi

不过需要注意,不同类型的序列是不可以拼接在一起的,比如说列表和字符串,虽然说都是序列,但是它们属于不同的类型!!!


5.关于序列与乘法。

用数字去乘以一个序列,会生成一个新的序列,在新的序列中,原来的序列会被重复n次。

比如说:

print "suhaozhi" * 5 

suhaozhisuhaozhisuhaozhisuhaozhisuhaozhi

suhaozhi被重复了5遍。

print ‘*‘ * 50

**************************************************

*号被重复了50遍。

这事关于字符串的示范,列表也是一样。

print [1,2,3] * 10

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]


那么这种蛋疼的序列乘法永在什么位置呢?

个人理解,这种序列乘法可以用来占用序列里面元素的空间,也就是初始化,创建一个空列表[]可以用中括号来表示,但是这个列表中什么都没有,假如说这时需要创建一个占用是个元素的空间,但是这个列表中不能有任何内容(每个元素必须是空值),这时候序列乘法就可以发挥作用了。

每个元素都需要为空,就意味着列表不可以有任何元素,这种情况就需要使用None了,None是python的内建值,就是什么都没有的意思,因此,如果想要初始化一个长度为10的列表,但是这个列表中什么都不可以放,就可以使用下面的例子来实现。

test = [None] * 10

print test

[None, None, None, None, None, None, None, None, None, None]


6.检查某个成员在序列中是否存在。

检查一个元素是否在指定的序列中,可以使用in来进行检测(关于in运算符,在前面的运算符介绍中讲过了,可以查看前面的文章~),当要检查的元素存在于这个序列中,责返回True否则返回False,下面是使用in来检查元素是否存在于序列的例子。

比如说检查linux/unix文件的权限(rwx)。

permissions = ‘‘rw"

print ‘w‘ in permissions

True

在说一个通俗易懂的例子,检查一个用户的名字是否在列表上。

l1 = [‘linhaifeng‘,‘suhaozhi‘,‘andy‘]
print "suhaozhi" in l1

True

名字存在于列表中就返回了True。接着在查一个列表中没有的。

l1 = [‘linhaifeng‘,‘suhaozhi‘,‘andy‘]
print "ayumi"

没有的元素,就直接返回了一个False



7.计算序列长度,取出序列中的最大元素和最小元素。

python中内置了len(),min(),max()这三个特别有用的函数,其中len函数可以返回序列中元素的数量,也就是这个序列的长度,min可以返回这个序列中最小的元素,max则可以返回这个序列中最大的元素。

下面演示下这三个常用函数的用法。

Username = ["linhaifeng","suhaozhi","andy","tony"]

现在有个列表,需要计算这个列表中有多少个元素。

print len(Username)

4

最后返回的结果是4,就说明这个列表中有4个元素。

计算序列长度的这个函数还可以永在字符串上,因为字符串也是序列的一种啊。

print len("Hello")

5

返回的结果是5,就说明这个字符串中有5个字符。

len说完了,在简单演示min和max函数。

test = [1,2,3,4,5,6]
min(test)

1

查找test这个列表中最小的元素,这个最小的元素就是1。

再试试max函数。

test = [1,2,3,4,5,6]
max(test)

6

min和max函数,一般情况下,用来查找序列中的数字,如果是英文字符串的话,是按照首字母排序去进行查找的。


补充!:在这补充一点,min和max函数不只可以用于单个序列中找出最大值和最小值,这两个函数可以同时接收多个参数,在多个参数中找出最大值和最小值。

print min(1,2,3,4,5,6)

1

print max(1,2,3,4,5,6)

6



二.细说python列表(list)。

基本序列所具有的功能,列表都具备,索引,分片,连接,乘法列表都可以,和字符串不同的是,列表是可以修改的,列表支持,添加元素,插入元素, 删除元素,甚至还可以分片赋值,然而前面说的那些列表支持的功能,字符串都不能做。

1.修改列表中的元素。

想要修改列表中的某个元素,需要借助元素的索引才可以去修改,想去修改一个元素,必须明确这个元素的位置,索引。

test_list = ["aaa","bbb","ccc"]

假如说,现在要给上面那个列表中的第0个元素“aaa”替换为“suhaozhi”,下面就是操作方法。

test_list[0] = "suhaozhi"
print test_list

[‘suhaozhi‘, ‘bbb‘, ‘ccc‘]

这个列表中的第0个元素就被成功修改为“suhaozhi”了。


2.列表之分片赋值。

个人觉得列表的分片赋值功能做的特别的屌,分片赋值就是把修改列表中元素和分片联合起来使用。

前面介绍了,字符串虽然也是序列的一种,但是字符串这种序列是不支持修改的,那怎么让这种序列变得可以修改呢?这个时候就可以用到列表的分片赋值功能,其实分片赋值就是通过索引分片,然后在通过索引去修改列表中的元素,下面来做个演示~~

name = "perl"

首先我们定义了一个变量,这个变量中存的是个字符串“perl”,现在要对这个字符串序列的最后三个字母进行修改,把这个字符串变成python,操作方法如下。

name = list("perl")

#首先使用list()工厂函数,将perl这个字符串强制转换成列表的格式,转换后,我们先在屏幕上输出下这个转换后的列表看看。

print name

[‘p‘, ‘e‘, ‘r‘, ‘l‘]

转换成功后,通过之前说的分片和索引,去修改列表中的元素。

name[1:] = list("ython")
print name

#然后我们来打印一下这个列表看下。

[‘p‘, ‘y‘, ‘t‘, ‘h‘, ‘o‘, ‘n‘]

#列表中的元素已经替换完成了,接下来需要做的就是,使用join()方法,把列表中的每个元素合并为一个字符串。

print "".join(name)

python


3.删除一个元素。

从列表中删除一个元素,可以使用del语句来实现。

test_list = ["aaa","bbb","ccc"]

现在需要删除这个列表中的第二个元素(从第0个开始数)。

del test_list[2]
print test_list

[‘aaa‘, ‘bbb‘]

第二个元素“ccc”就被删掉了。


关于del语句~在这里需要特别补充一下!!

del语句不只可以删除列表中的元素,甚至还可以删除其他元素,还可以删除变量!!


4.python中列表中常用方法介绍。

在介绍列表的常用方法之前,先说一个关于函数和方法的概念,方法这个东西确实和函数看起来有点类似,但是是不一样的,但是“方法”是需要“类”去调用的,这个“类”可能是数字,也可能是字符串,列表,活着其他对象,但是函数是可以直接使用的,这就是它们的不同,举个例子。

当函数被加载到内存后,直接 函数名后面加上括号就可以使用了,就像这样 func_name()。

而方法呢是需要通过对象去调用的,比如 对象名.方法(参数)。


下面开始正式介绍列表的常用方法啦。

4.1 append用于在列表的尾部追加一个新的元素。

 l1= [1,2,3]
#在列表尾部添加一个新的元素4

l1.append(4)
print test

[1, 2, 3, 4]


注意!!!在这里有个特别注意事项,就是append方法并不是简单的返回一个修改过的新列表,而逝把原来的旧列表直接进行操作!!!!


4.2 count  统计一个元素在列表中出现的次数。

列表中的元素是可以重复的,count方法可以统计一个元素在这个列表里重复出现了多少次。

下面是例子。

test = ["suhaozhi","linhaifeng","linhaifeng"]

这个列表中有一个“suhaozhi”两个“linhaifeng”,用count方法就可以找出这个列表中有多少个linhaifeng。

print test.count("linhaifeng")

2

返回的数值是2,就说明有2个。


4.3 extend 拓展列表,可以一次性在列表的末尾追加n个值,还可以用一个新的列表去拓展原有的列表。

 lia= [1,2,3]
lib = [4,5,6]

现在有lia和lib两个列表,现在要将lib列表中的所有元素全部添加到lia的尾部。

lia.extend(lib)

添加完成后,我们再来看看lia列表。

print lia

[1, 2, 3, 4, 5, 6]


关于extend方法有个很重要的知识点需要补充!!!!!

还记得之前说的使用+加号去连接两个相同的序列吗?[1,2,3] + [4,5,6] extend方法和这种拼接的加号看起来作用很相像,但是本质上完全不同!!!!!extend方法会修改原有的列表!!!而加号拼接则不回修改原列表,会返回一个全新的列表!!!!这两个地方千万不要弄混!!


4.4 index 返回指定元素的索引。

index方法用于从列表中找出第一个匹配的元素的索引位置。

lia = [1,2,3,"suhaozhi","andy","suhaozhi"]
print lia.index("suhaozhi")

3

在搜索suhaozhi的时候,就会发现它在索引为3号的位置,这个列表中有两个“suhaozhi”但是index方法会从列表的左侧开始找,如果找到了,直接返回结果,不在向下匹配了。

如果找不到指定的元素,那么index方法就会抛出一个异常。


4.5 insert 将指定的对象按照指定的位置插入到列表中。

li1 = [1,3,5,7,9]

这有个列表,现在想把字符串“two”,插入到索引为1的位置,也就是1和3的中间。

li1.insert(1,"two")
print li1

[1, ‘two‘, 3, 5, 7, 9]



4.6 pop 弹出,从列表中弹出一个元素,默认弹出最后一个,但是可以通过索引来指定具体弹出哪个元素。

在这解释下弹出是什么意思,弹出就是从列表中删除一个元素,在这个元素被删除时,被删除的这个元素会作为执行这个方法的返回值。

下面是关于pop方法的操作:

li1 = [1,2,3,4]
l11.pop()
print li1

[1, 2, 3]

这个列表最末尾的元素4被弹出了。

接下来我们手动指定弹出第0个元素。

 l1 = [1,2,3]
 l1.pop(0)
 print l1
1

[2, 3]


第0个元素就从列表中被弹出了。


这个pop方法在什么情况下会使用呢?

在实现后进先出(LIFO)队列的时候,pop方法就发挥出它的用处了。

在这介绍下什么是LIFO后进先出队列,后进先出队列,也被称为,“堆栈”,就好像堆盘子,在拿盘子的时候,一次只能从顶部拿一个盘子,也就是说最后放的盘子,会被最先拿走,同样,最后被放入队列,最先从队列中移除,这就是堆栈,LIFO后进先出队列。


接下来我们验证下pop是否具有弹出的功能,能否实现“堆栈”。

l1 = [1,2,3]
l1.append(l1.pop())
 print l1

[1, 2, 3]

li1.pop()先被执行,最末尾的元素3被弹出,被弹出后作为返回值被li1.append()方法又一次放回到了li1列表的尾部,这样就实现了“堆栈”,以后在需要后进先出队列的时候,就可以使用列表的pop方法来实现。



4.7 remove移除,从列表中移除一个元素,但是没有返回值~

remove方法可以用来移除列表中第一个匹配到的元素。

 l1 = [‘linhaifeng‘,‘suhaozhi‘,‘linhaifeng‘]
 l1.remove(‘linhaifeng‘)

[‘suhaozhi‘, ‘linhaifeng‘]

从上面的例子就可以看到,只有第一次被匹配到的元素被删除了。

当使用remove删除一个不存在的元素,则会直接抛出异常!

remove和pop最大的区别就是,remove删除一个元素是没有任何返回值的。


4.8 reverse 倒序,将列表中存放的元素,按照和原来相反的顺序进行排序。

test = [1,2,3]
test.reverse()

[3, 2, 1]


特别注意!!!如果需要做反向的迭代操作,有个专门做反向迭代的函数,也叫reverse()这个reverse函数和列表中带的reverse方法是有区别的,如果需要做反向迭代操作,强烈推荐reverse函数,这个函数返回的不是一个列表,而是一个迭代器(iterator)对象,直接放到循环中进行反向迭代。

(经过测试,直接使用list()函数强制把返回的迭代器转换成列表也是可以的。)



4.9 sort 排序。

使列表中的元素按照一定顺序去排列,sort方法也是直接就该列表本身的。

 test = [2,1,3]
 test.sort()

[1, 2, 3]


关于sort方法也需要额外的补充一下,如果不想对原列表进行修改,想生成一个排序后的新的副本,那么sorted()函数是最好的选择,sorted()函数会将排序后的列表生成一个新的列表。

sorted函数虽然可以针对各种序列进行排序,但是返回值却永远都是以列表的形式

print sorted("dcba")

[‘a‘, ‘b‘, ‘c‘, ‘d‘]

#python中列表中元素的排序方式还可以自己指定,本篇文章主要是说明,列表,元组,字典之类的使用方法,关于排序后面会单独有一篇文章做介绍。


三.python元组(tuple)的使用。

元组合列表非常类似,但是它们最大的区别就是元组是不可变的,不能做任何修改,生成元组的方法特别简单,只要使用逗号(,)分隔了一些值,就自动创建了元组。

t1 = 1,2,3,4
print type(t1)

<type ‘tuple‘>

print t1

(1, 2, 3, 4)


元组也支持分片,方法和列表一模一样,这个就不多介绍啦。

元组分片后还是元组。


既然列表比元组的功能还多,那么要元组有毛用?

上网找了好多资料,终于知道元组为什么不可替代了。

元组可以在创建字典时作为key使用,列表却不行。



四.python字符串的基本使用(str)。

在本篇文章中,不对字符串格式化做介绍,只介绍关于字符串的一些常用方法,关于字符串格式化,后面会单独写一篇文章。

下面介绍一些比较常用的字符串方法(字符串的方法实在太多了,在这里说些常用的吧。)


1.find()在字符串中,查找想要找的子串。

它会返回子串从左数第一个位置的索引,如果没有找到对应的子串则会返回-1。

s1 = ‘maybe you to‘

print s1.find("you")

6

find方法不会返回布尔值,如果返回值是0,责说明了在第0位置的索引找到了子串。

补充一个find方法的用法,find方法还支持按字符串的指定范围查找子串。

比如说查找字符串y,如果不传任何参数的话,直接在maybe中就可以找到y。

s1 = ‘maybe you to‘
print s1.find(‘y‘)


2

在第2个索引的位置,找到了y,然后就不在继续找了,接着我们指定下索引的范围让find从第6个索引开始找,找到第9个索引。

s1 = ‘maybe you to‘

print  s1.find(‘y‘,6,9)

6

我们可以手动指定find方法的查找范围,从哪个索引的字符串开始,从哪个索引的字符串结束。

‘y’是要从字符串中查找的子串,6指从第6个索引开始,9是指从第9个索引开始结束。



2.join 拼接,是字符串中非常非常重要和常用的方法。

主要的功能是用来拼接序列中的元素,让序列中的元素使用指定的字符串连接起来。

注意!join方法只可以拼接字符串!!!其他的序列是无法拼接的,数字也不行!!

l1 = [‘1‘,‘2‘,‘3‘,‘4‘,‘5‘,‘6‘]

这个列表中所有的数字已经使用单引号转换成了字符串。

现在需要做的就是使用+-将l1列表里所有的元素连接成一个字符串。

print "+-".join(l1)

1+-2+-3+-4+-5+-6


3.lower小写,将字符串中所有的字符全部转换为小写。

如果想要做这种“不区分大小写”的功能的话,这个方法就派上用场了,无论大写小写,全部转换为小写。

在python中,是严格区分大小写的,假如想要在列表中查找一个元素是否存在,比如说在列表中找到字符串为“guilty“的元素,但是用户输入的是GUILTY,由于python会严格区分大小写,就会导致指定的元素找不到。

下面是关于大小写的测试代码。

name = "GUILTY"

test = ["suhaozhi","guilty"]

if name in test:

    print  "ok"

else:

    print "not found!"


not found

列表中命名有guilty这个元素,因为大小写的问题,现在找不到。

接下来就使用lower方法,对字符串做个转换。

name = "GUILTY".lower()

test = ["suhaozhi","guilty"]

if name in test:

    print  "ok"

else:

    print "not found!"


ok

这样,指定的元素就找到了。

print "GUILTY".lower()

guilty

在这里看到字符串成功的被转换成小写。


4.replace 替换,替换字符串中指定的子串。

这个方法,没有什么好说的,功能就是字符串替换,下面是例子。

s1 = "i have a pen"

print s1.replace("pen","apple")

i have a apple


5.split 拆分,也是特别重要和常用的一个字符串方法,将字符串按照指定的格式进行拆分,并且以列表的方式返回。

s1 = ‘1+-2+-3+-4+-5+-6+-7‘

将上面的字符串以+-为分隔符拆分。

s1 = ‘1+-2+-3+-4+-5+-6+-7‘

print s1.split(‘+-‘)

[‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘]

补充~在使用split做拆分的时候,如果不指定分隔符,默认责会使用空格,制表符,换行符作为分隔符。

split方法中,还可以指定最大的拆分次数,做多可以拆多少次,假如说,最多只拆分两次,可以在加个参数2

s1 = ‘1+-2+-3+-4+-5+-6+-7‘

print s1.split(‘+-‘,2)

[‘1‘, ‘2‘, ‘3+-4+-5+-6+-7‘]

上面那个字符串被拆成了三个元素,前两个+-被当作拆分符拆了两次。



6.strip脱掉...去除字符串两侧的字符,一般情况下,经常用这个方法来去掉换行符和空格。

s1 = "+aaa+"

print s1.strip(‘+‘)

aaa

字符串两边的+加号被去掉了。

strip只能去掉字符串两边的多余字符,对字符串中间的字符不生效。

这个方法也很常用,用来去掉空格和换行符特别管用!!!!



五.python字典(dict)的基本使用方法。

当数字索引不好用的时候,就可以考虑使用字典啦。

字典是python中唯一的映射类型,字典中的值没有特殊的顺序,都是存储在特定的key下,key可以是数字,可以是字符串,也可以是元组。

下面是字典的创建和使用字典。

字典是由多个键值对组成的,每个key(键)和它的value(值)都是用:冒号分隔,每个键值对之间都使用逗号分隔,最外层使用大括号括起来{}。

下面是python字典的结构。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

python字典的创建方法。

方法1:最常规的字典创建方式。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}


方法2:使用元组影射。

items = [(‘name‘,‘suhaozhi‘),(‘age‘,22)]

d1 = dict(items)

print d1

{‘age‘: 22, ‘name‘: ‘suhaozhi‘}


方法3:通过关键字来创建字典。

d1 = dict(name = ‘suhaozhi‘,age = 22)

print d1

{‘age‘: 22, ‘name‘: ‘suhaozhi‘}


创建空字典:

d1 = {}

d1 = dict()

1.字典的基本操作。

字典不属于序列,但是它的操作方法和序列很类似。

1.1查看字典有多少键值对。

如果想要查看一个字典里有多少键值对,使用len()函数就可以查到。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

print len(dict1)


1.2获取字典中某个key对应的value。

print dict1[‘k1‘]

v1

注意!这种获取vlaue的方式不推荐,因为一旦找不到指定的key,程序又会抛出异常,推荐使用字典中的get方法去获取vlaue,get方法后面会介绍!!


1.3对字典中指定的key赋值。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

dict1[‘k4‘] = ‘v4‘

print dict1

{‘k3‘: ‘v3‘, ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘, ‘k4‘: ‘v4‘}


1.4删除字典中指定的键值对。

要删除字典中的某个键值对,只需要指定键(key)就可以删除了。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

del dict1["k1"]

print dict1

{‘k3‘: ‘v3‘, ‘k2‘: ‘v2‘}


1.5检查字典中是否存在指定的key。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

print ‘k3‘ in dict1

True


2. 关于创建字典的一些注意事项。

key的类型,需要注意,字典的key可以是任意的不可变类型,可以是字符串,可以是浮点数,也可以是数字,也可以是元组,只要是不可变的类型都可以做字典的key。


字典的键值对是可以自动添加的,即使某个key在字典中并不存在,只要直接给key赋值,python就会去创建这个key(所以字典没有append方法就是因为这个原因)。


3.字典(dict)的常用方法。

3.1 clear清除,该方法可以清除字典中所有的项,无任何返回值。

dict1 = {"k1":"v1","k2":"v2","k3":"v3"}

dict1.clear()

print dict1


注意啦!!其实clear方法看起来很普通,清空了字典里所有的key和value,这些定义一个空字典也可以做到,但这并非真正的删除,clear可以做到真正意义上的删除!下面是示例。


第一种情况:

d1 = {}

#首先创建了一个空字典。

d2 = d1

#创建了一个d2变量,把内存地址指向d1

d1[‘k1‘] = ‘v1‘

#给d1字典创建了一个键值对

print d2

{‘k1‘: ‘v1‘}

#新创建的那个键值对在变量d2上也可以看到,这是因为,d1和d2使用了指向了同一个内存地址,不相信的话,可以使用id()函数去查看!

d1 = {}

#从新给d1变量赋值了一个空字典,注意!!这并不是删除,而是改变了d1变量原来的内存地址!!!

d1的新内存地址指向了一个空字典。

print d2

{‘k1‘: ‘v1‘}

#然而d2的内存地址没有像d1那样发生变化,指向的还是原来的那个位置,所以,之前的键值对并没有删除,还在内存空间中没有释放,如果想真正的删除,就需要使用clear方法。


下面是使用clear方法去清空字典,和上面那种所谓的“删除”做个比较。

d1 = {}

d2 = d1

d1[‘k1‘] = ‘v1‘

print d2

{‘k1‘: ‘v1‘}

d1.clear()

print d2

{}

所以说,clear才是真的清除。


3.2 copy 浅复制,返回一个具有相同键值对的新字典。

首先先举一个不使用copy方法,直接靠变量之间赋值实现所谓的“复制”!

d1 = {‘k1‘:‘v1‘,‘k2‘:‘v2‘}

d2 = d1

print d1

{‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

看起来像是通过变量间赋值的方式,实现了一个类似“复制”的效果,其实这并不是真正的复制,具体原因,看下面的操作就明白了。

接下来,我们给d1增加一个键值对。

d1[‘k3‘] = ‘v3‘

虽然改变的是d1变量中的字典,但是!d2中的字典也会发生同样的改变!!

print d1

{‘k3‘: ‘v3‘, ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k3‘: ‘v3‘, ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

修改了d1,d2也发生了同样的改变,这是因为d1和d2同时指向了一个内存地址,这两个变量使用的是相同的内存空间,这一点是可以通过id函数看到的。

print id(d1)

4481913472

print id(d2)

4481913472

这两个变量使用的内存地址是一模一样的!!!



下面是copy方法的使用示例。

d1 = {‘k1‘:‘v1‘,‘k2‘:‘v2‘}

d2 = d1.copy()

#使用copy方法,去复制字典

d2[‘k3‘] = ‘v3‘

#修改复制后的字典,给新字典增加一个键值对。

print d1

{‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k3‘: ‘v3‘, ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

#从这可以看出,修改了新字典后,对新字典进行修改,完全没有影响到d1变量。

#这是因为d2现在是一个独立的个体,d1和d2复制后内容虽然一样,但是分别使用的是不同的内存空间,下面使用id函数去查看一下

print id(d1)

4537868928

print id(d2)

4538835584


注意!!字典中的copy方法只是浅拷贝,只会拷贝父级对象,如果字典中有子对象(字典中嵌套了字典,或者嵌套了列表,就是子对象。)

下面来测试一下。

d1 = {‘k1‘:‘v1‘,‘k2‘:‘v2‘,‘k3‘:[1,2,3]}

d2 = d1.copy()

print d1

{‘k3‘: [1, 2, 3], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k3‘: [1, 2, 3], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

#k3这个key对应的值是一个列表,这个列表在字典中就是个子对象,现在在这个列表中追加一个元素。

d2[‘k3‘].append(4)

#这时,我们查看一下d1和d2字典都发生了哪些变化。

print d1

{‘k3‘: [1, 2, 3, 4], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k3‘: [1, 2, 3, 4], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

#修改了一个字典中的子对象后,副本的子对象也发生了变化。

这说明了一个问题,就是copy方法只会复制字典中的父级对象,子对像其实并没有复制,而是两个字典中的key同时指定了同一个内存空间!!

如果想要使字典中的子对象也得到独立的复制,则可以使用copy模块中的deep copy(深度复制)。

想要做这种深度复制,需要导入一个copy模块中的deepcopy函数。

from copy import deepcopy

d1 = {‘k1‘:‘v1‘,‘k2‘:‘v2‘,‘k3‘:[1,2,3]}

d2 = deepcopy(d1)

d2[‘k3‘].append(4)

print d1

{‘k3‘: [1, 2, 3], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}

print d2

{‘k3‘: [1, 2, 3, 4], ‘k2‘: ‘v2‘, ‘k1‘: ‘v1‘}



3.3 fromkeys()使用指定的键,建立一个新的字典,并且给每个key赋予一个默认的value,如果不指定value,默认为None。

d1 = dict.fromkeys([‘name‘,‘age‘])

print d1

{‘age‘: None, ‘name‘: None}

我们还可以手动指定默认值。

d1 = dict.fromkeys([‘name‘,‘age‘],"aaa")

print d1

{‘age‘: ‘aaa‘, ‘name‘: ‘aaa‘}

#每建立了一个键值对,值默认等于aaa。


3.4 get()用于访问字典key对应的值,d2[‘k3‘]和这种取值方式很类似,但是get这种方法在取值时,如果遇到了找不到的key,则不会抛出任何异常。

如果遇到了在字典中找不到的key,默认会返回None,我们还可以手动去指定get方法的返回值。

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.get(‘name‘)

suhaozhi


d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

#接下来查找一个字典中不存在的key,看看会返回什么。

print d1.get(‘aaaa‘)

None

#当找不到指定的key时,默认会返回None,我们还可以手动指定返回值。

#当现在需要指定,去找一个不存在的key,如果找不到返回字符串null。

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.get(‘aaaa‘,‘null‘)

null


3.5 has_key 检查key,检查字典中是否存在指定的key,也可以使用in去检测,这两个是一模一样的。


3.6 items 将字典所有的项,以列表的方式返回,列表中嵌套的是元组,每一个键值对都包含在同一个元组中。

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.items()

[(‘age‘, 22), (‘name‘, ‘suhaozhi‘)]


3.7 iteritems 和items方法类似,但是iteritems方法返回的是个迭代器,不是列表。

如果需要做迭代操作的话,强烈推荐iteritems方法!因为它更高效!!!。


3.8 keys 返回一个字典中所有的key,以列表的形式返回。

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.keys()

[‘age‘, ‘name‘]


3.9 iteritems 和key类似,返回的也是一个字典中所有的key,以迭代器的方式返回。


3.10 pop 弹出,弹出字典中指定键值对,通过key来指定。

(之前在list里面说过了,这里的弹出指的就是删除,并返回。)

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.pop(‘name‘)

suhaozhi

print d1

{‘age‘: 22}


3.11 popitem 随机弹出,随机弹出字典的键值对,以元组的方式返回,删除的顺序是随机的!

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.popitem()

(‘age‘, 22)

print d1

{‘name‘: ‘suhaozhi‘}


3.12 setdefault 和get方法很像,用来获取指定key对应的值,当key不存在时,默认返回None,也可以手动指定返回值,基本上功能和get一样,不演示了。


3.13 update 使用一个字典更新另外一个字典,旧字典的内容会更新到新字典中,如果有相同的key,对应的值会被覆盖!!

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

d2 = {‘k1‘:‘v1‘,‘k2‘:‘v2‘,‘age‘:130}

d1.update(d2)

print d1


d2字典中的键值对,被更新到了d1字典中,相同的key被覆盖了。


3.14 values 获取字典中所有的值 ,以列表的方式返回。

d1 = {‘name‘:‘suhaozhi‘,‘age‘:22}

print d1.values()


3.15 itervalues 获取字典中所有的值,返回的是迭代器。


六.python集合(set)。

set集合中,每一个元素都是可hash的,在这个集合中是唯一的,不能重复,而且每个元素之间是无序的。

如何可以体现出set集合中每个元素的唯一性。

首先定义一个列表

[1,1,2,2,3,3,4,4,5,5,6,6]

将这个列表转换为set集合。

print set([1,1,2,2,3,3,4,4,5,5,6,6])

set([1, 2, 3, 4, 5, 6])

转换成集合之后,重复的元素被去掉了。

1.python集合中常用的方法。


1.1 add 在集合中添加一个元素。

s1 = set()

s1.add("suhaozhi")

print s1

set([‘suhaozhi‘])


1.2 update 将一个序列进行拆分,然后分别传入到集合中。

s1 = {"suhaozhi"}

s1.update([1,2,3,4,5])

print s1

set([1, 2, 3, 4, 5, ‘suhaozhi‘])


1.3 remove 移除一个元素。

s1 = {‘suhaozhi‘,1,2,3,4,5,6}

s1.remove(‘suhaozhi‘)

print s1

set([1, 2, 3, 4, 5, 6])

集合中的suhaozhi被移除了。


1.4 issubset 用来测试,本集合中的每个元素是否都在另外一个集合中,也可以理解为另外一个集合是否包含本集合的所有元素。(以本集合为基准)

s1 = {‘suhaozhi‘,1,2,3,4,5,6}

s2 = {6,5,4,3,2,1,‘suhaozhi‘,222}

print s1.issubset(s2)

True

s2 中之要包含s1中所有的元素,返回结果就为真。

这个方法还可以使用两个符号代替,个人认为符号更容易记住。

s1.issubset(s2)可以写成这样 s1 <= s2

这两种语法的作用一模一样。


1.5 issuperset 和issubset方法类似,只不过方向上是相反的,另外一个集合中的每个元素是否包含在本集合中,也可以理解为本集合是否包含另外一个集合的所有元素。(以另外一个元素为基准)

s1 = {‘suhaozhi‘,1,2,3,4,5,6}

s2 = {6,5,4,3,2,1,‘suhaozhi‘,222}

print s1.issuperset(s2)

False

s1.issuperset(s2)  可以写成这样 s1 >= s2

这两种语法的作用也是一模一样的。


1.6 union 返回一个新的集合,这个集合中包含了两个集合中所有的元素,就是将两个元素融合。

s1 = {1,2,3}

s2 = {2,3,4}

print  s1.union(s2)

set([1, 2, 3, 4])

union方法还可以使用|竖线代替。

s1 | s2 和 s1.union(s2) 功能是一样的。


1.7 intersection交集,取两个集合共同存在的元素。

s1 = {1,2,3}

s2 = {2,3,4}

print  s1.intersection(s2)

set([2, 3])

s1.intersection(s2) 可以写成s1 & s2


1.8 difference差集,以本集合为中心,返回本集合有,但另一个集合没有的元素。

s1 = {1,2,3}

s2 = {2,3,4}

print  s1.difference(s2)

set([1])

s1.difference(s2) 可以写成 s1-s2


1.9 symmetric_difference 返回一个新的集合,这个集合中,包含本集合和另一个集合不重复的元素。

s1 = {1,2,3}

s2 = {2,3,4}

print  s1.symmetric_difference(s2)

s1.symmetric_difference(s2) 可以写成s1 ^ s2


1.10 copy 集合的浅复制,和字典的用法一样,在这就不做演示了。


1.11discard 如果存在就删除,如果当前集合中存在某个元素,发现存在就移除。

s2 = {2,3,4}

s2.discard(4)

print s2

set([2, 3])


1.12 pop 弹出集合中的一个元素,如果集合中没有元素可以弹出了,则抛出一个异常。

这个和列表的pop很类似,在这就不做演示了。


1.13 clear 真正意义上清空集合中的所有元素。


1.14 剩余的一些方法的补充。

intersection_update ,difference_update,symmetric_difference_update这些方法和intersection ,difference,symmetric_difference,基本上都是一样的,只不过带有update字样的方法会对原有集合进行操作,不带update的会生成一个新的集合。

本文出自 “reBiRTH” 博客,请务必保留此出处http://suhaozhi.blog.51cto.com/7272298/1905917

以上是关于2.python基础之—列表,元组,字典,集合,字符串的使用方法的主要内容,如果未能解决你的问题,请参考以下文章

python基础之 列表元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码

Python基础之集合

Python基础数据结构:列表 | 元组 | 集合 | 字典

Python基础数据结构:列表 | 元组 | 集合 | 字典

python基础之数据类型的比较

Python 基础之集合及基本数据类型总结