简介
Python 是一种高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 由 Guido van Rossum 于 1989 年底在荷兰国家数学和计算机科学研究所发明,第一个公开发行版发行于 1991 年。
特点
-
易于学习:Python 有相对较少的关键字,结构简单,和一个明确定义的语法,学习起来更加简单。
-
易于阅读:Python 代码定义的更清晰。
-
易于维护:Python 的成功在于它的源代码是相当容易维护的。
-
一个广泛的标准库:Python 的最大的优势之一是丰富的库,跨平台的,在 UNIX,Windows 和 macOS 兼容很好。
-
互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测试和调试代码片断。
-
可移植:基于其开放源代码的特性,Python 已经被移植(也就是使其工作)到许多平台。
-
可扩展:如果你需要一段运行很快的关键代码,或者是想要编写一些不愿开放的算法,你可以使用 C 或 C++ 完成那部分程序,然后从你的 Python 程序中调用。
-
数据库:Python 提供所有主要的商业数据库的接口。
-
GUI 编程:Python 支持 GUI 可以创建和移植到许多系统调用。
-
可嵌入:你可以将 Python 嵌入到 C/C++ 程序,让你的程序的用户获得"脚本化"的能力。
-
面向对象:Python 是强面向对象的语言,程序中任何内容统称为对象,包括数字、字符串、函数等。
基础语法
运行 Python
交互式解释器
在命令行窗口执行python
后,进入 Python 的交互式解释器。exit()
或 Ctrl + D
组合键退出交互式解释器。
命令行脚本
在命令行窗口执行python script-file.py
,以执行 Python 脚本文件。
指定解释器
如果在 Python 脚本文件首行输入#!/usr/bin/env python
,那么可以在命令行窗口中执行/path/to/script-file.py
以执行该脚本文件。
注:该方法不支持 Windows 环境。
编码
默认情况下,3.x 源码文件都是 UTF-8 编码,字符串都是 Unicode 字符。也可以手动指定文件编码:
# -*- coding: utf-8 -*-
或者
# encoding: utf-8
注意: 该行标注必须位于文件第一行
标识符
- 第一个字符必须是英文字母或下划线
_
。 - 标识符的其他的部分由字母、数字和下划线组成。
- 标识符对大小写敏感。
注:从 3.x 开始,非 ASCII 标识符也是允许的,但不建议。
保留字
保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:
>>> import keyword
>>> keyword.kwlist
[\'False\', \'None\', \'True\', \'and\', \'as\', \'assert\', \'break\', \'class\', \'continue\', \'def\', \'del\', \'elif\', \'else\', \'except\', \'finally\', \'for\', \'from\', \'global\', \'if\', \'import\', \'in\', \'is\', \'lambda\', \'nonlocal\', \'not\', \'or\', \'pass\', \'raise\', \'return\', \'try\', \'while\', \'with\', \'yield\']
注释
单行注释采用#
,多行注释采用\'\'\'
或"""
。
# 这是单行注释
\'\'\'
这是多行注释
这是多行注释
\'\'\'
"""
这也是多行注释
这也是多行注释
"""
行与缩进
Python 最具特色的就是使用缩进来表示代码块,不需要使用大括号 {}
。
缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数。缩进不一致,会导致运行错误。
多行语句
Python 通常是一行写完一条语句,但如果语句很长,我们可以使用反斜杠\\
来实现多行语句。
total = item_one + \\
item_two + \\
item_three
在 []
, {}
, 或 ()
中的多行语句,不需要使用反斜杠\\
。
空行
函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。类和函数入口之间也用一行空行分隔,以突出函数入口的开始。
空行与代码缩进不同,空行并不是 Python 语法的一部分。书写时不插入空行,Python 解释器运行也不会出错。但是空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。
记住:空行也是程序代码的一部分。
等待用户输入
input
函数可以实现等待并接收命令行中的用户输入。
content = input("\\n\\n请输入点东西并按 Enter 键\\n")
print(content)
同一行写多条语句
Python 可以在同一行中使用多条语句,语句之间使用分号;
分割。
import sys; x = \'hello world\'; sys.stdout.write(x + \'\\n\')
多个语句构成代码组
缩进相同的一组语句构成一个代码块,我们称之代码组。
像if
、while
、def
和class
这样的复合语句,首行以关键字开始,以冒号:
结束,该行之后的一行或多行代码构成代码组。
我们将首行及后面的代码组称为一个子句(clause)。
print 输出
print 默认输出是换行的,如果要实现不换行需要在变量末尾加上end=""
或别的非换行符字符串:
print(\'123\') # 默认换行
print(\'123\', end = "") # 不换行
import 与 from...import
在 Python 用 import
或者 from...import
来导入相应的模块。
将整个模块导入,格式为:import module_name
从某个模块中导入某个函数,格式为:from module_name import func1
从某个模块中导入多个函数,格式为:from module_name import func1, func2, func3
将某个模块中的全部函数导入,格式为:from module_name import *
运算符
算术运算符
运算符 | 描述 |
---|---|
+ | 加 |
- | 减 |
* | 乘 |
/ | 除 |
% | 取模 |
** | 幂 |
// | 取整除 |
比较运算符
运算符 | 描述 |
---|---|
== | 等于 |
!= | 不等于 |
> | 大于 |
< | 小于 |
>= | 大于等于 |
<= | 小于等于 |
赋值运算符
运算符 | 描述 |
---|---|
= | 简单的赋值运算符 |
+= | 加法赋值运算符 |
-= | 减法赋值运算符 |
*= | 乘法赋值运算符 |
/= | 除法赋值运算符 |
%= | 取模赋值运算符 |
**= | 幂赋值运算符 |
//= | 取整除赋值运算符 |
位运算符
运算符 | 描述 |
---|---|
& | 按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0 |
| | 按位或运算符:只要对应的二个二进位有一个为1时,结果位就为1 |
^ | 按位异或运算符:当两对应的二进位相异时,结果为1 |
~ | 按位取反运算符:对数据的每个二进制位取反,即把1变为0,把0变为1。~x 类似于 -x-1 |
<< | 左移动运算符:运算数的各二进位全部左移若干位,由"<<"右边的数指定移动的位数,高位丢弃,低位补0 |
>> | 右移动运算符:把">>"左边的运算数的各二进位全部右移若干位,">>"右边的数指定移动的位数 |
逻辑运算符
运算符 | 逻辑表达式 | 描述 |
---|---|---|
and | x and y | 布尔"与" - 如果 x 为 False,x and y 返回 False,否则它返回 y 的计算值 |
or | x or y | 布尔"或" - 如果 x 是 True,它返回 x 的值,否则它返回 y 的计算值 |
not | not x | 布尔"非" - 如果 x 为 True,返回 False 。如果 x 为 False,它返回 True |
成员运算符
运算符 | 描述 |
---|---|
in | 如果在指定的序列中找到值返回 True,否则返回 False |
not in | 如果在指定的序列中没有找到值返回 True,否则返回 False |
身份运算符
运算符 | 描述 | 实例 |
---|---|---|
is | is 是判断两个标识符是不是引用自一个对象 | x is y, 类似 id(x) == id(y) , 如果引用的是同一个对象则返回 True,否则返回 False |
is not | is not 是判断两个标识符是不是引用自不同对象 | x is not y , 类似 id(a) != id(b)。如果引用的不是同一个对象则返回结果 True,否则返回 False |
运算符优先级
运算符 | 描述 |
---|---|
(expressions...) , [expressions...] , {key: value...} , {expressions...} |
表示绑定或元组、表示列表、表示字典、表示集合 |
x[index] , x[index:index] , x(arguments...) , x.attribute |
下标、切片、调用、属性引用 |
** |
指数 (最高优先级) |
~ + - |
按位翻转, 一元加号和减号 (最后两个的方法名为 +@ 和 -@) |
* / % // |
乘,除,取模和取整除 |
+ - |
加法减法 |
>> << |
右移,左移运算符 |
& |
位 \'AND\' |
^ | |
位运算符 |
<= < > >= |
比较运算符 |
<> == != |
等于运算符 |
= %= /= //= -= += *= **= |
赋值运算符 |
is is not |
身份运算符 |
in not in |
成员运算符 |
and or not |
逻辑运算符 |
if - else |
条件表达式 |
lambda |
Lambda 表达式 |
具有相同优先级的运算符将从左至右的方式依次进行。用小括号()
可以改变运算顺序。
变量
变量在使用前必须先"定义"(即赋予变量一个值),否则会报错:
>>> name
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name \'name\' is not defined
数据类型
布尔(bool)
只有 True
和 False
两个值,表示真或假。
数字(number)
整型(int)
整数值,可正数亦可复数,无小数。
3.x 整型是没有限制大小的,可以当作 Long 类型使用,所以 3.x 没有 2.x 的 Long 类型。
浮点型(float)
浮点型由整数部分与小数部分组成,浮点型也可以使用科学计数法表示(2.5e2 = 2.5 x 10^2 = 250)
复数(complex)
复数由实数部分和虚数部分构成,可以用a + bj
,或者complex(a,b)
表示,复数的实部 a 和虚部 b 都是浮点型。
数字运算
- 不同类型的数字混合运算时会将整数转换为浮点数
- 在不同的机器上浮点运算的结果可能会不一样
- 在整数除法中,除法
/
总是返回一个浮点数,如果只想得到整数的结果,丢弃可能的分数部分,可以使用运算符//
。 //
得到的并不一定是整数类型的数,它与分母分子的数据类型有关系- 在交互模式中,最后被输出的表达式结果被赋值给变量
_
,_
是个只读变量
数学函数
注:以下函数的使用,需先导入 math 包。
函数 | 描述 |
---|---|
abs(x) | 返回数字的整型绝对值,如 abs(-10) 返回 10 |
ceil(x) | 返回数字的上入整数,如 math.ceil(4.1) 返回 5 |
cmp(x, y) | 如果 x < y 返回 -1,如果 x == y 返回 0,如果 x > y 返回 1。Python 3 已废弃 。使用 使用 (x>y)-(x<y) 替换。 |
exp(x) | 返回 e 的 x 次幂(ex),如 math.exp(1) 返回2.718281828459045 |
fabs(x) | 返回数字的浮点数绝对值,如 math.fabs(-10) 返回10.0 |
floor(x) | 返回数字的下舍整数,如 math.floor(4.9) 返回 4 |
log(x) | 如 math.log(math.e) 返回 1.0,math.log(100,10) 返回 2.0 |
log10(x) | 返回以 10 为基数的 x 的对数,如 math.log10(100) 返回 2.0 |
max(x1, x2,...) | 返回给定参数的最大值,参数可以为序列 |
min(x1, x2,...) | 返回给定参数的最小值,参数可以为序列 |
modf(x) | 返回 x 的整数部分与小数部分,两部分的数值符号与 x 相同,整数部分以浮点型表示 |
pow(x, y) | 幂等函数, x**y 运算后的值 |
round(x [,n]) | 返回浮点数 x 的四舍五入值,如给出 n 值,则代表舍入到小数点后的位数 |
sqrt(x) | 返回数字 x 的平方根 |
随机数函数
注:以下函数的使用,需先导入 random 包。
函数 | 描述 |
---|---|
choice(seq) | 从序列的元素中随机挑选一个元素,比如random.choice(range(10)) ,从0到9中随机挑选一个整数 |
randrange ([start,] stop [,step]) | 从指定范围内,按指定基数递增的集合中获取一个随机数,基数缺省值为1 |
random() | 随机生成下一个实数,它在[0,1) 范围内 |
seed([x]) | 改变随机数生成器的种子seed。如果你不了解其原理,你不必特别去设定seed,Python会帮你选择seed |
shuffle(lst) | 将序列的所有元素随机排序 |
uniform(x, y) | 随机生成下一个实数,它在[x,y] 范围内 |
三角函数
注:以下函数的使用,需先导入 math 包。
函数 | 描述 |
---|---|
acos(x) | 返回 x 的反余弦弧度值 |
asin(x) | 返回 x 的反正弦弧度值 |
atan(x) | 返回 x 的反正切弧度值 |
atan2(y, x) | 返回给定的 X 及 Y 坐标值的反正切值 |
cos(x) | 返回 x 的弧度的余弦值 |
hypot(x, y) | 返回欧几里德范数 sqrt(x*x + y*y) |
sin(x) | 返回的 x 弧度的正弦值 |
tan(x) | 返回 x 弧度的正切值 |
degrees(x) | 将弧度转换为角度,如 degrees(math.pi/2) 返回 90.0 |
radians(x) | 将角度转换为弧度 |
数学常量
常量 | 描述 |
---|---|
pi | 数学常量 pi(圆周率,一般以π来表示) |
e | 数学常量 e,e 即自然常数(自然常数) |
字符串(string)
- 单引号和双引号使用完全相同
- 使用三引号(
\'\'\'
或"""
)可以指定一个多行字符串 - 转义符(反斜杠
\\
)可以用来转义,使用r
可以让反斜杠不发生转义,如r"this is a line with \\n"
,则\\n
会显示,并不是换行 - 按字面意义级联字符串,如
"this " "is " "string"
会被自动转换为this is string
- 字符串可以用
+
运算符连接在一起,用*
运算符重复 - 字符串有两种索引方式,从左往右以 0 开始,从右往左以 -1 开始
- 字符串不能改变
- 没有单独的字符类型,一个字符就是长度为 1 的字符串
- 字符串的截取的语法格式如下:
变量[头下标:尾下标]
转义字符
转义字符 | 描述 |
---|---|
\\ | 在行尾时,续行符 |
\\\\ | 反斜杠符号 |
\\\' | 单引号 |
\\" | 双引号 |
\\a | 响铃 |
\\b | 退格(Backspace) |
\\e | 转义 |
\\000 | 空 |
\\n | 换行 |
\\v | 纵向制表符 |
\\t | 横向制表符 |
\\r | 回车 |
\\f | 换页 |
\\oyy | 八进制数,yy代表字符,例如:\\o12代表换行 |
\\xyy | 十六进制数,yy代表字符,例如:\\x0a代表换行 |
\\other | 其它的字符以普通格式输出 |
字符串运算符
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | \'Hello\' + \'Python\' 输出结果:\'HelloPython\' |
* | 重复输出字符串 | \'Hello\' * 2 输出结果:\'HelloHello\' |
[] | 通过索引获取字符串中字符 | \'Hello\'[1] 输出结果 e |
[ : ] | 截取字符串中的一部分 | \'Hello\'[1:4] 输出结果 ell |
in | 成员运算符,如果字符串中包含给定的字符返回 True | \'H\' in \'Hello\' 输出结果 True |
not in | 成员运算符,如果字符串中不包含给定的字符返回 True | \'M\' not in \'Hello\' 输出结果 True |
r/R | 原始字符串,所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法 | print(r\'\\n\') 或 print(R\'\\n\') |
% | 格式化字符串 |
字符串格式化
在 Python 中,字符串格式化不是 sprintf 函数,而是用 %
符号。例如:
print("我叫%s, 今年 %d 岁!" % (\'小明\', 10))
// 输出:
我叫小明, 今年 10 岁!
格式化符号:
符号 | 描述 |
---|---|
%c | 格式化字符及其 ASCII 码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同 %e,用科学计数法格式化浮点数 |
%g | %f 和 %e 的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
辅助指令:
指令 | 描述 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号 |
在正数前面显示空格 | |
# | 在八进制数前面显示零(\'0\'),在十六进制前面显示\'0x\'或者\'0X\'(取决于用的是\'x\'还是\'X\') |
0 | 显示的数字前面填充\'0\'而不是默认的空格 |
% | \'%%\'输出一个单一的\'%\' |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
Python 2.6 开始,新增了一种格式化字符串的函数 str.format()
,它增强了字符串格式化的功能。
多行字符串
- 用三引号(
\'\'\'
或"""
)包裹字符串内容 - 多行字符串内容支持转义符,用法与单双引号一样
- 三引号包裹的内容,有变量接收或操作即字符串,否则就是多行注释
实例:
string = \'\'\'
print(\\tmath.fabs(-10))
print(\\nrandom.choice(li))
\'\'\'
print(string)
输出:
print( math.fabs(-10))
print(
random.choice(li))
Unicode
在 2.x 中,普通字符串是以 8 位 ASCII 码进行存储的,而 Unicode 字符串则存储为 16 位 Unicode 字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u
。
在 3.x 中,所有的字符串都是 Unicode 字符串。
字符串函数
方法名 | 描述 |
---|---|
str.capitalize() | 首字母大写,其余字符小写 |
str.center(width[, fillchar]) | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格 |
str.count(sub, start= 0,end=len(string)) | 统计子字符串在字符串中出现的次数 |
str.encode(encoding=\'UTF-8\',errors=\'strict\') | 以指定的编码格式编码字符串,返回 bytes 对象 |
bytes.decode(encoding="utf-8", errors="strict") | 以指定的编码格式解码 bytes 对象,返回字符串 |
str.endswith(suffix[, start[, end]]) | 判断字符串是否以指定后缀结尾 |
str.expandtabs(tabsize=8) | 把字符串中的 tab 符号(\\t )转为空格 |
str.find(str, beg=0, end=len(string)) | 如果包含子字符串返回开始的索引值,否则返回-1 |
str.index(str, beg=0, end=len(string)) | 如果包含子字符串返回开始的索引值,否则抛出异常 |
str.isalnum() | 检测字符串是否只由字母和数字组成 |
str.isalpha() | 检测字符串是否只由字母组成 |
str.isdigit() | 检测字符串是否只由数字组成 |
str.islower() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
str.isupper() | 检测字符串中所有的字母是否都为大写 |
str.isspace() | 如果字符串中只包含空格,则返回 True,否则返回 False |
str.istitle() | 检测字符串中所有的单词拼写首字母是否为大写,且其他字母为小写 |
str.join(sequence) | 将序列的元素以指定的字符连接生成一个新的字符串 |
len(s) | 返回对象(字符串、列表、元组等)长度或项目个数 |
str.ljust(width[, fillchar]) | 返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串 |
str.lower() | 转换字符串中所有大写字符为小写 |
str.upper() | 转换字符串中所有小写字符为大写 |
str.strip([chars]) | 移除字符串头尾指定的字符(默认为空格)或字符序列 |
str.maketrans(intab, outtab) | 用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。两个字符串的长度必须相同,为一一对应的关系。 |
str.translate(table) | 根据参数table给出的表转换字符串的字符 |
max(str) | 返回字符串中最大的字符 |
min(str) | 返回字符串中最小的字符 |
str.replace(old, new[, max]) | 把字符串中的 old(旧字符串) 替换成 new(新字符串),如果指定第三个参数max,则替换不超过 max 次 |
str.split(str="", num=string.count(str)) | 通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则仅分隔 num 个子字符串 |
str.splitlines([keepends]) | 按照行(\'\\r\', \'\\r\\n\', \\n\')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符 |
str.startswith(str, beg=0,end=len(string)) | 检查字符串是否是以指定子字符串开头 |
str.swapcase() | 对字符串的大小写字母进行互换 |
str.title() | 返回"标题化"的字符串,即所有单词都是以大写开始,其余字母均为小写 |
str.zfill(width) | 返回指定长度的字符串,原字符串右对齐,前面填充0 |
str.isdecimal() | 检查字符串是否只包含十进制字符,只适用于 Unicode 对象 |
字节(bytes)
在 3.x 中,字符串和二进制数据完全区分开。文本总是 Unicode,由 str 类型表示,二进制数据则由 bytes 类型表示。Python 3 不会以任意隐式的方式混用 str 和 bytes,你不能拼接字符串和字节流,也无法在字节流里搜索字符串(反之亦然),也不能将字符串传入参数为字节流的函数(反之亦然)。
- bytes 类型与 str 类型,二者的方法仅有 encode() 和 decode() 不同。
- bytes 类型数据需在常规的 str 类型前加个
b
以示区分,例如b\'abc\'
。 - 只有在需要将 str 编码(encode)成 bytes 的时候,比如:通过网络传输数据;或者需要将 bytes 解码(decode)成 str 的时候,我们才会关注 str 和 bytes 的区别。
bytes 转 str:
b\'abc\'.decode()
str(b\'abc\')
str(b\'abc\', encoding=\'utf-8\')
str 转 bytes:
\'中国\'.encode()
bytes(\'中国\', encoding=\'utf-8\')
列表(list)
- 列表是一种无序的、可重复的数据序列,可以随时添加、删除其中的元素。
- 列表页的每个元素都分配一个数字索引,从 0 开始
- 列表使用方括号创建,使用逗号分隔元素
- 列表元素值可以是任意类型,包括变量
- 使用方括号对列表进行元素访问、切片、修改、删除等操作,开闭合区间为
[)
形式 - 列表的元素访问可以嵌套
- 方括号内可以是任意表达式
创建列表
hello = (1, 2, 3)
li = [1, "2", [3, \'a\'], (1, 3), hello]
访问元素
li = [1, "2", [3, \'a\'], (1, 3)]
print(li[3]) # (1, 3)
print(li[-2]) # [3, \'a\']
切片访问
格式: list_name[begin:end:step]
begin 表示起始位置(默认为0),end 表示结束位置(默认为最后一个元素),step 表示步长(默认为1)
hello = (1, 2, 3)
li = [1, "2", [3, \'a\'], (1, 3), hello]
print(li) # [1, \'2\', [3, \'a\'], (1, 3), (1, 2, 3)]
print(li[1:2]) # [\'2\']
print(li[:2]) # [1, \'2\']
print(li[:]) # [1, \'2\', [3, \'a\'], (1, 3), (1, 2, 3)]
print(li[2:]) # [[3, \'a\'], (1, 3), (1, 2, 3)]
print(li[1:-1:2]) # [\'2\', (1, 3)]
访问内嵌 list 的元素:
li = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, [\'a\', \'b\', \'c\']]
print(li[1:-1:2][1:3]) # (3, 5)
print(li[-1][1:3]) # [\'b\', \'c\']
print(li[-1][1]) # b
修改列表
通过使用方括号,可以非常灵活的对列表的元素进行修改、替换、删除等操作。
li = [0, 1, 2, 3, 4, 5]
li[len(li) - 2] = 22 # 修改 [0, 1, 2, 22, 4, 5]
li[3] = 33 # 修改 [0, 1, 2, 33, 4, 5]
li[1:-1] = [9, 9] # 替换 [0, 9, 9, 5]
li[1:-1] = [] # 删除 [0, 5]
删除元素
可以用 del 语句来删除列表的指定范围的元素。
li = [0, 1, 2, 3, 4, 5]
del li[3] # [0, 1, 2, 4, 5]
del li[2:-1] # [0, 1, 5]
列表操作符
+
用于合并列表*
用于重复列表元素in
用于判断元素是否存在于列表中for ... in ...
用于遍历列表元素
[1, 2, 3] + [3, 4, 5] # [1, 2, 3, 3, 4, 5]
[1, 2, 3] * 2 # [1, 2, 3, 1, 2, 3]
3 in [1, 2, 3] # True
for x in [1, 2, 3]: print(x) # 1 2 3
列表函数
len(list)
列表元素个数max(list)
列表元素中的最大值min(list)
列表元素中的最小值list(seq)
将元组转换为列表
li = [0, 1, 5]
max(li) # 5
len(li) # 3
注: 对列表使用 max/min 函数,2.x 中对元素值类型无要求,3.x 则要求元素值类型必须一致。
列表方法
-
list.append(obj)
在列表末尾添加新的对象
-
list.count(obj)
返回元素在列表中出现的次数
-
list.extend(seq)
在列表末尾一次性追加另一个序列中的多个值
-
list.index(obj)
返回查找对象的索引位置,如果没有找到对象则抛出异常
-
list.insert(index, obj)
将指定对象插入列表的指定位置
-
list.pop([index=-1]])
移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
-
list.remove(obj)
移除列表中某个值的第一个匹配项
-
list.reverse()
反向排序列表的元素
-
list.sort(cmp=None, key=None, reverse=False)
对原列表进行排序,如果指定参数,则使用比较函数指定的比较函数
-
list.clear()
清空列表
还可以使用del list[:]
、li = []
等方式实现 -
list.copy()
复制列表
默认使用等号赋值给另一个变量,实际上是引用列表变量。如果要实现
列表推导式
列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。
每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。
将列表中每个数值乘三,获得一个新的列表:
vec = [2, 4, 6]
[(x, x**2) for x in vec]
# [(2, 4), (4, 16), (6, 36)]
对序列里每一个元素逐个调用某方法:
freshfruit = [\' banana\', \' loganberry \', \'passion fruit \']
[weapon.strip() for weapon in freshfruit]
# [\'banana\', \'loganberry\', \'passion fruit\']
用 if 子句作为过滤器:
vec = [2, 4, 6]
[3*x for x in vec if x > 3]
# [12, 18]
vec1 = [2, 4, 6]
vec2 = [4, 3, -9]
[x*y for x in vec1 for y in vec2]
# [8, 6, -18, 16, 12, -36, 24, 18, -54]
[vec1[i]*vec2[i] for i in range(len(vec1))]
# [8, 12, -54]
列表嵌套解析:
matrix = [
[1, 2, 3],
[4, 5, 6],
[7, 8, 9],
]
new_matrix = [[row[i] for row in matrix] for i in range(len(matrix[0]))]
print(new_matrix)
# [[1, 4, 7], [2, 5, 8], [3, 6, 9]]
元组(tuple)
- 元组与列表类似,不同之处在于元组的元素不能修改
- 元组使用小括号,列表使用方括号
- 元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可
- 没有 append(),insert() 这样进行修改的方法,其他方法都与列表一样
- 字典中的键必须是唯一的同时不可变的,值则没有限制
- 元组中只包含一个元素时,需要在元素后面添加逗号,否则括号会被当作运算符使用
访问元组
访问元组的方式与列表是一致的。
元组的元素可以直接赋值给多个变量,但变量数必须与元素数量一致。
a, b, c = (1, 2, 3)
print(a, b, c)
组合元组
元组中的元素值是不允许修改的,但我们可以对元组进行连接组合
tup1 = (12, 34.56);
tup2 = (\'abc\', \'xyz\')
tup3 = tup1 + tup2;
print (tup3)
# (12, 34.56, \'abc\', \'xyz\')
删除元组
元组中的元素值是不允许删除的,但我们可以使用 del 语句来删除整个元组
元组函数
len(tuple)
元组元素个数max(tuple)
元组元素中的最大值min(tuple)
元组元素中的最小值tuple(tuple)
将列表转换为元组
元组推导式
t = 1, 2, 3
print(t)
# (1, 2, 3)
u = t, (3, 4, 5)
print(u)
# ((1, 2, 3), (3, 4, 5))
字典(dict)
- 字典是另一种可变容器模型,可存储任意类型对象
- 字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中
- 键必须是唯一的,但值则不必
- 值可以是任意数据类型
- 键必须是不可变的,例如:数字、字符串、元组可以,但列表就不行
- 如果用字典里没有的键访问数据,会报错
- 字典的元素没有顺序,不能通过下标引用元素,通过键来引用
- 字典内部存放的顺序和 key 放入的顺序是没有关系的
格式如下:
d = {key1 : value1, key2 : value2 }
访问字典
dis = {\'a\': 1, \'b\': [1, 2, 3]}
print(dis[\'b\'][2])
修改字典
dis = {\'a\': 1, \'b\': [1, 2, 3], 9: {\'name\': \'hello\'}}
dis[9][\'name\'] = 999
print(dis)
# {\'a\': 1, 9: {\'name\': 999}, \'b\': [1, 2, 3]}
删除字典
用 del 语句删除字典或字典的元素。
dis = {\'a\': 1, \'b\': [1, 2, 3], 9: {\'name\': \'hello\'}}
del dis[9][\'name\']
print(dis)
del dis # 删除字典
# {\'a\': 1, 9: {}, \'b\': [1, 2, 3]}
字典函数
len(dict)
计算字典元素个数,即键的总数str(dict)
输出字典,以可打印的字符串表示type(variable)
返回输入的变量类型,如果变量是字典就返回字典类型key in dict
判断键是否存在于字典中
字典方法
-
dict.clear()
删除字典内所有元素
-
dict.copy()
返回一个字典的浅复制
-
dict.fromkeys(seq[, value])
创建一个新字典,以序列 seq 中元素做字典的键,value 为字典所有键对应的初始值
-
dict.get(key, default=None)
返回指定键的值,如果值不在字典中返回默认值
-
dict.items()
以列表形式返回可遍历的(键, 值)元组数组
-
dict.keys()
以列表返回一个字典所有的键
-
dict.values()
以列表返回字典中的所有值
-
dict.setdefault(key, default=None)
如果 key 在字典中,返回对应的值。如果不在字典中,则插入 key 及设置的默认值 default,并返回 default ,default 默认值为 None。
-
dict.update(dict2)
把字典参数 dict2 的键/值对更新到字典 dict 里
dic1 = {\'a\': \'a\'} dic2 = {9: 9, \'a\': \'b\'} dic1.update(dic2) print(dic1) # {\'a\': \'b\', 9: 9}
-
dict.pop(key[,default])
删除字典给定键 key 所对应的值,返回值为被删除的值。key 值必须给出,否则返回 default 值。
-
dict.popitem()
随机返回并删除字典中的一对键和值(一般删除末尾对)
字典推导式
构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对:
>>> dict([(\'sape\', 4139), (\'guido\', 4127), (\'jack\', 4098)])
{\'sape\': 4139, \'jack\': 4098, \'guido\': 4127}
此外,字典推导可以用来创建任意键和值的表达式词典:
>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}
如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:
>>> dict(sape=4139, guido=4127, jack=4098)
{\'sape\': 4139, \'jack\': 4098, \'guido\': 4127}
集合(set)
集合是一个无序不重复元素的序列
创建集合
- 可以使用大括号
{}
或者set()
函数创建集合 - 创建一个空集合必须用
set()
而不是{}
,因为{}
是用来创建一个空字典 set(value)
方式创建集合,value 可以是字符串、列表、元组、字典等序列类型- 创建、添加、修改等操作,集合会自动去重
{1, 2, 1, 3} # {} {1, 2, 3}
set(\'12345\') # 字符串 {\'3\', \'5\', \'4\', \'2\', \'1\'}
set([1, \'a\', 23.4]) # 列表 {1, \'a\', 23.4}
set((1, \'a\', 23.4)) # 元组 {1, \'a\', 23.4}
set({1:1, \'b\': 9}) # 字典 {1, \'b\'}
添加元素
将元素 val 添加到集合 set 中,如果元素已存在,则不进行任何操作:
set.add(val)
也可以用 update 方法批量添加元素,参数可以是列表,元组,字典等:
set.update(list1, list2,...)
移除元素
如果存在元素 val 则移除,不存在就报错:
set.remove(val)
如果存在元素 val 则移除,不存在也不会报错:
set.discard(val)
随机移除一个元素:
set.pop()
元素个数
与其他序列一样,可以用 len(set)
获取集合的元素个数。
清空集合
set.clear()
set = set()
判断元素是否存在
val in set
其他方法
-
set.copy()
复制集合
-
set.difference(set2)
求差集,在 set 中却不在 set2 中
-
set.intersection(set2)
求交集,同时存在于 set 和 set2 中
-
set.union(set2)
求并集,所有 set 和 set2 的元素
-
set.symmetric_difference(set2)
求对称差集,不同时出现在两个集合中的元素
-
set.isdisjoint(set2)
如果两个集合没有相同的元素,返回 True
-
set.issubset(set2)
如果 set 是 set2 的一个子集,返回 True
-
set.issuperset(set2)
如果 set 是 set2 的一个超集,返回 True
集合计算
a = set(\'abracadabra\')
b = set(\'alacazam\')
print(a) # a 中唯一的字母
# {\'a\', \'r\', \'b\', \'c\', \'d\'}
print(a - b) # 在 a 中的字母,但不在 b 中
# {\'r\', \'d\', \'b\'}
print(a | b) # 在 a 或 b 中的字母
# {\'a\', \'c\', \'r\', \'d\', \'b\', \'m\', \'z\', \'l\'}
print(a & b) # 在 a 和 b 中都有的字母
# {\'a\', \'c\'}
print(a ^ b) # 在 a 或 b 中的字母,但不同时在 a 和 b 中
# {\'r\', \'d\', \'b\', \'m\', \'z\', \'l\'}
集合推导式
a = {x for x in \'abracadabra\' if x not in \'abc\'}
print(a)
# {\'d\', \'r\'}
流程控制
if 控制
if 表达式1:
语句
if 表达式2:
语句
elif 表达式3:
语句
else:
语句
elif 表达式4:
语句
else:
语句
1、每个条件后面要使用冒号 :
,表示接下来是满足条件后要执行的语句块。
2、使用缩进来划分语句块,相同缩进数的语句在一起组成一个语句块。
3、在 Python 中没有 switch - case 语句。
三元运算符:
<表达式1> if <条件> else <表达式2>
编写条件语句时,应该尽量避免使用嵌套语句。嵌套语句不便于阅读,而且可能会忽略一些可能性。
for 遍历
for <循环变量> in <循环对象>:
<语句1>
else:
<语句2>
else 语句中的语句2只有循环正常退出(遍历完所有遍历对象中的值)时执行。
在字典中遍历时,关键字和对应的值可以使用 items()
方法同时解读出来:
knights = {\'gallahad\': \'the pure\', \'robin\': \'the brave\'}
for k, v in knights.items():
print(k, v)
在序列中遍历时,索引位置和对应值可以使用 enumerate()
函数同时得到:
for i, v in enumerate([\'tic\', \'tac\', \'toe\']):
print(i, v)
同时遍历两个或更多的序列,可以使用 zip()
组合:
questions = [\'name\', \'quest\', \'favorite color\']
answers = [\'lancelot\', \'the holy grail\', \'blue\']
for q, a in zip(questions, answers):
print(\'What is your {0}? It is {1}.\'.format(q, a))
要反向遍历一个序列,首先指定这个序列,然后调用 reversed()
函数:
for i in reversed(range(1, 10, 2)):
print(i)
要按顺序遍历一个序列,使用 sorted()
函数返回一个已排序的序列,并不修改原值:
basket = [\'apple\', \'orange\', \'apple\', \'pear\', \'orange\', \'banana\']
for f in sorted(set(basket)):
print(f)
while 循环
while<条件>:
<语句1>
else:
<语句2>
break、continue、pass
break 语句用在 while 和 for 循环中,break 语句用来终止循环语句,即循环条件没有 False 条件或者序列还没被完全递归完,也会停止执行循环语句。
continue 语句用在 while 和 for 循环中,continue 语句用来告诉 Python 跳过当前循环的剩余语句,然后继续进行下一轮循环。 continue 语句跳出本次循环,而 break 跳出整个循环。
pass 是空语句,是为了保持程序结构的完整性。pass 不做任何事情,一般用做占位语句。
迭代器
- 迭代器是一个可以记住遍历的位置的对象。
- 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
- 迭代器有两个基本的方法:
iter()
和next()
。 - 字符串,列表或元组对象都可用于创建迭代器。
迭代器可以被 for 循环进行遍历:
li = [1, 2, 3]
it = iter(li)
for val in it:
print(val)
迭代器也可以用 next() 函数访问下一个元素值:
import sys
li = [1,2,3,4]
it = iter(li)
while True:
try:
print (next(it))
except StopIteration:
sys.exit()
生成器
- 在 Python 中,使用了 yield 的函数被称为生成器(generator)。
- 跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
- 在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。
- 调用一个生成器函数,返回的是一个迭代器对象。
import sys
def fibonacci(n): # 生成器函数 - 斐波那契
a, b, counter = 0, 1, 0
while True:
if (counter > n):
return
yield a
a, b = b, a + b
counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成
while True:
try:
print(next(f))
except StopIteration:
sys.exit()
函数
自定义函数
函数(Functions)是指可重复使用的程序片段。它们允许你为某个代码块赋予名字,允许你通过这一特殊的名字在你的程序任何地方来运行代码块,并可重复任何次数。这就是所谓的调用(Calling)函数。
- 函数代码块以
def
关键词开头,后接函数标识符名称和圆括号()
。 - 任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。
- 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
- 函数内容以冒号起始,并且缩进。
return [表达式]
结束函数,选择性地返回一个值给调用方。不带表达式的 return 相当于返回 None。return
可以返回多个值,此时返回的数据未元组类型。- 定义参数时,带默认值的参数必须在无默认值参数的后面。
def 函数名(参数列表):
函数体
参数传递
在 Python 中,类型属于对象,变量是没有类型的:
a = [1,2,3]
a = "Runoob"
以上代码中,[1,2,3] 是 List 类型,"Runoob" 是 String 类型,而变量 a 是没有类型,她仅仅是一个对象的引用(一个指针),可以是指向 List 类型对象,也可以是指向 String 类型对象。
可更改与不可更改对象
在 Python 中,字符串,数字和元组是不可更改的对象,而列表、字典等则是可以修改的对象。
-
不可变类型:变量赋值 a=5 后再赋值 a=10,这里实际是新生成一个 int 值对象 10,再让 a 指向它,而 5 被丢弃,不是改变a的值,相当于新生成了a。
-
可变类型:变量赋值 la=[1,2,3,4] 后再赋值 la[2]=5 则是将 list la 的第三个元素值更改,本身la没有动,只是其内部的一部分值被修改了。
Python 函数的参数传递:
-
不可变类型:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本身。
-
可变类型:类似 c++ 的引用传递,如 列表,字典。如 fun(la),则是将 la 真正的传过去,修改后fun外部的la也会受影响
Python 中一切都是对象,严格意义我们不能说值传递还是引用传递,我们应该说传不可变对象和传可变对象。
参数
必需参数
必需参数须以正确的顺序传入函数。调用时的数量必须和声明时的一样。
关键字参数
关键字参数和函数调用关系紧密,函数调用使用关键字参数来确定传入的参数值。
使用关键字参数允许函数调用时参数的顺序与声明时不一致,因为 Python 解释器能够用参数名匹配参数值。
def print_info(name, age):
"打印任何传入的字符串"
print("名字: ", name)
print("年龄: ", age)
return
print_info(age=50, name="john")
默认参数
调用函数时,如果没有传递参数,则会使用默认参数。
def print_info(name, age=35):
print ("名字: ", name)
print ("年龄: ", age)
return
print_info(age=50, name="john")
print("------------------------")
print_info(name="john")
不定长参数
- 加了星号
*
的参数会以元组的形式导入,存放所有未命名的变量参数。 - 如果在函数调用时没有指定参数,它就是一个空元组。我们也可以不向函数传递未命名的变量。
def print_info(arg1, *vartuple):
print("输出: ")
print(arg1)
for var in vartuple:
print (var)
return
print_info(10)
print_info(70, 60, 50)
- 加了两个星号
**
的参数会以字典的形式导入。变量名为键,变量值为字典元素值。
def print_info(arg1, **vardict):
print("输出: ")
print(arg1)
print(vardict)
print_info(1, a=2, b=3)
匿名函数
Python 使用 lambda 来创建匿名函数。
所谓匿名,意即不再使用 def
语句这样标准的形式定义一个函数。
lambda 只是一个表达式,函数体比 def 简单很多。
lambda 的主体是一个表达式,而不是一个代码块。仅仅能在 lambda 表达式中封装有限的逻辑进去。
lambda 函数拥有自己的命名空间,且不能访问自己参数列表之外或全局命名空间里的参数。
虽然 lambda 函数看起来只能写一行,却不等同于 C 或 C++ 的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。
# 语法格式
lambda [arg1 [,arg2,.....argn]]:expression
变量作用域
- L (Local) 局部作用域
- E (Enclosing) 闭包函数外的函数中
- G (Global) 全局作用域
- B (Built-in) 内建作用域
以 L –> E –> G –> B 的规则查找,即:在局部找不到,便会去局部外的局部找(例如闭包),再找不到就会去全局找,再者去内建中找。
Python 中只有模块(module),类(class)以及函数(def、lambda)才会引入新的作用域,其它的代码块(如 if/elif/else/、try/except、for/while等)是不会引入新的作用域的,也就是说这些语句内定义的变量,外部也可以访问。
定义在函数内部的变量拥有一个局部作用域,定义在函数外的拥有全局作用域。
局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。调用函数时,所有在函数内声明的变量名称都将被加入到作用域中。
当内部作用域想修改外部作用域的变量时,就要用到global和nonlocal关键字。
num = 1
def fun1():
global num # 需要使用 global 关键字声明
print(num)
num = 123
print(num)
fun1()
如果要修改嵌套作用域(enclosing 作用域,外层非全局作用域)中的变量则需要 nonlocal 关键字。
def outer():
num = 10
def inner():
nonlocal num # nonlocal关键字声明
num = 100
print(num)
inner()
print(num)
outer()
模块
编写模块有很多种方法,其中最简单的一种便是创建一个包含函数与变量、以 .py 为后缀的文件。
另一种方法是使用撰写 Python 解释器本身的本地语言来编写模块。举例来说,你可以使用 C 语言来撰写 Python 模块,并且在编译后,你可以通过标准 Python 解释器在你的 Python 代码中使用它们。
模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py
。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。
搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块,需要把命令放在脚本的顶端。
一个模块只会被导入一次,这样可以防止导入模块被一遍又一遍地执行。
搜索路径被存储在 sys 模块中的 path 变量。当前目录指的是程序启动的目录。
导入模块
导入模块:
import module1[, module2[,... moduleN]
从模块中导入一个指定的部分到当前命名空间中:
from modname import name1[, name2[, ... nameN]]
把一个模块的所有内容全都导入到当前的命名空间:
from modname import *
_name_ 属性
每个模块都有一个 __name__
属性,当其值是 \'__main__\'
时,表明该模块自身在运行,否则是被引入。
一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一程序块不执行,我们可以用 __name__
属性来使该程序块仅在该模块自身运行时执行。
if __name__ == \'__main__\':
print(\'程序自身在运行\')
else:
print(\'我来自另一模块\')
dir 函数
内置的函数 dir()
可以找到模块内定义的所有名称。以一个字符串列表的形式返回。
如果没有给定参数,那么 dir()
函数会罗列出当前定义的所有名称。
在 Python 中万物皆对象,int
、str
、float
、list
、tuple
等内置数据类型其实也是类,也可以用 dir(int)
查看 int
包含的所有方法。也可以使用 help(int)
查看 int
类的帮助信息。
包
包是一种管理 Python 模块命名空间的形式,采用"点模块名称"。
比如一个模块的名称是 A.B, 那么他表示一个包 A中的子模块 B 。
就好像使用模块的时候,你不用担心不同模块之间的全局变量相互影响一样,采用点模块名称这种形式也不用担心不同库之间的模块重名的情况。
在导入一个包的时候,Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录。
目录只有包含一个叫做 __init__.py
的文件才会被认作是一个包,主要是为了避免一些滥俗的名字(比如叫做 string)不小心
以上是关于Python 3 入门,看这篇就够了的主要内容,如果未能解决你的问题,请参考以下文章