Python 学习之路

Posted codehu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 学习之路相关的知识,希望对你有一定的参考价值。

Python 学习之路(三)

以下所用的是Python 3.6

一、集合部分

集合是一个无序的,不重复的数据集合,主要用来去重,以及关系测试:交集,差集,并集等

1.1 关系操作

1.1.1 列表去重

可以给列表去重,例如:

1 set_demo = [1,2,3,4,5,3,2,1] # 列表
2 set_demo = set(set_demo) # 转换成集合,来去重
3 print(set_demo)

1.1.2 取交集 intersection()方法

可以获得两个集合的交集部分,例如:

1 set_demo_1 = set([2,3,4,5,4])
2 set_demo_2 = set([2,22,33,44,11])
3 print(set_demo_1.intersection(set_demo_2))

1.1.3 取并集 union()方法

可以获得两个集合的并集,例如:

1 set_demo_1 = set([2,3,4,5,4])
2 set_demo_2 = set([2,22,33,44,11])
3 print(set_demo_1.union(set_demo_2))

1.1.4 差集 difference()方法

去除调用对象中的与参数共有的部分,即差集,例如:

1 set_demo_1 = set([1,2,3,4,5])
2 set_demo_2 = set([1,2,3])
3 print(set_demo_1.issuperset(set_demo_2))#set_demo_1是set_demo_2的父集 返回true
4 print(set_demo_2.issubset(set_demo_1))#set_demo_2是set_demo_1的子集 返回true

1.1.5 子集、父集

可以使用issubset,issuperset方法,例如:

1 set_demo_1 = set([1,2,3,4,5])
2 set_demo_2 = set([1,2,3])
3 print(set_demo_1.issuperset(set_demo_2))#set_demo_1是set_demo_2的父集 返回true
4 print(set_demo_2.issubset(set_demo_1))#set_demo_2是set_demo_1的子集 返回true

1.1.6 对称差集

集合A与集合B中所有不属于A∩B的元素的集合,例如:

1 set_demo_1 = set([2,3,4,5,4])
2 set_demo_2 = set([2,22,33,44,11])
3 print(set_demo_1.symmetric_difference(set_demo_2)) #返回去掉两者交集的部分

1.1.7 不相交的

两个集合如果没有交集就返回true,例如:

1 set_demo_1 = set([1,2,3,4,5])
2 set_demo_2 = set([11,22,33])
3 print(set_demo_1.isdisjoint(set_demo_2))#没有交集返回true

1.1.8 使用运算符来代替方法调用

1 A = B | C #取并集
2 A = B & C #取交集
3 A = B - C #取差集,在B中去掉C中的部分
4 A = B ^ C #取对称差集

1.2 基本操作

 1 set_demo = set([1,2,3,4,5])
 2 set_demo.add(66) #添加操作,添加一项
 3 set_demo.update([11,22]) #添加操作,添加多项
 4 
 5 set_demo.remove(66) #删除操作,删除指定一项,若没有则报错
 6 len(set_demo) # 集合长度
 7 
 8 set_demo.pop() #删除操作,随机删除一个,并且返回该值
 9 set_demo.discard(666) #删除操作,删除指定一个,若没有则什么都不做
10 print(set_demo)

二、文件部分

基本的流程:打开文件->操作文件->关闭文件

2.1 文件打开模式

模式含义
r 打开只读文件,该文件必须存在。
r+ 打开可读写的文件,该文件必须存在。
w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。
w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。
a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。

注:上述的形态字符串都可以再加一个b字符,如rb、w+b或ab+等组合,加入b 字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。不过在POSIX系统,包含Linux都会忽略该字符。

2.2 文件的读写操作

读文件操作,read(size)方法,参数可以输入读取长度,不填默认读取全部

1 f = open("file_demo",mode="r",encoding=utf-8) #创建文件句柄引用
2 print(f.read())
3 f.close()

写文件操作

1 f = open("file_demo",mode="w",encoding=utf-8) #创建文件句柄引用
2 f.write("测试用例\\n")
3 f.close()

读一行、多行

1 f = open("file_demo",mode="r",encoding=utf-8) #创建文件句柄引用
2 print(f.readline()) #单行读取
3 f.close()
4 
5 f = open("file_demo",mode="r",encoding=utf-8) #创建文件句柄引用
6 for line in f.readlines(): #读取全部文件的全部行,存放着文件中,如果文件较大则速度会非常慢,一般不推荐readlines
7     print(line.strip())
8 f.close()

2.3 文件的光标(位置操作)

文件位置操作有以下几个方法:tell,seek tell()可以返回当前位置 seek(offset[, whence]),offset参数是开始的偏移量,表示偏移几个字节,whence默认为0,表示要从哪个位置开始偏移:0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。

2.4 文件的flush()操作

flush()方法刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件,而不是被动的等待输出缓冲区写入。可以防止断电等情况使数据没有写入文件。

1 f = open("file_demo",mode="a",encoding=utf-8) #创建文件句柄引用
2 f.write("这是追加数据")
3 f.flush()#将缓存区的数据写入到文件
4 f.close()

2.5 文件的truncate()方法

truncate( [ size ]):用于从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后,后面的所有字符被删除。

2.6 其他操作

fileno()返回一个整形的文件描述符 encoding()返回打开文件的编码方式 isatty()如果文件连接到一个终端设备返回 True,否则返回 False readable()如果文件可读,则返回True,否则返回 False writeable()如果文件可写,则返回True,否则返回 False

2.7 with操作

with可以自动帮忙关闭文件,释放资源

1 with open("file_demo",mode="r",encoding="utf-8" ) as f:
2     for line in f:
3         print(line.strip()) #strip用来去除换行

三、JSON 序列化与反序列化

序列化可以简单的理解为将对象存储到文件中,反序列化可以简单理解为将文件数据读取用对象来存储 序列化过程

1 import json #导入json包
2 
3 # 序列化过程
4 # 字典类型转换为 JSON 对象
5 info = { "name":"CodeHu",
6          "age": 25}
7 with open("json.text","w") as f:
8     f.write( json.dumps(info) )
9     #json.dump(info,f) #或者使用dump

反序列过程

1 import json
2 # 反序列化
3 with open("json.text","r") as f:
4     print(json.loads(f.read())["age"])
5     #print(json.load(f)["age"])#可以采用load方法读取

四、工程目录规范

摘自https://www.cnblogs.com/JayeHe/p/6696848.html

4.1 一般目录结构

假设你的项目名为foo, 最方便快捷目录结构:

Foo/
|-- bin/
|   |-- foo
|
|-- foo/
|   |-- tests/
|   |   |-- __init__.py
|   |   |-- test_main.py
|   |
|   |-- __init__.py
|   |-- main.py
|
|-- docs/
|   |-- conf.py
|   |-- abc.rst
|
|-- setup.py
|-- requirements.txt
|-- README

简要解释一下:

  • bin/: 存放项目的一些可执行文件,当然你可以起名script/之类的也行。
  • foo/: 存放项目的所有源代码。(1) 源代码中的所有模块、包都应该放在此目录。不要置于顶层目录。(2) 其子目录tests/存放单元测试代码; (3)程序的入口最好命名为 main.py
  • docs/: 存放一些文档。
  • setup.py: 安装、部署、打包的脚本。
  • requirements.txt: 存放软件依赖的外部Python包列表。
  • README: 项目说明文件。

4.2 README文件

这个是每个项目都应该有的一个文件,目的是能简要描述该项目的信息,让读者快速了解这个项目。

它需要说明以下几个事项:

  • 软件定位,软件的基本功能。
  • 运行代码的方法: 安装环境、启动命令等。
  • 简要的使用说明。
  • 代码目录结构说明,更详细点可以说明软件的基本原理。
  • 常见问题说明。

4.3 setup.py

一般来说,用setup.py来管理代码的打包、安装、部署问题。业界标准的写法是用Python流行的打包工具setuptools来管理这些事情。这种方式普遍应用于开源项目中。不过这里的核心思想不是用标准化的工具来解决这些问题,而是说,一个项目一定要有一个安装部署工具,能快速便捷的在一台新机器上将环境装好、代码部署好和将程序运行起来。

4.4 requirements.txt

这个文件存在的目的是: 方便开发者维护软件的包依赖。将开发过程中新增的包添加进这个列表中,避免在setup.py安装依赖时漏掉软件包。 方便读者明确项目使用了哪些Python包。 这个文件的格式是每一行包含一个包依赖的说明,通常是flask>=0.10这种格式,要求是这个格式能被pip识别,这样就可以简单的通过 pip install -r requirements.txt来把所有Python包依赖都装好。

以上是关于Python 学习之路的主要内容,如果未能解决你的问题,请参考以下文章

机器学习之路: python 实践 word2vec 词向量技术

python学习之路01

python之路之前没搞明白4面向对象(封装)

python 机器学习有用的代码片段

Python学习之路——模块

Python学习之路-函数