python之文件操作

Posted 2021-01-25 从入门到出门

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python之文件操作相关的知识，希望对你有一定的参考价值。

文件操作
文件路径：d:a.txt
编码方式：utf-8,gbk,GB2312....
操作方式：只读，只写，写读，读写，追加等。
报错原因：
UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa6 in position 2: illegal multibyte sequence:
　　编码不一致，存储文件时编码与打开文件时编码不一致。
路径问题:
1，在路径的最前面加转义字符r：r‘d:a.txt‘
2，把每个变成 \ :‘d:\a.txt‘
绝对路径： d:a.txt 从根目录开始找
相对路径：从当前目录，当前文件夹开始找。

f = open(r‘d:a.txt‘,encoding=‘utf-8‘,mode=‘r‘)
content = f.read()
print(content)
f.close()

‘‘‘
f:文件句柄，可以理解为变量。
open():python的内置函数（内部调用的是windows的系统命令）

文件操作的三部曲：
1，打开文件，产生文件句柄。
2，对文件句柄进行操作。
3，关闭文件句柄。
‘‘‘

文件打开模式：
1. 打开文件的模式有(默认为文本模式)：
r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
w，只写模式【不可读；不存在则创建；存在则清空内容】
a，只追加写模式【不可读；不存在则创建；存在则只追加内容】

2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作，
而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式
rb
wb
ab
注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

3,‘+‘模式（就是增加了一个功能）
r+，读写【可读，可写】
w+，写读【可写，可读】
a+，写读【可写，可读】

4，以bytes类型操作的读写，写读，写读模式
r+b，读写【可读，可写】
w+b，写读【可写，可读】
a+b，写读【可写，可读】

一、读:整体四种方法
r *****(五小种方式)
　　read() ***
　　read(n)
　　readline()
　　readlines()

　　for 循环 *****
rb ***
r+ *****
r+b:

mode可以不写，默认为r模式。
read（3）：
　　1. 文件打开方式为文本模式时(r)，代表读取3个字符
　　2. 文件打开方式为b模式时(rb)，代表读取3个字节
其余的文件内光标移动都是以字节为单位的如：seek，tell，truncate

具体实例：
1、r:只读模式[默认模式，文件必须存在，不存在则抛出异常]

# 1,read 全部读取
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r‘)
content = f.read() 
print(content)
f.close()

# 2,read(n):按照字符读取
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r‘)
content = f.read(10) #r模式,按照字符读取(注意，文本的换行符虽然默认不显示，但是也是一个字符)。
print(content)
f.close()

# 3, readline 按行读取
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r‘)
print(f.readline()) #读取第一行
print(f.readline()) #读取第二行...
f.close()

# 4,readlines 按行全部读取，返回一个list
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r‘)
content = f.readlines()
print(content)
f.close()

# 5,for循环。一行一行输出
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r‘)
for line in f:
    print(line.strip())
f.close()

2、rb

f = open(‘美女1.jpg‘, mode=‘rb‘)
content = f.read()
print(content)
f.close()

f = open(‘文件操作1‘, mode=‘rb‘)
content = f.read(9)  # rb模式 n 按照字节读取。
print(content)
f.close()

3、r+(读写):先读后追加。

f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r+‘)
content = f.read()
print(content)
f.write(‘666‘)
f.close()

f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r+‘)
content = f.read(3) #r+模式 n按字符读取
print(content)
f.write(‘666‘)
f.close()

# 不读直接写：直接从开始覆盖
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r+‘)
f.write(‘深圳你好‘)
f.close()

二、写
w ***
wb **
w+
w+b
具体实例：
1、w
没有文件，创建文件也要写。
有文件，先清空，后写入。

f = open(‘文件操作2‘, encoding=‘utf-8‘,mode=‘w‘)
f.write(‘深圳市南山区，福田区，罗湖区。。。‘)
f.close()

2、wb

f = open(‘美女1.jpg‘,mode=‘rb‘)
content = f.read()
print(content)

f1 = open(‘ 美女2.jpg‘,mode=‘wb‘)
f1.write(content)
f.close()
f1.close()

3、w+: 写读

f = open(‘文件操作2‘, encoding=‘utf-8‘,mode=‘w+‘)
f.write(‘深圳市南山区，福田区，罗湖区。。。‘)
f.seek(3) # 调整光标
content = f.read()
print(content)
f.close()

三、追加
a ***
ab
a+
a+b

a:
没有文件，创建文件也要写。
有文件,直接在文件的最后面追加。

f = open(‘文件操作3‘, encoding=‘utf-8‘,mode=‘a‘)
f.write(‘
南方水土好。。。‘)
f.close()

四、文件操作的其他方法
read() *****
write() *****
close() *****
seek() *****
tell() *****
readable() ****
writable() **** 判断是否可写
truncate() **

具体实例：
其他方法：readable ,writable,seek

f = open(‘文件操作1‘,encoding=‘utf-8‘) #不写mode,默认是r
if f.writable(): #判断是否可写
    content = f.read()
print(content)
f.close()

# seek：调整光标到开始seek(0) 调整光标到结尾seek(0,2)。0代表从文件开头开始算起，1代表从当前位置开始算起，2代表从文件末尾算起。
f = open(‘文件操作1‘,encoding=‘utf-8‘)
f.seek(6) # 按照字节去移动光标
content = f.read()
print(content)
f.close()

f = open(‘文件操作1‘,mode=‘rb‘)
print(f.read())
f.seek(6) # 按照字节去移动光标
content = f.read()
print(content)
f.close()

# tell 告知光标的位置 *****
f = open(‘文件操作1‘,encoding=‘utf-8‘)
f.seek(0,2) # 按照字节去移动光标
print(f.tell())
f.close()

# truncate:要在writable模式下进行截取(可以在w使用，但是不推荐在w模式下使用)。
# 可在r+  a+  等使用，表示对原文件进行截取
# 指定长度的话，就从文件的开头开始截断指定长度，其余内容删除；
# 不指定长度的话，就从文件开头开始截断到当前位置，其余内容删除。
f = open(‘文件操作1‘,encoding=‘utf-8‘,mode=‘r+‘)
print(f.truncate(6)) #以字节截取
f.close()

# with open：过一段时间自动关闭文件
# 1，主动关闭文件句柄
with open(‘文件操作2‘,encoding=‘utf-8‘) as f1:
    print(f1.read())

# 2，开启多个文件句柄。
with open(‘文件操作2‘,encoding=‘utf-8‘) as f1,open(‘文件操作3‘,encoding=‘utf-8‘,mode=‘w‘) as f2:
    print(f1.read())
    f2.write(‘666666‘)

五、文件的改 *****
1，以读的模式打开原文件，产生一个文件句柄f1.
2，以写的模式创建一个新文件，产生一个文件句柄f2.
3，读取原文件内容，进行修改，并将修改后的写入新文件。
4，将原文件删除。
5，将新文件重命名成原文件。

# 方式一：将硬盘存放的该文件的内容全部加载到内存，在内存中是可以修改的，修改完毕后，再由内存覆盖到硬盘（word，vim，nodpad++等编辑器）
# low版：
import os
with open(‘小白的深度剖析‘, encoding=‘utf-8‘) as f1,open(‘小白的深度解析.bak‘,encoding=‘utf-8‘,mode=‘w‘) as f2:
    old_content = f1.read()
    new_content = old_content.replace(‘小白‘,‘SB‘)
    f2.write(new_content)
os.remove(‘小白的深度剖析‘)
os.rename(‘小白的深度解析.bak‘, ‘小白的深度剖析‘)

# 方式二：将硬盘存放的该文件的内容一行一行地读入内存，修改完毕就写入新文件，最后用新文件覆盖源文件
# 升级版：
import os
with open(‘小白的深度剖析‘, encoding=‘utf-8‘) as f1,open(‘小白的深度解析.bak‘,encoding=‘utf-8‘,mode=‘w‘) as f2:
    for line in f1:
        new_line = line.replace(‘小白‘,‘SB‘)
        f2.write(new_line)
os.remove(‘小白的深度剖析‘)
os.rename(‘小白的深度解析.bak‘, ‘小白的深度剖析‘)

以上是关于python之文件操作的主要内容，如果未能解决你的问题，请参考以下文章