python文件处理-读写

Posted 2020-10-23 暮光微凉

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python文件处理-读写相关的知识，希望对你有一定的参考价值。

　　Python中文件处理的操作包括读、写、修改，今天我们一起来先学习下读和写操作。

一、文件的读操作

　　例一：

#文件读操作

f = open(file="first_blog.txt",mode = ‘r‘,encoding=‘gbk‘)
#‘r’表示只读模式（打开仍然为文件），encoding = ‘gbk‘表示原文件的存储格式为‘gbk‘,打开时必须告诉程序将gbk转成unicode(python3编码默认Unicode)

data = f.read()  # 读取所有内容，内容是已经转换完毕的字符串

print(data)　　# 打印到屏幕

f.close()#文件打开后必须关闭

‘‘‘
输出：
    write by congcong

    Hello world!

    这是我用python打开的第一个文件。
    
‘‘‘

　　例二：

#文件二进制读模式

f = open(file="first_blog.txt",mode = ‘rb‘)
#‘rb’表示以二进制读模式（硬盘存为存的二进制打开就为二进制，并且不再需要指定编码）

data = f.read()

print(data)

f.close()

‘‘‘
输出：
    b‘write by congcong\r\n\r\nHello world!\r\n\r\n\xd5\xe2\xca\xc7\xce\xd2\xd3\xc3python\xb4\xf2\xbf\xaa\xb5\xc4\xb5\xda\xd2\xbb\xb8\xf6\xce\xc4\xbc\xfe\xa1\xa3\r\n\r\n‘
    
‘‘‘

　　大家能看出例一和例二的区别吗？

　　区别在于例二直接以rb模式打开了文件，rb是指二进制模式，数据读到内存里直接是bytes格式，

如果想要看内容，还需要手动decode,因此在文件打开阶段，不需要指定编码。

　　那如果我们不知道一个文件是以什么编码保存的怎么办呢？

　　方式一：尝试使用各种编码方式，总有一款是的，的确可以，不过感觉傻傻的，有没有更好的方法呢？

　　方法二：导入一个叫 chardet 的外部工具（首先你要联网安装，Python3安装方法命令行输入：pip3 install chardet）

import chardet
res = chardet.detect(open(‘first_blog.txt‘,mode=‘rb‘).read())
print(res)

‘‘‘
输出：
{‘encoding‘: ‘GB2312‘, ‘confidence‘: 0.99, ‘language‘: ‘Chinese‘}     # confidence 表示可信程度

‘‘‘

　　例三（循环读取）：

# -*- coding:utf-8 -*-

f = open("for_line.txt",mode = ‘r‘,encoding=‘gbk‘)

for line in f:  #按行读取
    print(line)

f.close()

‘‘‘
输出：
    键盘字母排序如下:

    qwertyuiop

    asdfghjkl

    zxcvbnm
‘‘‘
#中间有空行的原因：print本身有换行的特点

　　注意：　　　

文件操作时，以 “r”或“rb” 模式打开，则只能读，无法写入；
硬盘上保存的文件都是某种编码的0101010，打开时需要注意：
- rb，直接读取文件保存时原生的0101010，在Python中用字节类型表示
- r和encoding，读取硬盘的0101010，并按照encoding指定的编码格式进行断句，再将“断句”后的每一段0101010转换成unicode的 010101010101，在Python中用字符串类型表示

二、文件的写操作

　　写操作里可以分为覆盖写文件（‘w’和‘wb’）和追加写文件（‘a’和‘ab’）两大类。

　　1、覆盖写文件

　　　　示例如下：　　

# -*- coding:utf-8 -*-
#特别注意当mode的模式为‘w’时，是创建新文件，当文件名与原文件相同时，原文件被清空重写
f = open("write.txt",mode = ‘w‘,encoding=‘gbk‘) #普通文件的写
f.write(‘这是第一个我用Python写的文件！‘) # 自动将写的Unicode字符串转为gbk编码的二进制串。
f.close()

f2 = open("write2.txt",mode = ‘wb‘) #以二进制写文件，主要用于视频图片等文件的传输
f2.write("这是用二进制写的第一个文件！".encode(‘gbk‘))# 二进制写必须要加encode(),将写的unicode进行编码成指定格式的二进制存储，Python3默认是utf-8

f2.close()

　　注意：

　　　　文件覆盖写操作时，以 “w”或“wb” 模式打开，则只能写，并且在打开的同时会先将内容清空。

　　　　写入到硬盘上时，必须是某种编码的0101010，打开时需要注意：

- 　　wb，写入时需要直接传入以某种编码的0100101，即：字节类型，二进制写必须加encode()将写的Unicode
- 　　w 和 encoding，写入时需要传入unicode字符串，内部会根据encoding制定的编码将unicode字符串转换为该编码的 010101010

2、追加写文件

　　　　示例如下：

#特别注意当mode的模式为‘a’时，是文件追加模式，就是接着写文件
f3 = open(‘write.txt‘,mode=‘a‘,encoding=‘gbk‘)
f3.write(‘\n这是追加的文本1！‘)　　# 自动将写的Unicode字符串转为gbk编码的二进制串。

f3.write(‘\n这是追加的文本2！‘)

f3.write(‘\n这是追加的文本3！‘)
f3.close() 

f4 = open(‘write3.txt‘,mode = ‘ab‘)#以二进制追加文件，主要用于视频图片等文件的传输 
f4.write(‘\n这是用二进制追加的文件！‘.encode(‘gbk‘)) # 二进制追加写也必须要加encode(),将写的unicode进行编码成指定格式的二进制存储，Python3默认是utf-8

f4.close()

　　文件追加写操作时，以 “a”或“ab” 模式打开，则只能追加，即：在原来内容的尾部追加内容

　　写入到硬盘上时，必须是某种编码的0101010，打开时需要注意：

- 　　ab，写入时需要直接传入以某种编码的0100101，即：字节类型，二进制追加写必须加encode()将写的unicode字符串转为指定编码的二进制串，不指定时Python3默认utf-8。
- 　　a 和 encoding，写入时需要传入unicode字符串，内部会根据encoding制定的编码将unicode字符串转换为该编码的 010101010

　三、文件的读写（r+）和写读（w+）混合模式　

　　1、文件的读写（r+）

　　　　示例如下：

#-*-coding:utf-8-*-

f = open(file=‘write.txt‘,mode=‘r+‘,encoding=‘gbk‘) # r+ 表示读写模式
print(‘读写前：\n‘,f.read())
f.write(‘这是读写模式下的内容\n‘)
f.write(‘这是读写模式下的内容\n‘)
print(‘读写后：\n‘,f.read())
f.close()
‘‘‘
读写前：
 这是第一个我用Python写的文件！
这是追加的文本1！
这是追加的文本2！
这是追加的文本3！
读写后：
‘‘‘

　注意：读写模式下只能查看之前已存在的内容，而写入的内容无法再读出来（与光标的移动有关，下一篇会细说），打开文件查看，写入的内容已经追加到了之前写的最后面。

　　2、文件的写读（‘w+’，使用非常少，了解即可）

　　　　示例如下：

# -*-coding:utf-8-*-

f = open(file=‘write.txt‘,mode=‘w+‘,encoding=‘gbk‘)
print(‘写读前：\n‘,f.read())
f.write(‘这是写读模式下的内容\n‘)
f.write(‘这是写读模式下的内容\n‘)
print(‘写读后：\n‘,f.read())
f.close()

‘‘‘
写读前：
 
写读后：
‘‘‘

　注意：　文件的写读模式会先清空原先文件里存在的内容，再写入你即将要写的内容，相当于覆盖写，不同在于可以查看写入的内容，

需要移动文件中光标位置。下一篇的文件常用操作方法中会细品。

以上是关于python文件处理-读写的主要内容，如果未能解决你的问题，请参考以下文章