文件操作
Posted asia-yang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文件操作相关的知识,希望对你有一定的参考价值。
一、相对路径和绝对路径
1. 绝对路径:从磁盘根?录开始?直到?件名.
2. 相对路径:同?个?件夹下的?件. 相对于当前这个程序所在的?件夹??. 如果在同?个?件夹中. 则相对路径就是这个?件名. 如果在上?层?件夹. 则要使用“../”退回到上一个文件夹,再去查找相应的文件夹和文件。
如下是相对路径:
绝对路径如下:
二、 初识?件操作
使?python来读写?件是非常简单的操作. 我们使?open()函数来打开?个?件, 获取到?件句柄. 然后通过?件句柄就可以进?各种各样的操作了. 根据打开?式的不同能够执?的操作也会有相应的差异.
打开?件的?式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使?的是r(只读)模式
- read() 将?件中的内容全部读取出来. 弊端: 占内存. 如果?件过?.容易导致内存崩溃。
f = open("test.txt", mode="r", encoding="utf-8")#在此py文件下,新建一个test.txt的文件 content = f.read() print(content)
2. read(n) 读取n个字符. 需要注意的是. 如果再次读取. 那么会在当前位置继续去读?不
是从头读, 如果使?的是rb模式. 则读取出来的是n个字节。
f = open("test.txt", mode="r" encoding="utf-8") content = f.read(3) print(content)
3. readline() ?次读取??数据, 注意: readline()结尾, 注意每次读取出来的数据都会有?
个 所以呢. 需要我们使?strip()?法来去掉 或者空格
f = open("../def/哇擦.txt", mode="r", encoding="utf-8") content = f.readline() print(content)
4. readlines()将每??形成?个元素, 放到?个列表中. 将所有的内容都读取出来. 所以
也是容易出现内存崩溃的问题.不推荐使?
f = open("test.txt", mode="r", encoding="utf-8") lst = f.readlines() print(lst) for line in lst: print(line.strip())
5. 循环读取. 这种?式是组好的. 每次读取??内容.不会产?内存溢出的问题.
f = open("test.txt", mode="r", encoding="utf-8")
for line in f:
print(line.strip())
6.注意: 读取完的?件句柄?定要关闭 f.close()
三. 写模式(w, wb)
写的时候注意. 如果没有?件. 则会创建?件, 如果?件存在. 则将原件中原来的内容删除, 再写入新内容
f = open("test.txt", mode="w", encoding="utf-8")
f.write("??狮王")
f.flush() # 刷新. 养成好习惯
f.close()
wb模式下. 可以不指定打开?件的编码. 但是在写?件的时候必须将字符串转化成utf-8的bytes数据
f = open("test.txt", mode="wb")
f.write("??狮王".encode("utf-8"))
f.flush()
f.close()
四. 追加(a, ab)
在追加模式下. 我们写入的内容会追加在?件的结尾。有这个文件,则会在末尾追加。如果没有此文件,则会创建。
f = open("test.txt", mode="a", encoding="utf-8") f.write("张三的最爱") f.flush() f.close()
ab模式代码如下:
f = open("test.txt", mode="ab") f.write("麻花藤的最爱".encode(‘utf-8‘)) f.flush() f.close()
五. 读写模式(r+, r+b)
对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进?写入. 我们以后使?频率最?的模式就是r+
f = open("test.txt", mode="r+", encoding="utf-8") content = f.read() f.write("麻花藤的最爱") print(content) f.flush() f.close()
注意:r+模式下. 必须是先读取. 然后再写入
六. 写读(w+, w+b)
先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常?。 w+ 模式下, ?开始读取不到数据. 然后写的时候再将原来的内容清空. 所以, 很少?。
f = open("test.txt", mode="w+", encoding="utf-8") f.write("哈哈") content = f.read() print(content) f.flush() f.close()
七. 追加读(a+)
a+模式下, 不论先读还是后读. 都是读取不到数据的.
f = open("?娃娃", mode="a+", encoding="utf-8") f.write("?化腾") content = f.read() print(content) f.flush() f.close()
还有?些其他的带b的操作. 就不多赘述了. 就是把字符换成字节. 仅此?已
八. 其他相关操作
1. seek(n) 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中?部分要
是3的倍数.
通常我们使?seek都是移动到开头或者结尾.
移动到开头: seek(0)
移动到结尾: seek(0,2) seek的第?个参数表?的是从哪个位置进?偏移, 默认是0, 表
?开头, 1表?当前位置, 2表?结尾
使用时,不知道有没有遇到这个错误:io.UnsupportedOperation: can‘t do nonzero cur-relative seeks
这个问题主要是因为在python3和python2的问题,如果在Python2中是不会报错的,Python3则会报错。因为Pyhon3在文本文件中,没有使用b模式选项打开的文件,只允许从文件头开始计算相对位置,从文件尾计算时就会引发异常。
f = open("test.txt", mode="rb") f.seek(0) # 光标移动到开头 content = f.read() # 读取内容, 此时光标移动到结尾 print(content) print(f.tell()) f.seek(-3, 1) # 再次将光标移动到开头 content = f.read(6) # 读取内容, 此时光标移动到结尾 print(content) print(f.tell()) f.flush() f.close()
2.tell()方法也使用了,就是告诉用户,当前光标在什么位置。计算时,是按照,字节数累加的。
3.truncate()
此方法的作用就是,删除光标后面的所有内容。
f = open(‘test.txt‘,mode=‘w‘,encoding=‘utf-8‘)#此行代码执行后,文件中就没有文字了,所以需要下面的f.write(‘哈呵护‘),写入一些值。这是因为‘w’模式就是这个特点。 f.write(‘哈呵护‘) c = f.seek(6) print(c) f.truncate() f = open(‘test.txt‘, mode=‘r+‘, encoding=‘utf-8‘) print(f.read()) f.seek(0) f.seek(3) f.truncate() print(f.read())
九. 修改?件以及另?种打开?件的?式
?件修改: 只能将?件中的内容读取到内存中, 将信息修改完毕, 然后将源?件删除, 将新?件的名字改成老?件的名字.
# ?件修改
import os with open("test.txt", mode="r", encoding="utf-8") as f1, open("test_new.txt", mode="w", encoding="UTF-8") as f2: content = f1.read() new_content = content.replace("冰糖葫芦", "??梨") f2.write(new_content) os.remove("?娃娃") # 删除源?件 os.rename("test_new.txt", "?娃娃") # 重命名新?件 弊端: ?次将所有内容进?读取. 内存溢出. 解决?案: ????的读取和操作 import os with open("test.txt", mode="r", encoding="utf-8") as f1, open("?娃娃_new", mode="w", encoding="UTF-8") as f2: for line in f1: new_line = line.replace("??梨", "冰糖葫芦") f2.write(new_line) os.remove("test.txt") # 删除源?件 os.rename("test_new.txt", "test.txt") # 重命名新?件
以上是关于文件操作的主要内容,如果未能解决你的问题,请参考以下文章