初学Python——文件操作

Posted 2020-10-30 学霸初养成

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了初学Python——文件操作相关的知识，希望对你有一定的参考价值。

一、文件的打开和关闭

1.常用的打开关闭语句

f=open("yesterday","r",encoding="utf-8")   #打开文件
f,close()   #关闭文件

第一行是打开名为“yesterday”的文件，只读属性，编码方式为utf-8。如果没有指定文件打开方式，默认只读“r”，如果没有指定编码方式可能会部分乱码。

第二行是关闭文件

2.with as语句

目的：为了防止程序员打开文件后忘记关闭文件

with open("yesterday","r",encoding="utf-8") as f:
    <代码段>

3.文件打开方式

打开方式	是否可读	是否可写	是否可创建	是否会覆盖	特点	建议
r	是	否	否	否	只读，安全	推荐
r+	是	追加	否	有时部分覆盖	容易写入出错	不建议
w	否	是	是	全覆盖	只写	谨慎
w+	否	是	是	全覆盖	只写打开文件即清空	不建议数据非常不安全
a	否	追加	是	否	追加不覆盖	推荐
a+	是	追加	是	否	全能且安全	推荐

说明一下：

（1）r：如果只有读取数据的需求，建议用这种，杜绝了对数据破坏的可能。

（2）r+：之所以不推荐它是因为，写入数据的行为难以捉摸，并且可能会因此破坏数据，造成损失。如果不是十分清楚它的习性，不要用它。

写入方式：有时覆盖，有时追加。

当写入操作前一步是读取的时候，这时候不会覆盖数据，在最后追加：

f=open("yesterday3","r+",encoding="utf-8")
print(f.readline())  #读取一行数据
f.write("nihao")     #写入数据
f.close()

执行前的文件：

执行后的文件：

当写入操作前一步不是读取的时候，覆盖写入数据，从光标处开始覆盖部分数据：

f=open("yesterday3","r+",encoding="utf-8")
print(f.tell())          #获取光标当前位置
f.write("nihao")    #写入数据
f.close()

执行后：

所以，尽量不要用它

（3）w：只能写入数据，并且覆盖之前的全部数据。由于会对之前数据造成丢失，所以使用它时要谨慎。可创建的意思是如果指定打开的文件不存在，则创建一个文件。

（4）w+：不建议此种方式。每次打开文件都会对数据进行清空，即使不进行任何操作。可以这样理解：每次打开时，都会重新创建一个同名文件并覆盖，初始情况下当然是空的。可读可写可创建。

（5）a：可追加，可创建。保证了数据的安全，不会覆盖之前的数据

（6）a+：全能型选手，啥活都能干，而且数据安全，不会覆盖。但是有个特点，文件打开时光标起始位置在最后面，所以导致读取不到数据。（其他方式打开文件时，光标都在开头位置）

来测试一下：

f=open("yesterday3","a+",encoding="utf-8")
print(f.tell())           #获取光标当前位置
print(f.readline())   #读取一行数据
f.close()

运行结果：

当前光标位置327（字符），没有读取到数据。怎么办？将光标移动到开头就好了

f.seek(0)  #将光标移动到开头位置

顺利运行：

4. f 是什么？

f 叫做文件句柄。是文件的内存对象，包含文件的大小、文件名、硬盘中的起始位置等信息封装成了一个句柄。

二、文件的写和读

1.写

f.write("123\\n")

写入数据时，只能以字符形式，如果是int会出错，并且换行符“\\n”也占有相应的字符。

2.读

注意：任何时候进行读取操作，都要看清楚当前光标的位置，才能读到想要的数据。

①将所有数据一次性全部读出来（一般不用，不适合读取大文件）

data=f.read() #data是一个字符串变量
print(data)

print(f.read())    #如果这三行代码放到一起，会发现第三行代码读不出来数据，而且也没有报错，实际上是没有注意光标的位置，
要解决很简单，只要将光标移动到初始位置就好了

②只读取有限个字符

print(f.read(5)) #从光标处开始只读取5个字符

③读取一行数据

print(f.readline())  #从光标处开始读取一行数据

④readlines()

也是读取全部数据，但有所不同

a=f.readlines()

a是一个列表，文件中每一行数据都转化成列表的元素。

⑤循环读取数据

for i in range:
   print(i)

一行一行地读取数据，读完整个文件。推荐用这种方式，内存中始终只保存一行的数据，可以读大文件。

三、其他常用操作

1.查看当前光标位置

print(f.tell())

2.移动光标位置

f.seek(0)    #将光标位置移动到开头
f.seek(10)  #移动到第10个字符的位置

3.打印文件的编码

print(f.encoding)

4.判断光标是否可以移动

print(f.seekable())

在linux系统一切皆文件，终端设备文件不能移动光标

5.强制刷新

print(f.flush())

功能是，强制、立即将在此之前写入的数据写入到硬盘中。

在计算机中，往硬盘里写入数据通常不是当即发生的，写入（保存）后，操作系统会给人反馈说，已经将数据存了进去，但实际并没有立即写入，而是现将其存入系统缓存中，等到操作系统认为合适的时候再一次性写入进去。至于为什么这么做，我掌握到的有两点原因：一是提高系统运作效率，由于硬盘读写速度慢，整个程序会因为这个操作变得很慢，卡在这里，整个系统的运作效率很低；二是保护硬盘，用户可以很频繁地执行写入操作，如果硬盘也这么做（跟用户同步），硬盘寿命会大大降低。

所以，flush()方法的作用是立刻刷新硬盘的数据，将之前写入的数据立刻写入硬盘中。

6.判断文件是否关闭

当同时打开的文件很多时，可能不太清楚哪些文件关闭了，哪些文件没有关，可以用closed()方法检测一下

print(f.closed())

7.清除文件数据

f.truncate(10)

除了前10个字符，清空文件所有数据（文件打开方式不可以是“r”，最好是“a”）

清除操作跟当前光标位置无关。如果括号内不写数据，清空所有数据。

四、二进制文件

打开方式：“rb”（只读），“wb”（只写），“ra”（追加）

什么时候会用到二进制打开方式呢？

1.网络传输只能用二进制（至少在Python3.0）

2.操作二进制文件（如果用字符形式可能会出错）

五、文件修改

上面讲了文件的读写等操作，但是写不能等同于改，写只能覆盖或者追加，有什么方法呢？

一般有两种方法：1.将文件数据全部加载到内存里，针对内存里的数据进行修改，然后再写入

2.打开文件，一行一行地读入，修改完后写入新的文件。（循环执行从旧文件读一行，在新文件写一行的操作）

这里推荐第2种方法，不推荐第一种。因为计算机的内存是有限的，第一种方法不合适处理大文件，而第二种不仅合适大文件也保证了数据的安全。

f1=open("yesterday2","r",encoding="utf-8")    #打开旧文件
f2=open("yesterday3","w",encoding="utf-8")    #打开新文件
oldword=input("请输入待修改的内容：")
newword=input("请输入修改后的内容：")
for line in f1:  #迭代器循环
    if oldword in line:    #如果找到了待修改的内容
        line=line.replace(oldword,newword)   #字符串替换操作
        print("修改成功！")
    f2.write(line)         #无论是否修改了内容，都将其写入新的文件中

f2.close()       #关闭新文件
f1.close()                      #关闭旧文件

以上是关于初学Python——文件操作的主要内容，如果未能解决你的问题，请参考以下文章

python初学--文件操作字典

Python代码阅读（第19篇）：合并多个字典

初学 python 之 HAproxy配置文件操作

Python初学者第十六天文件处理操作练习

Python代码阅读（第26篇）：将列表映射成字典

Python代码阅读（第41篇）：矩阵转置