python之文件操作

Posted 不夜男人

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之文件操作相关的知识,希望对你有一定的参考价值。

读写文件是最常见的IO操作。

在磁盘上读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称之为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

读文件:

1
2
3
4
read([size]):读取文件(读取size字节,默认读取全部)
readline([size]):读取一行
readlines([size]) :读取缓冲buf(io.DEFAULT_SET_BUFFER),返回每一行所组成的列表
iter:使用迭代器遍历读取文件 f.open(name);iter_f = iter(f);用for line in iter_f循环迭代器

  要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传人文件名和标识符。

1
>>> f = open(\'/opt/test.txt\',\'r\')

  标识符\'r\'表示读,如果文件不存在,open()函数就会抛出一个FileNotFoundError的错误,并提示文件不存在。

1
2
3
4
5
6
>>> f = open(\'test.txt\',\'r\')
 
Traceback (most recent call last):
  File "D:/Users/练习.py", line 305in <module>
    = open(\'test.txt\',\'r\')
FileNotFoundError: [Errno 2] No such file or directory: \'test.txt\'

  文件打开成功,则调用read()方法可以一次读取文件的全部内容,Python把内容读到内存,用str对象表示:close()方法关闭文件。文件使用完必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量是有限的。

1
2
3
4
5
= open(\'test.txt\',\'r\')
print(f.read())
f.close()
 
hello world

  使用with语句可以来自动帮我们调用close()方法。

1
2
3
4
with open(\'test.txt\',\'r\') as f:
    print(f.read())
 
hello world

  调用read()会一次性读取文件的全部内容,如果文件过大,内存就爆了,所以,保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。另外,readline()可以每次读取一行的内容,调用readlines()一次读取所有内容并按行返回list。

  如果文件过小,read()一次性读取最方便,如果不能确定文件大小,可以反复调用read(size)比较保险,如果是配置文件,调用readlines()最方便。

1
2
for line in f.readlines():
    print(line.strip()) # 把末尾的\\n去除

  二进制文件

  要读取二进制文件,如图片、视频等,用‘rb’模式打开文件

1
2
3
4
with open(\'test.txt\',\'rb\') as f:
    print(f.read())
 
b\'hello world\\r\\n\\xe5\\x88\\xa4\'

  字符编码

  windows下默认编码是gbk模式,要读取utf-8编码的文本文件,需要给open()函数传人encoding参数

1
2
3
4
5
with open(\'test.txt\',\'r\',encoding=\'utf8\') as f:
    print(f.read())
 
hello world
判断下列

  遇到编码不规范的文件,可能会碰到UnicodeDecodeError,这是由于文本文件中可能夹杂了一些非法编码的字符,open()函数还接收了一个errors参数,表示如果遇到编码错误后如何处理,最简单的方式就是直接忽略。

1
2
with open(\'test.txt\',\'r\',encoding=\'utf8\',errors=\'ingore\') as f:
    print(f.read())

写文件:

1
2
write(str):将字符串写入文件
writelines(sequence_of_strings):写多行到文件,参数为可迭代的对象<br>flush() 将存放再内存中的内容写入硬盘。

  当调用write()时,Python解释器调用系统想把内容写到磁盘,但Linux内核有文件缓冲机制,所以会缓存到内核的缓存区,当调用close()或者flush()时才会把内容写到文件。或者写入数据量大于或等于写缓存,写缓存也会同步到磁盘上。

  写文件和读文件一样,都是调用open()函数,唯一区别就是标识符的传人,\'w\',或者\'wb\'来表示写文本文件或者写二进制文件。

1
2
with open(\'t.txt\',\'w\') as f_w:
    f_w.write(\'hello world\')

  写入文件如不存在时,会直接创建该文件并进行写入操作。如果文件里面又内容时,会覆盖掉原有的文件。

  追加文件内容则可以传入\'a\'参数。

 文件指针的操作:

1
2
3
seek(offset[,whwence]) 移动文件指针 # offset 偏移量,可以为负数。 whenc 偏移相对位置。有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的
tell 打印指针所在位置
truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果。

 

 

以上是关于python之文件操作的主要内容,如果未能解决你的问题,请参考以下文章

python之模块和包

python之基础篇——模块与包

《Python学习之路 -- Python基础之切片》

Python 之 Socket编程(TCP/UDP)

python基础之文件基本操作

python常用代码片段总结