文件操作
Posted noplablem-wangzhe0635
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文件操作相关的知识,希望对你有一定的参考价值。
核心两种:
一:打开文件:文件句柄=open(‘文件路径‘,‘模式‘)
open(.....)和file(.....):本质上是前者内部会调用后者来进行文件操作,推荐open
二:操作文件:
文件句柄=open(‘文件路径‘,‘模式‘)
打开文件方式有:
- r 只读模式,默认。
- w 只写模式(不可读,不存在则创建,存在则删除内容)
- a 追加模式 (可读,不存在则创建,存在则只追加内容)
+表示同时可以读写内容
- r+ 可读写文件:可读可写可追加
- w+ 先写再读[先清空文件所有内容,将新内容写进去,之后也可读取写入的内容]
- a+ 同a
U 表示在读取的时候将 自动转换为 (注意:只能在r 和r+模式使用)
- rU
- r+U
- rbU
- rb+U
b 表示处理二进制文件:(如FTP发送ISO镜像文件,Linux可忽略,Windows处理二进制文件需要标注)
- rb
- wb
- ab
示例:
1 obj1 = open(‘filetest.txt‘,‘w+‘) 2 obj1.write(‘I heard the echo, from the valleys and the heart ‘) 3 obj1.writelines([‘Open to the lonely soul of sickle harvesting ‘, 4 ‘Repeat outrightly, but also repeat the well-being of ‘, 5 ‘Eventually swaying in the desert oasis‘]) 6 obj1.seek(0) 7 print("*"*50) 8 print (obj1.readline()) 9 print("*"*50) 10 print (obj1.tell()) 11 print("*"*50) 12 print (obj1.readlines()) 13 print("*"*50) 14 obj1.close()
我们以‘w+’的打开方式为例,write是向文件中写入一个字符串,而writelines是想文件中写入一个字符串数组。seek(0)方法是将指针指向其实位置,因为在写的过程中,指针的标记是随着写入的内容不断后移的,seek方法可以将指针移动到指定位置,而这个时候就指向0位置,从这个位置开始读,就可以读到刚刚写入的所有内容了;readline()是从指针位置读取一行,所以在这里,执行readline会将刚刚写入文件中的第一行读取出来;tell是指出指针当前的位置,这个时候执行tell()方法,指针指向了第二行的起始位置;之后的readlines方法,则会将文件当前指针之后的剩余内容按行读入数组中。下图是程序执行后文件和控制台的结果:
结果显示:
************************************************** I heard the echo, from the valleys and the heart ************************************************** 50 ************************************************** [‘Open to the lonely soul of sickle harvesting ‘, ‘Repeat outrightly, but also repeat the well-being of ‘, ‘Eventually swaying in the desert oasis‘] **************************************************
尽管刚刚使用‘w+‘的方式打开文件,但是事实上这种打开方式在文件处理中并不常用,曾一度被我们老师评为‘无意义’,因为用‘w+’方法会清空原文件里所有的东西~
上面一口气介绍了那么多方法,让我们有了一个笼统的概念,接下来把这些方法们各功能拿出来对比下:
写文件操作
write,writelines,相比于那些五花八门的读方法,写方法就单纯的多了,只有wite和writelines两种。看下面的例子和写入的结果,其实write方法和writelines方法都差不多,只不过一个接受的参数是list格式,一个接受的参数是字符串格式而已。这里使用的时候要注意换行符。
1 obj1 = open(‘filetest.txt‘,‘r‘) 2 obj1 = open(‘filetest.txt‘,‘w+‘) 3 obj1.write(‘I heard the echo, from the valleys and the heart Open to the lonely soul of sickle harvesting ‘) 4 obj1.writelines([ 5 ‘Repeat outrightly, but also repeat the well-being of ‘, 6 ‘Eventually swaying in the desert oasis‘ 7 ])
结果:
1 I heard the echo, from the valleys and the heart 2 Open to the lonely soul of sickle harvesting 3 Repeat outrightly, but also repeat the well-being of 4 Eventually swaying in the desert oasis
读文件操作
直接读取文件中所有内容的方法read和readlines,从下面的结果来看就知道这两种方法一个返回列表,一个是返回字符串,和上面的write方法相对应:
1 obj1 = open(‘filetest.txt‘,‘r‘) 2 print (‘readlines:‘,obj1.readlines()) #readline方法 3 print("*"*50) 4 obj1 = open(‘filetest.txt‘,‘r‘) 5 print ("read:",obj1.read())
结果:
readlines: [‘I heard the echo, from the valleys and the heart ‘, ‘Open to the lonely soul of sickle harvesting ‘, ‘Repeat outrightly, but also repeat the well-being of ‘, ‘Eventually swaying in the desert oasis‘] ************************************************** read: I heard the echo, from the valleys and the heart Open to the lonely soul of sickle harvesting Repeat outrightly, but also repeat the well-being of Eventually swaying in the desert oasis
readlines和read方法虽然简便好用,但是如果这个文件很庞大,那么一次性读入内存就降低了程序的性能,这个时候我们就需要一行一行的读取文件来降低内存的使用率了。
readline,next,用来按行读取文件,但是要是真的把这一大堆东西放在一起执行,就会报错(ValueError: Mixing iteration and read methods would lose data),具体的原因下面会进行解释。
1 obj1 = open(‘filetest.txt‘,‘r‘) 2 #readline方法 3 print ("readline:",obj1.readline()) 4 #readline方法 5 print( "next:",obj1.__next__()) 6 #readline方法 7 8 print (‘readlines:‘,obj1.readlines()) 9 obj1.seek(0) 10 #readline方法 11 print ("read:",obj1.read())
readline: 1.I heard the echo, from the valleys and the heart next: 2.Open to the lonely soul of sickle harvesting readlines: [‘3.Repeat outrightly, but also repeat the well-being of ‘, ‘4.Eventually swaying in the desert oasis ‘, ‘5.I heard the echo, from the valleys and the heart ‘, ‘6.Open to the lonely soul of sickle harvesting ‘, ‘7.Repeat outrightly, but also repeat the well-being of ‘, ‘8.Eventually swaying in the desert oasis‘] read: 1.I heard the echo, from the valleys and the heart 2.Open to the lonely soul of sickle harvesting 3.Repeat outrightly, but also repeat the well-being of 4.Eventually swaying in the desert oasis 5.I heard the echo, from the valleys and the heart 6.Open to the lonely soul of sickle harvesting 7.Repeat outrightly, but also repeat the well-being of 8.Eventually swaying in the desert oasis
seek,tell,truncate
在文件进行写操作的时候,会根据指针的位置直接覆盖相应的内容,但是很多时候我们修改完文件之后,后面的东西就不想保留了,这个时候我们使用truncate方法,文件就仅保存当前指针位置之前的内容。我们同样可以使用truncate(n)来保存n之前的内容,n表示指针位置。
with操作文件
为了避免打开文件后忘记关闭,可以通过管理上下文,即:with open(‘文件路径‘,‘操作方式‘) as 文件句柄:
#使用whith打开可以不用close
with open(‘filetest.txt‘,‘r‘) as file_obj:
file_obj.write(‘‘)
#在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,下例为同时打开两个文件
#with open(filetest1.txt‘,‘r‘) as file_obj1,open(‘filetest2.txt‘,‘w‘) as file_obj2:‘‘‘
容易犯的错误:
ValueError: Mixing iteration and read methods would lose data
我在操作文件的过程中遇到过这样一个问题,从字面上来看是说指针错误,那么这种问题是怎么产生的呢?我发现在使用next或者xreadlines方法之后再使用read或readlines方法就会出现这种错误,原因是next或者xreadlines包括我们平时常用的for循环读取文件的方式,程序都是在自己内部维护了一个指针(这也解释了我们使用这些方法的时候再用tell方法拿到的指针都是指向了的文件末尾,而不是当前独到的位置),所以如果我们要先使用上述的next或者xreadlines方法读取一行,然后再用read或readlines方法将剩余的内容读到就会报错。
解决方案:
这个时候有两种解决方案:
第一种,在读取一行后,用seek指定指针的位置,就可以继续使用其他方法了
第二种,使用readline方法,这个方法没有内部维护的指针,它就是辣么单纯的一行一行傻傻的读,指针也就傻傻的一行一行往下移动。这个时候你也可以使用tell方法追踪到指针的正确位置,也可以使用seek方法定位到想定位的地方,配合truncate,wirte等方法,简直不能更好用一些。
以上是关于文件操作的主要内容,如果未能解决你的问题,请参考以下文章