Python删除重复项并将其写入新文件
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python删除重复项并将其写入新文件相关的知识,希望对你有一定的参考价值。
我想从文本文件中删除重复的行,并写入两个新的文本文件:1个没有重复的输出文件,另一个文件包含在我的原始文件中重复的行。
import re
import sys
lines_seen = set() # holds lines already seen
lines_seen.clear()
dups=open("dups.txt", "w")
outfile = open("out.txt", "w")
for line in open("input.txt", "r"):
if line not in lines_seen: # not a duplicate
outfile.write(line)
lines_seen.add(line)
else:
dups.write(line)
lines_seen.clear()
outfile.close()
dups.close()
输出文件小于原始文件,这意味着已删除行;但是,重复的文件为空,不会写入重复的行。
答案
由于要清除dups文件并再次对其进行写入,因此需要在其后附加:
dups=open("dups.txt", "a")
以上是关于Python删除重复项并将其写入新文件的主要内容,如果未能解决你的问题,请参考以下文章
使用Python解决对比出两个Excel文件中的不同项并将结果重新写入一个新的Excel文件
从 BigQuery 读取数据并将其写入云存储上的 avro 文件格式