Python删除重复项并将其写入新文件

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python删除重复项并将其写入新文件相关的知识,希望对你有一定的参考价值。

我想从文本文件中删除重复的行,并写入两个新的文本文件:1个没有重复的输出文件,另一个文件包含在我的原始文件中重复的行。

import re
import sys

lines_seen = set() # holds lines already seen
lines_seen.clear()
dups=open("dups.txt", "w")
outfile = open("out.txt", "w")
for line in open("input.txt", "r"):
    if line not in lines_seen: # not a duplicate
        outfile.write(line)
        lines_seen.add(line)

    else:

        dups.write(line)
lines_seen.clear()
outfile.close()
dups.close()

输出文件小于原始文件,这意味着已删除行;但是,重复的文件为空,不会写入重复的行。

答案

由于要清除dups文件并再次对其进行写入,因此需要在其后附加:

dups=open("dups.txt", "a")

以上是关于Python删除重复项并将其写入新文件的主要内容,如果未能解决你的问题,请参考以下文章

使用Python解决对比出两个Excel文件中的不同项并将结果重新写入一个新的Excel文件

删除排序数组中的重复项并将它们推送到新数组中

查找重复项并将其替换为具有相同索引位置的新数组

从 BigQuery 读取数据并将其写入云存储上的 avro 文件格式

如何删除python中的打印文本并将其替换为另一个文本[重复]

删除对象数组重复项并将非重复值存储在数组中