Python拼接两个TXT文件(遍历文件夹,去除重复记录)

Posted 元宝山小王子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python拼接两个TXT文件(遍历文件夹,去除重复记录)相关的知识,希望对你有一定的参考价值。

# -*- coding:utf-8 -*-
#将所有TXT连接成一个,并删除掉重复记录
import os
import time
def BianLi(rootDir):
    print "开始拼接数据,请稍等..."
    start_time = time.time()
    fh = open(C://Users//Administrator//PycharmProjects//···//ALL.txt, "w")
    list1=[]
    for root,dirs,files in os.walk(rootDir):
        for filename in files:  #这里得到的filename只是一个文件名的字符串而已,如:test.txt
            filepath = rootDir+filename  #拼接目录和文件名得到完整路径
            file = open(filepath, r)  
            for i in file:  #i即为file中的一行,不用再readline()了
                line = str(i).strip()
                print str(line)
                if line in list1:  #判断list里面是否有这个记录了,如果没有就加入list,如果有就跳过
                    continue
                else:
                    list1.append(line)  #向list里添加记录
                    fh.write(line+\n)
    fh.close()
    end_time = time.time()
    print "全部数据拼接完毕,用时%.2f秒" % (end_time - start_time)
rootDir = C://Users//Administrator//PycharmProjects//···//test//
BianLi(rootDir)  #调用方法

 

以上是关于Python拼接两个TXT文件(遍历文件夹,去除重复记录)的主要内容,如果未能解决你的问题,请参考以下文章

Python中如何遍历指定目录下的所有文件?

[Python]pyhon去除txt文件重复行 python 2020.2.10

水文日常~~Python如何按行读取txt文件中的数据并去除每行末尾的回车符

python 字典写入文件join把列表字符拼接成新的字符串。

python怎样批量修改文件名

利用Python将txt文件批量去除重复行内容