使用python对txt文本进行分析和提取
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用python对txt文本进行分析和提取相关的知识,希望对你有一定的参考价值。
现在有好多类似这样的数据要整理现在只想留姓名,卡号这些信息如何用python在大量的数据中只找到姓名,卡号这些信息如何提取这一段的整行到新的文本里面这种信息虽然乱但是每条信息之间是有空格的麻烦各位大佬了希望能带有各种说明或者注释,比较小白。
实现的方法和详细的操作步骤如下:
1、首先,打开计算机上的pycharm编辑器,如下图所示,然后进入下一步。
2、其次,完成上述步骤后,在出现的窗口中编写有关该程序的相关注释,如下图所示,然后进入下一步。
3、接着,完成上述步骤后,创建一个新的变量,为“test8”,写入如下红框内的代码,如下图所示,然后进入下一步。
4、然后,完成上述步骤后,使用replace函数,写入如下红框中的代码,如下图所示,然后进入下一步。
5、随后,完成上述步骤后,使用“print”打印执行结果,如下图所示,然后进入下一步。
6、接着,完成上述步骤后,依次单击工具栏的“Run”-->“Run”选项,如下图所示,然后进入下一步。
7、最后,完成上述步骤后,“Run”该程序,出现语句“you name is luo”,如下图所示。这样,问题就解决了。
参考技术A 有规则的比如 姓名:xxx 卡号 12356等就可以用正则 re开抽取,有点乱的话也可以增加正则规则抽取出来
但是毫无规律的话就是只能使用姓名词典,知识库进行识别名字,卡号的话可以根据各行卡号规则和长度从数据中筛选。
python3对文本文件进行操作
目的:日常中经常会对一些文本文件(.txt,.log等等后缀的文件名)进行读取、写入和信息筛选的操作。今天记录一下文本文件基础操作。
一、使用不同方法读写文件
# -*- coding: UTF-8 -*-
# 使用读取模式(mode=‘r‘)打开文件,做读取文件操作
# ‘test.txt‘ 为文件路径和文件名,此处为相对路径,可使用绝对路径(r‘C:UsersAdministratorDesktoppython est - 3.txt.txt‘)
#使用read()方法读取文件,read()读取文件所有内容,read(2)读取文件长度为2的内容
file_handleA = open(‘test - 1.txt‘, mode=‘r‘)
infoB=file_handleA.read()
print (infoB)
print (u"读取文件的所有内容")
#使用readline( )函数 默认读取文件中的一行数据
file_handleB = open(‘test - 2.txt‘, mode=‘r‘)
infoC = file_handleB.readline( )
print (infoC)
print (u"读取文件的一行内容")
#使用readlines( )函数 读取所有行的数据,会把每一行的数据作为一个元素,放到列表当中,可以使用循环将文件内容读取出来
file_handleC = open(‘test - 3.txt‘, mode=‘r‘)
#读取所有行
lines=file_handleC.readlines()
#循环将读出来的所有行依次输出出来
for line in lines:
print (line)
# 分别使用覆盖写和追加写模式写入txt文件
# mode=‘w‘将文件中原有内容清空后写入新的数据
# mode=‘a‘在源文件最后将要写入的内容写入文件
file_handleD = open(‘test - 4.txt‘, mode=‘w‘)
file_handleD.write(‘覆盖源文件写入一行内容‘)
file_handleE = open(‘test - 5.txt‘, mode=‘a‘)
file_handleE.writelines([‘追加‘, ‘写入‘, ‘多行‘, ‘数据‘])
#操作完文件之后,记得关闭文件,避免文件损坏
file_handleA.close( )
file_handleB.close( )
file_handleC.close( )
file_handleD.close( )
file_handleE.close( )
二、将文件A中的内容逐行读取并追加写入B
# -*- coding: UTF-8 -*-
#分别以读写模式打开文件A和文件B
file_handleA = open(‘A.txt‘, mode=‘r‘)
file_handleB = open(‘B.txt‘, mode=‘a‘)
#读取A文件的全部内容
lines=file_handleA.readlines()
#循环将读出来的所有行依次输出出来
for line in lines:
#循环输出读取的每一行数据
print (line)
#循环写入读取的每一行数据
file_handleB.write(line)
#关闭文件
file_handleA.close( )
file_handleB.close( )
以上是关于使用python对txt文本进行分析和提取的主要内容,如果未能解决你的问题,请参考以下文章