python如何实现 文件中查找上/下一个字符串

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python如何实现 文件中查找上/下一个字符串相关的知识,希望对你有一定的参考价值。

一个文本文件,每一行都是字符串,行数为百万级别;
已知某行有特定字符串(‘12efde’),想查询上一下或下一个此特定字符串(‘12efde’)在哪行?
你的例子是查找每个包含特定字符串的行,
我是想实现类似Word中,找到一个字符串,向前查找上一个,或向后查找下一个分功能;

即,我在第N行找到了想到的字符串thestr,想向上查找,最近的一行也包含此字符串,(比如N-k行),
直接顺序查找每一行,比较简单,我不知道的是,顺序到某一行后,逆序查找?

用find()函数就可以
比如:
fpr=open("你的文件名")
n=0
for line in fpr:
n+=1
if line.find("12efde")!=-1:
pirnt n

你要的是这样话,你可以先把数据读到列表中,然后用for循环来实现,顺序查找就i增加,查找上一个i减少,查找到后用break结束就行了,百万行的确有点到,读到文本不知道会不会卡,你试下看,如果你会用数据库存储数据的话会好些
参考技术A 百万行不是很多啊。大约百兆左右,直接全部读入内存。read(),然后split("\n"),然后按行find就可以了。

当然你也可以边readline边用find。找到第一行,输出行号就可以。
参考技术B 有正则吧。pattern = r"12efde",用match可以匹配到,并获取当前位置本回答被提问者采纳

Python实现在一个文件中查找另一个文件中存在的指定元素

有三个文档,文件A、文件B、文件C,A中有一组元素,我们要在文件B中找出包含文件A中元素的行,将文件写入C中。其中固定要找的元素在B中的F列,所以这里我们限定

if sheet1.cell(i + 1, 6).value in list_result:

整体代码如下:

# -*- coding:utf-8 -*-
__author__ = \'yangxin_ryan\'
import openpyxl
"""
Solution
"""


class ExcelFunction(object):

    def cell_handle(self, input_file1, input_file2, output_file):
        # 读取查找元素
        wb = openpyxl.load_workbook(input_file1, data_only=True)
        sheet = wb.worksheets[0]
        list_result = list()
        col_len = sheet.max_column
        row_len = sheet.max_row
        for i in range(row_len):
            for j in range(col_len):
                list_result.append(sheet.cell(i + 1, j + 1).value)

        # 读取查找集合
        wb1 = openpyxl.load_workbook(input_file2, data_only=True)
        sheet1 = wb1.worksheets[0]
        l

以上是关于python如何实现 文件中查找上/下一个字符串的主要内容,如果未能解决你的问题,请参考以下文章

linux下如何查找并删除/home目录下近两天生成的文件

linux如何查找以某个字母打头的文件或文件夹 比如,/etc目录下很多文件,我想列出所有以c开头的文件或文件

Python导入上一级/下一级/任一级目录下的.py文件问题

linux下如何查找并删除/home目录下近两天生成的文件

在 Pig 中使用 Python UDF 时,如何让 Hadoop 查找导入的 Python 模块?

用C/C++实现字符串的创建,并进行查找与替换