查找列表/文件中以特定前缀/后缀开头/结尾的所有单词

Posted

技术标签:

【中文标题】查找列表/文件中以特定前缀/后缀开头/结尾的所有单词【英文标题】:find all words in list/file that begin/ends with a specific prefix/suffix 【发布时间】:2017-01-27 03:45:17 【问题描述】:

以下代码给出了以特定前缀/后缀开头/结尾的单词:

string_list = [line.strip() for line in open("file.txt", 'r')]
for word in string_list:
    if word[-1] == "a":
        print word

        
string_list = [line.strip() for line in open("file.txt", 'r')]
for word in string_list:
    if word[0] == "fi":
        print word

如何优化它以在海量数据上真正快速?

【问题讨论】:

您可能希望将其发布到 codereview。 【参考方案1】:

如果word 是一个字符串,那么word[0] == "fi" 不会像您认为的那样做。

您可以改用startswithendswith 来检查多字符 后缀和前缀。

string_list = open("file.txt", 'r')

for word in string_list:
    if word.startswith("fi") or word.endswith('a'):
        print word

要将后缀/前缀作为参数传递给脚本,请查看argparse

【讨论】:

我将它更新为 x = filter(lambda s: s.startswith("fi"), string_list) 如何同时使用 sys.argv[] 和 argparse?【参考方案2】:

如果您需要速度,您可以简单地使用GREP,它是用低级语言编写的,并且肯定比 python 循环快得多。

它也是可移植的,在 Linux/Windows/OSX/...上运行得很好。

【讨论】:

grep 可以更快,但我想通过使用 py 足够快

以上是关于查找列表/文件中以特定前缀/后缀开头/结尾的所有单词的主要内容,如果未能解决你的问题,请参考以下文章

Linux shell提取字符串,文件中以a开头以z结尾的所有字符串

Linux如何查找特定字符文件或目录

Python - 通过列表中的前缀和后缀删除元组

急!如何批量删除数据库中以特定字符开头和结尾的字符串

#查找列表中元素,移除每个元素的空格,并查找以 a或A开头 并且以 c 结尾的所有元素

按后缀排序列表