最佳列表理解(过滤现有列表)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最佳列表理解(过滤现有列表)相关的知识,希望对你有一定的参考价值。

我有一个大型列表(1e8 +条目),形式为[index:boolean]。我想找到值为True的索引。这项任务的执行至关重要。

目前我从Python 3.7.2中可以看出,最佳方法是使用列表推导,如下所示:

return [i for i, j in enumerate(numbers) if j]

我也尝试了以下(虽然它似乎只是早期版本的Python的首选方法):

return list(filter(lambda a: a, numbers))

第二种方法比第一种方法慢约25%。

目前,此操作大约需要(0.8 * x)时间,其中算法的实际逻辑部分需要'x'时间。 (例如,如果逻辑需要10秒,则从列表中提取正值大约需要8秒)。我曾希望这项行动会更快。

答案

这项任务的执行至关重要

那你应该考虑使用一个numpy数组:

import numpy as np
from random import choice
from timeit import Timer

bools = True, False
li = [choice(bools) for _ in range(int(1e8))]
arr = np.array(li)  

print(Timer(lambda: np.nonzero(arr)).repeat(1, 1))

输出

[0.4524359999999916]

这是0.4524359999999916秒。

以上是关于最佳列表理解(过滤现有列表)的主要内容,如果未能解决你的问题,请参考以下文章

迭代列表时更改列表的最佳方法[重复]

将项目添加到列表视图并过滤现有项目

片段之间的共享数据(父列表视图和子列表视图)

使用CMake检查列表是否包含特定条目的最佳方法

在 Excel 中筛选大型列表的最佳方法是啥?

在方向更改时保留列表片段中的列表