列表列表到 numpy 数组中

Posted

技术标签:

【中文标题】列表列表到 numpy 数组中【英文标题】:List of lists into numpy array 【发布时间】:2012-05-07 22:45:21 【问题描述】:

如何将简单的列表列表转换为 numpy 数组?这些行是单独的子列表,每一行都包含子列表中的元素。

【问题讨论】:

【参考方案1】:

如果您的列表列表包含具有不同数量元素的列表,那么 Ignacio Vazquez-Abrams 的答案将不起作用。相反,至少有 3 个选项:

1) 制作数组数组:

x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>

2) 制作一个列表数组:

x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>

3) 首先使列表长度相等:

x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>>       [1, 2, 3],
>>>       [1, None, None]], dtype=object)

【讨论】:

谢谢,为此而来。使用 numpy 已经有一段时间了,发现这种行为并非易事。感谢您花时间解释这个更一般的案例。 dtype=float 也可以,它将None 转换为np.nan,这可能很有用。 在 python 3.9 上,我不得不在第三个解决方案中使用 (np.vectorize(len)(x)).max() 而不是 max(map(len, x)) 你会收到一个警告:VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray return array(a, dtype, copy=False, order=order)【参考方案2】:
>>> numpy.array([[1, 2], [3, 4]]) 
array([[1, 2], [3, 4]])

【讨论】:

这会自动转换二维数组中的列表列表,因为所有包含列表的长度都是相同的。你知道怎么做吗:即使所有列表的长度相同,也要创建一个列表数组?或者是否可以将 2D 数组转换为 1D 数组的 1D 数组(高效我的意思是,没有迭代方法或 python 映射的东西) 如果这对您不起作用,因为您的子列表大小不一,请参阅the following answer。 @NikanaReklawyks 看了答案后我很困惑,但您的评论很有帮助。我发现我的列表不应该是锯齿状的。 相对于参数的长度有多快?我在文档中没有看到好的答案?【参考方案3】:

由于这是在 Google 上将列表列表转换为 Numpy 数组的热门搜索,因此尽管这个问题已有 4 年历史,但我仍会提供以下内容:

>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]

当我第一次想到这样做时,我对自己很满意,因为它太简单了。但是,在使用更大的列表对其进行计时后,这样做实际上会更快:

>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]

请注意,@Bastiaan 的答案 #1 并没有列出一个连续的列表,因此我添加了 concatenate

无论如何...我更喜欢 hstack 方法,因为它可以优雅地使用 Numpy。

【讨论】:

虽然有些人可能正在寻找这个,但我很确定 OP 想要一个多维 nparr。【参考方案4】:

很简单:

>>> lists = [[1, 2], [3, 4]]
>>> np.array(lists)
array([[1, 2],
       [3, 4]])

【讨论】:

【参考方案5】:

再次,在搜索了将N级嵌套列表转换为N维数组的问题后,我一无所获,所以这是我的解决方法:

import numpy as np

new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3

【讨论】:

请注意,如果您已经拥有嵌套列表结构,则不需要 [...[...[...]]] 部分。您只需拨打np.arrayndmin=number-of-list-layers。 (尽管在我的情况下,出于某种原因我需要ndmin=number-of-list-layers-minus-1,否则创建了一个额外的层——需要调查) 啊,好吧,我的问题是,对于最深的“列表层”,列表的长度并不相同,这导致np.array 只是“包装”那些最深的列表而不是将它们转换为 numpy 数组。 xi = [[[3, 4], [3, 4]], [[3, 4], [3, 4]]] 给出array([[[3, 4], [3, 4]], [[3, 4], [3, 4]]])。我在这里只看到外层的数组。我认为问题是将所有内容都转换为 numpy 数组?还是我选错了例子?【参考方案6】:

OP 指定“行是单独的子列表,每一行包含子列表中的元素”。

假设不禁止使用numpy(鉴于OP中已添加flair numpy),请使用vstack

import numpy as np

list_of_lists= [[1, 2, 3], [4, 5, 6], [7 ,8, 9]]

array = np.vstack(list_of_lists)
# array([[1, 2, 3],
#        [4, 5, 6],
#        [7, 8, 9]])

或更简单(如另一个答案中所述),

array = np.array(list_of_lists)

【讨论】:

【参考方案7】:

我有一个等长的列表。即便如此,Ignacio Vazquez-Abrams 的回答对我来说也没有奏效。我有一个 1-D numpy 数组,其元素是列表。如果你遇到同样的问题,你可以使用下面的方法

使用numpy.vstack

import numpy as np

np_array = np.empty((0,4), dtype='float')
for i in range(10)
     row_data = ...   # get row_data as list
     np_array = np.vstack((np_array, np.array(row_data)))

【讨论】:

如果您知道自己有 10 个列表,为什么还要继续堆叠,为什么不使用 np.empty((10, 4)) 然后将其填满?【参考方案8】:

只使用熊猫

list(pd.DataFrame(listofstuff).melt().values)

这仅适用于列表列表

如果你有一个列表列表,你可能想尝试一些类似的东西

lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)

【讨论】:

问题是关于 numpy,而不是 pandas。 @Rishan,感谢您的贡献。很高兴看到替代品。

以上是关于列表列表到 numpy 数组中的主要内容,如果未能解决你的问题,请参考以下文章

将一个 numpy 数组附加到一个列表 - 奇怪的事情

如何将不同大小的numpy数组列表保存到磁盘?

如何将 numpy 数组列表加载到 pytorch 数据集加载器?

从 numpy 数组列表创建 numpy 数组的 Pythonic 方法

Python - 如何创建一个空的numpy数组并附加到它,如列表[重复]

提取numpy数组中所有1序列的第一个和最后一个索引并将它们附加到列表中?