列表列表到 numpy 数组中
Posted
技术标签:
【中文标题】列表列表到 numpy 数组中【英文标题】:List of lists into numpy array 【发布时间】:2012-05-07 22:45:21 【问题描述】:如何将简单的列表列表转换为 numpy 数组?这些行是单独的子列表,每一行都包含子列表中的元素。
【问题讨论】:
【参考方案1】:如果您的列表列表包含具有不同数量元素的列表,那么 Ignacio Vazquez-Abrams 的答案将不起作用。相反,至少有 3 个选项:
1) 制作数组数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>
2) 制作一个列表数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>
3) 首先使列表长度相等:
x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>> [1, 2, 3],
>>> [1, None, None]], dtype=object)
【讨论】:
谢谢,为此而来。使用 numpy 已经有一段时间了,发现这种行为并非易事。感谢您花时间解释这个更一般的案例。dtype=float
也可以,它将None
转换为np.nan
,这可能很有用。
在 python 3.9 上,我不得不在第三个解决方案中使用 (np.vectorize(len)(x)).max()
而不是 max(map(len, x))
你会收到一个警告:VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray return array(a, dtype, copy=False, order=order)
【参考方案2】:
>>> numpy.array([[1, 2], [3, 4]])
array([[1, 2], [3, 4]])
【讨论】:
这会自动转换二维数组中的列表列表,因为所有包含列表的长度都是相同的。你知道怎么做吗:即使所有列表的长度相同,也要创建一个列表数组?或者是否可以将 2D 数组转换为 1D 数组的 1D 数组(高效我的意思是,没有迭代方法或 python 映射的东西) 如果这对您不起作用,因为您的子列表大小不一,请参阅the following answer。 @NikanaReklawyks 看了答案后我很困惑,但您的评论很有帮助。我发现我的列表不应该是锯齿状的。 相对于参数的长度有多快?我在文档中没有看到好的答案?【参考方案3】:由于这是在 Google 上将列表列表转换为 Numpy 数组的热门搜索,因此尽管这个问题已有 4 年历史,但我仍会提供以下内容:
>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]
当我第一次想到这样做时,我对自己很满意,因为它太简单了。但是,在使用更大的列表对其进行计时后,这样做实际上会更快:
>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]
请注意,@Bastiaan 的答案 #1 并没有列出一个连续的列表,因此我添加了 concatenate
。
无论如何...我更喜欢 hstack
方法,因为它可以优雅地使用 Numpy。
【讨论】:
虽然有些人可能正在寻找这个,但我很确定 OP 想要一个多维 nparr。【参考方案4】:很简单:
>>> lists = [[1, 2], [3, 4]]
>>> np.array(lists)
array([[1, 2],
[3, 4]])
【讨论】:
【参考方案5】:再次,在搜索了将N级嵌套列表转换为N维数组的问题后,我一无所获,所以这是我的解决方法:
import numpy as np
new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3
【讨论】:
请注意,如果您已经拥有嵌套列表结构,则不需要[...[...[...]]]
部分。您只需拨打np.array
和ndmin=number-of-list-layers
。 (尽管在我的情况下,出于某种原因我需要ndmin=number-of-list-layers-minus-1
,否则创建了一个额外的层——需要调查)
啊,好吧,我的问题是,对于最深的“列表层”,列表的长度并不相同,这导致np.array
只是“包装”那些最深的列表而不是将它们转换为 numpy 数组。
xi = [[[3, 4], [3, 4]], [[3, 4], [3, 4]]]
给出array([[[3, 4], [3, 4]], [[3, 4], [3, 4]]])
。我在这里只看到外层的数组。我认为问题是将所有内容都转换为 numpy 数组?还是我选错了例子?【参考方案6】:
OP 指定“行是单独的子列表,每一行包含子列表中的元素”。
假设不禁止使用numpy
(鉴于OP中已添加flair numpy),请使用vstack
:
import numpy as np
list_of_lists= [[1, 2, 3], [4, 5, 6], [7 ,8, 9]]
array = np.vstack(list_of_lists)
# array([[1, 2, 3],
# [4, 5, 6],
# [7, 8, 9]])
或更简单(如另一个答案中所述),
array = np.array(list_of_lists)
【讨论】:
【参考方案7】:我有一个等长的列表。即便如此,Ignacio Vazquez-Abrams
的回答对我来说也没有奏效。我有一个 1-D numpy 数组,其元素是列表。如果你遇到同样的问题,你可以使用下面的方法
使用numpy.vstack
import numpy as np
np_array = np.empty((0,4), dtype='float')
for i in range(10)
row_data = ... # get row_data as list
np_array = np.vstack((np_array, np.array(row_data)))
【讨论】:
如果您知道自己有 10 个列表,为什么还要继续堆叠,为什么不使用 np.empty((10, 4)) 然后将其填满?【参考方案8】:只使用熊猫
list(pd.DataFrame(listofstuff).melt().values)
这仅适用于列表列表
如果你有一个列表列表,你可能想尝试一些类似的东西
lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
【讨论】:
问题是关于 numpy,而不是 pandas。 @Rishan,感谢您的贡献。很高兴看到替代品。以上是关于列表列表到 numpy 数组中的主要内容,如果未能解决你的问题,请参考以下文章
如何将 numpy 数组列表加载到 pytorch 数据集加载器?
从 numpy 数组列表创建 numpy 数组的 Pythonic 方法