ValueError:使用序列设置数组元素

Posted

技术标签:

【中文标题】ValueError:使用序列设置数组元素【英文标题】:ValueError: setting an array element with a sequence 【发布时间】:2011-06-08 03:37:00 【问题描述】:

此 Python 代码:

import numpy as p

def firstfunction():
    UnFilteredDuringExSummaryOfMeansArray = []
    MeanOutputHeader=['TestID','ConditionName','FilterType','RRMean','HRMean',
                      'dZdtMaxVoltageMean','BZMean','ZXMean','LVETMean','Z0Mean',
                      'StrokeVolumeMean','CardiacOutputMean','VelocityIndexMean']
    dataMatrix = BeatByBeatMatrixOfMatrices[column]
    roughTrimmedMatrix = p.array(dataMatrix[1:,1:17])


    trimmedMatrix = p.array(roughTrimmedMatrix,dtype=p.float64)  #ERROR THROWN HERE


    myMeans = p.mean(trimmedMatrix,axis=0,dtype=p.float64)
    conditionMeansArray = [TestID,testCondition,'UnfilteredBefore',myMeans[3], myMeans[4], 
                           myMeans[6], myMeans[9], myMeans[10], myMeans[11], myMeans[12],
                           myMeans[13], myMeans[14], myMeans[15]]
    UnFilteredDuringExSummaryOfMeansArray.append(conditionMeansArray)
    secondfunction(UnFilteredDuringExSummaryOfMeansArray)
    return

def secondfunction(UnFilteredDuringExSummaryOfMeansArray):
    RRDuringArray = p.array(UnFilteredDuringExSummaryOfMeansArray,dtype=p.float64)[1:,3]
    return

firstfunction()

抛出此错误消息:

File "mypath\mypythonscript.py", line 3484, in secondfunction
RRDuringArray = p.array(UnFilteredDuringExSummaryOfMeansArray,dtype=p.float64)[1:,3]
ValueError: setting an array element with a sequence.

谁能告诉我如何解决上面损坏的代码中的问题,以便它停止抛出错误消息?


编辑: 我做了一个打印命令来获取矩阵的内容,这就是它打印出来的:

UnFilteredDuringExSummaryOfMeansArray 是:

[['TestID', 'ConditionName', 'FilterType', 'RRMean', 'HRMean', 'dZdtMaxVoltageMean', 'BZMean', 'ZXMean', 'LVETMean', 'Z0Mean', 'StrokeVolumeMean', 'CardiacOutputMean', 'VelocityIndexMean'],
[u'HF101710', 'PreEx10SecondsBEFORE', 'UnfilteredBefore', 0.90670000000000006, 66.257731979420001, 1.8305673000000002, 0.11750000000000001, 0.15120546389880002, 0.26870546389879996, 27.628261216480002, 86.944190346160013, 5.767261352345999, 0.066259118585869997],
[u'HF101710', '25W10SecondsBEFORE', 'UnfilteredBefore', 0.68478571428571422, 87.727887206978565, 2.2965444125714285, 0.099642857142857144, 0.14952476549885715, 0.24916762264164286, 27.010483303721429, 103.5237336525, 9.0682762747642869, 0.085022572648242867],
[u'HF101710', '50W10SecondsBEFORE', 'UnfilteredBefore', 0.54188235294117659, 110.74841107829413, 2.6719262705882354, 0.077705882352917643, 0.15051306356552943, 0.2282189459185294, 26.768787504858825, 111.22827075238826, 12.329456404418824, 0.099814258468417641],
[u'HF101710', '75W10SecondsBEFORE', 'UnfilteredBefore', 0.4561904761904762, 131.52996981880955, 3.1818159523809522, 0.074714285714290493, 0.13459344175047619, 0.20930772746485715, 26.391156337028569, 123.27387909873812, 16.214243779323812, 0.1205685359981619]]

对我来说,它看起来像一个 5 行乘 13 列的矩阵,尽管当通过脚本运行不同的数据时行数是可变的。使用我在其中添加的相同数据。

EDIT 2:但是,脚本抛出错误。所以我认为你的想法不能解释这里发生的问题。不过谢谢。还有其他想法吗?


编辑 3:

仅供参考,如果我替换此问题代码行:

    RRDuringArray = p.array(UnFilteredDuringExSummaryOfMeansArray,dtype=p.float64)[1:,3]

用这个代替:

    RRDuringArray = p.array(UnFilteredDuringExSummaryOfMeansArray)[1:,3]

然后脚本的该部分可以正常工作而不会引发错误,但是接下来的这行代码:

p.ylim(.5*RRDuringArray.min(),1.5*RRDuringArray.max())

抛出此错误:

File "mypath\mypythonscript.py", line 3631, in CreateSummaryGraphics
  p.ylim(.5*RRDuringArray.min(),1.5*RRDuringArray.max())
TypeError: cannot perform reduce with flexible type

所以你可以看到我需要指定数据类型才能在 matplotlib 中使用 ylim,但是指定数据类型会抛出启动此帖子的错误消息。

【问题讨论】:

有人想从这个问题中删除所有不相关的细节吗? 【参考方案1】:

从您向我们展示的代码中,我们唯一可以看出您正试图从一个形状不像多维数组的列表中创建一个数组。例如

numpy.array([[1,2], [2, 3, 4]])          # wrong!

numpy.array([[1,2], [2, [3, 4]]])        # wrong!

将产生此错误消息,因为输入列表的形状不是可以转换为多维数组的(通用)“框”。所以可能UnFilteredDuringExSummaryOfMeansArray 包含不同长度的序列。

此错误消息的另一个可能原因是尝试将字符串用作float 类型数组中的元素:

numpy.array([1.2, "abc"], dtype=float)   # wrong!

根据您的编辑,这就是您正在尝试的。如果你真的想要一个包含字符串和浮点数的 NumPy 数组,你可以使用 dtype object,它使数组能够保存任意 Python 对象:

numpy.array([1.2, "abc"], dtype=object)

不知道你的代码应该完成什么,我无法判断这是否是你想要的。

【讨论】:

谢谢,但我认为这不是答案。当它抛出上面的错误时,我已经添加了数组的内容。在我看来,当我将它粘贴到记事本中并逐行检查时,它就是一个框。还有其他想法吗? 您的编辑似乎解决了我的问题。我需要设置 dtype=object。非常感谢。 这个问题已经完全回答了。 另一种可能性可能是 1.9 中在构建实现​​ __getitem__ 的对象数组(不一定是列表)时出现问题,如下所示:github.com/numpy/numpy/issues/5100 对我来说问题是嵌套列表中的列表形状不同;一个有示例 4 个元素,而另一个有 5 个。将嵌套列表的形状更改为相同后,该问题将得到解决。【参考方案2】:

在我的例子中,我有一个嵌套列表作为我想用作输入的系列。

第一次检查:如果

df['nestedList'][0]

输出一个类似[1,2,3]的列表,你有一个嵌套列表。

然后检查一下改输入df['nestedList'][0]时是否仍然报错。

那么您的下一步可能是将所有嵌套列表连接到一个未嵌套列表中,使用

[item for sublist in df['nestedList'] for item in sublist]

嵌套列表的这种扁平化是从How to make a flat list out of list of lists?借来的。

【讨论】:

【参考方案3】:

当形状不规则或元素具有不同的数据类型时,传递给np.array的dtype参数只能是object

import numpy as np

# arr1 = np.array([[10, 20.], [30], [40]], dtype=np.float32)  # error
arr2 = np.array([[10, 20.], [30], [40]])  # OK, and the dtype is object
arr3 = np.array([[10, 20.], 'hello'])     # OK, and the dtype is also object

``

【讨论】:

欢迎来到 SO。这个问题很老了,看起来你的答案至少重复了其他一个。如果您的答案实际上不同,请尝试添加更多详细信息来说明方法。【参考方案4】:

就我而言,问题出在数据框 X[] 的散点图上:

ax.scatter(X[:,0],X[:,1],c=colors,    
       cmap=CMAP, edgecolor='k', s=40)  #c=y[:,0],

#ValueError: setting an array element with a sequence.
#Fix with .toarray():
colors = 'br'
y = label_binarize(y, classes=['Irrelevant','Relevant'])
ax.scatter(X[:,0].toarray(),X[:,1].toarray(),c=colors,   
       cmap=CMAP, edgecolor='k', s=40)

【讨论】:

再解释一下就好了。 值错误意味着我们试图将一个 n 元素数组(序列)加载到只有一个浮点数的单个数字槽中。因此,您尝试使用序列设置数组元素。使用 .toarray() 我们将其放大为一个序列数组。 toarray() 返回一个 ndarray;【参考方案5】:

对于那些在 Numpy 中遇到类似问题的人,一个非常简单的解决方案是:

定义dtype=object 时定义一个数组来为其赋值。例如:

out = np.empty_like(lil_img, dtype=object)

【讨论】:

它与接受答案的Edit 部分有何不同。【参考方案6】:

在我的例子中,我在 Tensorflow 中遇到了这个错误,原因是我试图提供一个不同长度或序列的数组:

示例:

import tensorflow as tf

input_x = tf.placeholder(tf.int32,[None,None])



word_embedding = tf.get_variable('embeddin',shape=[len(vocab_),110],dtype=tf.float32,initializer=tf.random_uniform_initializer(-0.01,0.01))

embedding_look=tf.nn.embedding_lookup(word_embedding,input_x)

with tf.Session() as tt:
    tt.run(tf.global_variables_initializer())

    a,b=tt.run([word_embedding,embedding_look],feed_dict=input_x:example_array)
    print(b)

如果我的数组是:

example_array = [[1,2,3],[1,2]]

然后我会得到错误:

ValueError: setting an array element with a sequence.

但是如果我做填充然后:

example_array = [[1,2,3],[1,2,0]]

现在它正在工作。

【讨论】:

我在使用 pyCUDA 时不小心将 gpuarray 元素分配给了 numpy 数组。我遇到了同样的错误。 @Aaditya Ura,如何进行这样的填充,你能参考一下吗?【参考方案7】:

就我而言,问题是另一个问题。我正在尝试将 int 列表的列表转换为数组。问题是有一个列表的长度与其他列表不同。如果你想证明它,你必须这样做:

print([i for i,x in enumerate(list) if len(x) != 560])

在我的例子中,长度参考是 560。

【讨论】:

【参考方案8】:

Python ValueError:

ValueError: setting an array element with a sequence.

正如它所说的那样,您正试图将一系列数字塞进一个数字槽中。它可以在各种情况下抛出。

1.当你传递一个 python 元组或列表被解释为一个 numpy 数组元素时:

import numpy

numpy.array([1,2,3])               #good

numpy.array([1, (2,3)])            #Fail, can't convert a tuple into a numpy 
                                   #array element


numpy.mean([5,(6+7)])              #good

numpy.mean([5,tuple(range(2))])    #Fail, can't convert a tuple into a numpy 
                                   #array element


def foo():
    return 3
numpy.array([2, foo()])            #good


def foo():
    return [3,4]
numpy.array([2, foo()])            #Fail, can't convert a list into a numpy 
                                   #array element

2。通过尝试将长度大于 1 的 numpy 数组填充到 numpy 数组元素中:

x = np.array([1,2,3])
x[0] = np.array([4])         #good



x = np.array([1,2,3])
x[0] = np.array([4,5])       #Fail, can't convert the numpy array to fit 
                             #into a numpy array element

正在创建一个 numpy 数组,而 numpy 不知道如何将多值元组或数组塞入单个元素槽中。它希望你给它的任何东西都计算为单个数字,如果没有,Numpy 会响应它不知道如何使用序列设置数组元素。

【讨论】:

很好的解释

以上是关于ValueError:使用序列设置数组元素的主要内容,如果未能解决你的问题,请参考以下文章

ValueError:使用序列python,numpy设置数组元素[重复]

SKLearn ValueError:使用序列设置数组元素

ValueError:在 TFIDF 上训练 KD TRee 时使用序列设置数组元素

ValueError:使用序列设置数组元素(LogisticRegression with Array based feature)

Scikit/Numpy/Pandas ValueError:使用序列设置数组元素

approx_fprime - ValueError:使用序列设置数组元素