ValueError:长度不匹配:在熊猫数据框中创建分层列时,预期的轴有 0 个元素

Posted

技术标签:

【中文标题】ValueError:长度不匹配:在熊猫数据框中创建分层列时,预期的轴有 0 个元素【英文标题】:ValueError: Length mismatch: Expected axis has 0 elements while creating hierarchical columns in pandas dataframe 【发布时间】:2017-08-28 16:22:30 【问题描述】:

我正在通过documentation 了解 Pandas 中的分层索引。我尝试测试其中的示例以创建具有分层索引的空数据框:

In [5]: df = pd.DataFrame()

In [6]: df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]])

但是,它会引发错误:

ValueError                                Traceback (most recent call last)
<ipython-input-6-dd823f9b8d22> in <module>()
----> 1 df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]])

/usr/local/lib/python3.4/dist-packages/pandas/core/generic.py in __setattr__(self, name, value)
   2755         try:
   2756             object.__getattribute__(self, name)
-> 2757             return object.__setattr__(self, name, value)
   2758         except AttributeError:
   2759             pass

pandas/src/properties.pyx in pandas.lib.AxisProperty.__set__ (pandas/lib.c:44873)()

/usr/local/lib/python3.4/dist-packages/pandas/core/generic.py in _set_axis(self, axis, labels)
    446 
    447     def _set_axis(self, axis, labels):
--> 448         self._data.set_axis(axis, labels)
    449         self._clear_item_cache()
    450 

/usr/local/lib/python3.4/dist-packages/pandas/core/internals.py in set_axis(self, axis, new_labels)
   2800             raise ValueError('Length mismatch: Expected axis has %d elements, '
   2801                              'new values have %d elements' %
-> 2802                              (old_len, new_len))
   2803 
   2804         self.axes[axis] = new_labels

ValueError: Length mismatch: Expected axis has 0 elements, new values have 4 elements

我的代码没有任何问题。任何想法发生了什么?

【问题讨论】:

【参考方案1】:

问题是你有一个空的数据框,它有零列,你试图给它分配一个四列的多索引;如果最初创建一个四列的空数据框,错误就会消失:

df = pd.DataFrame(pd.np.empty((0, 4)))    
df.columns = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]])

或者您可以使用多索引创建空数据框,如下所示:

multi_index = pd.MultiIndex(levels = [['first', 'second'], ['a', 'b']], labels = [[0, 0, 1, 1], [0, 1, 0, 1]])    
df = pd.DataFrame(columns=multi_index)

df
#   first    second
#  a    b   a     b

【讨论】:

谢谢!顺便说一句,我从未见过像pd.np. 这样的东西。你能详细说明一下吗? 不客气。 pd.npimport numpy as np; np... 的简写,因此您可以从 pandas.np 模块访问 numpy 函数,而无需显式导入 numpy 模块。 这是新的。谢谢! 顺便说一句,使用pd.np 将很快被弃用;所以不要使用它。只需在您编写的任何新代码中直接导入 numpy。【参考方案2】:

此解决方案不需要numpy:

# create empty DataFrame with 4 columns
df = pd.DataFrame(columns = range(4))

df.columns = pd.MultiIndex(
    levels = [['first', 'second'], ['a', 'b']], 
    codes = [[0, 0, 1, 1], [0, 1, 0, 1]]
)

(注意:我将 labels 更改为 codes,因为在 Pandas v1.0.0 中已更改)

【讨论】:

以上是关于ValueError:长度不匹配:在熊猫数据框中创建分层列时,预期的轴有 0 个元素的主要内容,如果未能解决你的问题,请参考以下文章

用值填充列(熊猫)

当返回的列表长度与数据框列数相同时,应用 + 列表推导会给出 ValueError

ValueError:熊猫数据框中的项目数量错误

ValueError:使用字典时无法将不匹配长度分配给掩码数组

如何在熊猫数据框中创建滑动窗口并应用函数

ValueError 将多索引熊猫数据框转换为 Excel