如何将熊猫数据框转换为多索引数据框

Posted

技术标签:

【中文标题】如何将熊猫数据框转换为多索引数据框【英文标题】:How to transform a pandas dataframe to multiindex dataframe 【发布时间】:2020-02-13 06:35:36 【问题描述】:

我有时间序列 pandas 数据框,我想将其转换为具有一列的多索引数据框。

这是数据框:

Date         MMM             ABT             ABBV            ABMD
20171017    -0.004455   0.007810    0.012260    0.011132
20171018    0.002382    0.012731    0.040296    0.002775
20171019    0.004424    0.004107    0.004561    -0.00429
20171020    0.009398    0.005682    -0.003954   0.013801

我试过这段代码:

for date in returns.index:

    arrays = [[[date] * len(returns.columns)][0], 
    list(returns.columns)]
    tuples = list(zip(*arrays))
    index = pd.MultiIndex.from_tuples(tuples)
    multi.loc[(date,np.array(index.levels[1])),:] = 
    returns.loc[date,:].values.reshape(-1,1)

但是我得到以下错误:

TypeError: unhashable type: 'numpy.ndarray'

我希望有:

                    Returns
 20171017   MMM  -0.004455
            ABT  0.007810
            ABBV     0.012260
            ABMD     0.011132
            ACN  -0.003173
            ATVI     0.002919
            ADBE     -0.000532
            AMD  -0.007062
            AAP  0.023612
            AES  -0.007149
            AMG  -0.007792
            AFL  -0.005014
            A    -0.011948
            APD  0.001629
            AKAM     -0.002966
            ALK  0.000621

【问题讨论】:

【参考方案1】:

使用DataFrame.set_indexDataFrame.stack 表示Series with MultiIndex,如有必要,使用一列DataFrame 添加Series.to_frame

df = df.set_index('Date').stack().to_frame('Returns')
print (df)
                Returns
Date                   
20171017 MMM  -0.004455
         ABT   0.007810
         ABBV  0.012260
         ABMD  0.011132
20171018 MMM   0.002382
         ABT   0.012731
         ABBV  0.040296
         ABMD  0.002775
20171019 MMM   0.004424
         ABT   0.004107
         ABBV  0.004561
         ABMD -0.004290
20171020 MMM   0.009398
         ABT   0.005682
         ABBV -0.003954
         ABMD  0.013801

【讨论】:

【参考方案2】:

使用DataFrame.set_index + DataFrame.stack。然后使用Series.rename重命名serie。最后使用to_frame转换为数据框:

df.set_index('Date').stack().rename('returns').to_frame()

                returns
Date                   
20171017 MMM  -0.004455
         ABT   0.007810
         ABBV  0.012260
         ABMD  0.011132
20171018 MMM   0.002382
         ABT   0.012731
         ABBV  0.040296
         ABMD  0.002775
20171019 MMM   0.004424
         ABT   0.004107
         ABBV  0.004561
         ABMD -0.004290
20171020 MMM   0.009398
         ABT   0.005682
         ABBV -0.003954
         ABMD  0.013801

【讨论】:

以上是关于如何将熊猫数据框转换为多索引数据框的主要内容,如果未能解决你的问题,请参考以下文章

按对象将熊猫分组转换为多索引数据框

ValueError 将多索引熊猫数据框转换为 Excel

将熊猫多索引数据框重塑为多列

将列添加到熊猫数据框以进行多索引

3维numpy数组到多索引熊猫数据框

如何将带有元组键的 python 字典转换为 pandas 多索引数据框?