使用 seaborn 的 Jointplot 多索引列

Posted

技术标签:

【中文标题】使用 seaborn 的 Jointplot 多索引列【英文标题】:Jointplot multiindex columns with seaborn 【发布时间】:2018-09-15 04:46:03 【问题描述】:

我有这个数据框:

df = pd.DataFrame('col1': ['A', 'A', 'B', 'B', 'B'], 'col2': ['A1', 'B1', 'B1', 'B1', 'A1'])

              col1  col2

0   A   A1
1   A   B1
2   B   B1
3   B   B1
4   B   A1

我做了一个分组。结果是一个多索引列

df = df.groupby(['col1']).agg('col2': ['nunique','count'])

       col2
       nunique   count
 col1       
 A     2           2
 B     2           3

然后,我从 seaborn 图书馆做了一个联合图

sns.jointplot(x=['col2','nunique'],y=['col2','count'],data=df,kind='scatter')

我收到了这个错误

TypeError: only integer scalar arrays can be converted to a scalar index

我的问题是:

有没有办法像这样将多索引列拆分为两个单独的列?

col1  col2_unique col2_count        
 A     2           2
 B     2           3

有没有办法联合绘制多索引列?

感谢您的帮助!

【问题讨论】:

【参考方案1】:

您可以通过在列表中指定列 col2 来更改聚合,在 agg 中仅使用聚合函数来避免列中的 MultiIndex

df = df.groupby(['col1'])['col2'].agg(['nunique','count'])
print(df)
      nunique  count
col1                
A           2      2
B           2      3

sns.jointplot(x='nunique', y='count', data=df, kind='scatter')

如果需要,可以在 agg 中使用 dictinary 或展平 MultiIndex - 例如聚合另一列:

df = df.groupby(['col1']).agg('col2': ['nunique','count'], 'col1':['min'])

df.columns = df.columns.map('_'.join)
print (df)
     col1_min  col2_nunique  col2_count
col1                                   
A           A             2           2
B           B             2           3

【讨论】:

以上是关于使用 seaborn 的 Jointplot 多索引列的主要内容,如果未能解决你的问题,请参考以下文章

在 seaborn.jointplot 中绘制两个分布

如何绘制非方形 Seaborn jointplot 或 JointGrid

在 Seaborn Jointplot 上绘制对角线(相等线)

(数据科学学习手札62)详解seaborn中的kdeplotrugplotdistplot与jointplot

seaborn使用jointplot函数为散点图添加边缘图添加回归线为边缘直方图添加密度曲线(Add Regression Line to Marginal Plot)

seaborn使用jointplot函数为散点图添加边缘图添加回归线为边缘直方图添加密度曲线使用ratio函数突出显示边缘图形(focus on Marginal Plot )