将 DataFrame 的列设置为 FacetGrid 图形的行

Posted 2023-03-12

技术标签:

【中文标题】将 DataFrame 的列设置为 FacetGrid 图形的行【英文标题】：Setting columns of DataFrame as rows of FacetGrid figure 【发布时间】：2019-10-27 14:34:06 【问题描述】：

我有一个国家面板数据集，其中包含每年国家观察的多个指标。为简单起见，我在这里只报告两个指标：温室气体和空气排放

rs = np.random.RandomState(4)
pos = rs.randint(-1, 2, (4, 5)).cumsum(axis=1)
pos -= pos[:, 0, np.newaxis]
pos2 = rs.randint(-4, 3, (4, 5)).cumsum(axis=1)
pos2 -= pos[:, 0, np.newaxis]
year = np.tile(range(5), 4)
walk = np.repeat(range(4), 5)

df = pd.DataFrame(np.c_[pos.flat, pos2.flat, year, walk],
                  columns=["Air emissions", 'GHG', "year", "Country ID"])

我想开发一个可视化来显示每个国家/地区年份中每个指标的趋势。每个指标都显示在一行中，而国家是我的列。到目前为止，这是我为一个指标所做的——空气排放——但我还想显示温室气体趋势（以及此处未报告的其他指标）并将它们添加到空气排放下方的行中：如何？

sns.set(style="ticks")

    # Initialize a grid of plots with an Axes for each walk
grid = sns.FacetGrid(df, col="Country ID", hue="year", palette="tab20c",
                         col_wrap=4, height=3)

    # Draw a line plot to show the trajectory of each random walk
grid.map(plt.plot, "year", "Air emissions",  marker="o")

    # Adjust the arrangement of the plots
grid.fig.tight_layout(w_pad=1)

我该怎么做？循环播放？但这不会覆盖图表吗？

谢谢！

【问题讨论】：

我不确定你的温室气体数据在哪里。是'Other' 专栏吗？是的，抱歉，更正它！ 【参考方案1】：

您需要将 FacetGrid 行中所需的变量编码为一列，其中包含每个变量的值的单独列。可能不是最好的解释，但它看起来像这样：

    year  Country ID       variable  value
0      0           0  Air emissions      0
1      0           0            GHG      0
2      0           1  Air emissions      0
3      0           1            GHG     -3
4      0           2  Air emissions      0
5      0           2            GHG     -2
...

然后您可以将 FacetGrid 参数 row 设置为 'variable'（您还必须删除 col_wrap）：

grid = sns.FacetGrid(x, row='variable', col="Country ID", hue="year", palette="tab20c", height=3)
grid.map(plt.plot, "year", "value",  marker="o")

您可以使用pivot_table 重新格式化您的数据框：

df = df.pivot_table(index=['year', 'Country ID'], values=['Air emissions', 'GHG']).stack().reset_index()
df.columns = ['year', 'Country ID', 'variable', 'value']

【讨论】：

谢谢，您知道如何将违规名称放在每行的 y 轴上，而不是将其作为标题？违规名称和国家重叠，看不清楚.. 您可以使用grid.axes[i, j] 访问每个轴。有了这个，您可以使用通常的set_ylabel 和set_title 来更改这些值。您可能希望使用row_order 为您的 FacetGrid 显式设置行顺序，这样您就可以准确地知道每行所代表的变量。

以上是关于将 DataFrame 的列设置为 FacetGrid 图形的行的主要内容，如果未能解决你的问题，请参考以下文章

Scala - 如何将 Dataset[Row] 转换为可添加到 Dataframe 的列

如何将 Pandas DataFrame 的列和行子集转换为 numpy 数组？

如何将 Pandas 系列中的多个字典键转换为 DataFrame 中的列？

使用 Spark Dataframe scala 将多个不同的列转换为 Map 列

在读取/加载时将原始JSON保留为Spark DataFrame中的列？

如何使用 Java 将 unix 纪元的列转换为 Apache spark DataFrame 中的日期？