熊猫栏如何标记所需的值

Posted

技术标签:

【中文标题】熊猫栏如何标记所需的值【英文标题】:Pandas bar how to label desired values 【发布时间】:2022-01-11 04:53:15 【问题描述】:
d = 'X':[1,2,3,4],'A': [50,40,20,60], '% of Total in A':[29.4,23.5,11.8,35.3] , 'B': [25,10,5,15], '% in A' :[50,25,25,25]
df = pd.DataFrame(d)
ax = df.plot(x='X',y="A", kind="bar")
df.plot(x='X', y="B", kind="bar", ax=ax,color='C2')

   X   A  % of Total in A   B  % in A
0  1  50             29.4  25      50
1  2  40             23.5  10      25
2  3  20             11.8   5      25
3  4  60             35.3  15      25

我有上面的数据框,我知道如何根据两列 A 和 B 绘制堆积条形图。

如何在条形顶部添加值标签,例如 X=0,我想在蓝色条形上方标记 50(总数的 29.4%),在绿色条形上方标记 25(50% 组)在蓝色条内。

感谢任何帮助。

【问题讨论】:

【参考方案1】:

第一个柱存储在ax.containers[0],第二个存储在ax.containers[1]。您可以使用这些容器以及相应标签列表调用ax.bar_label(...)

顺便说一句,您在第二个条形图中缺少x=

from matplotlib import pyplot as plt
import pandas as pd

d = 'X': [1, 2, 3, 4], 'A': [50, 40, 20, 60], '% of Total in A': [29.4, 23.5, 11.8, 35.3], 'B': [25, 10, 5, 15], '% in A': [50, 25, 25, 25]
df = pd.DataFrame(d)
ax = df.plot(x='X', y="A", kind="bar")
df.plot(x='X', y="B", kind="bar", color='C2', ax=ax)

ax.bar_label(ax.containers[0], labels=df['% of Total in A'])
ax.bar_label(ax.containers[1], labels=df['% in A'], color='white')
plt.show()

为了进一步强调BA 的一部分,您可以为它们赋予相同的颜色,并为B 加上阴影线。例如:

ax = df.plot(x='X', y="A", kind="bar", color='dodgerblue')
df.plot(x='X', y="B", kind="bar", facecolor='dodgerblue', hatch='xx', rot=0, ax=ax)

ax.bar_label(ax.containers[0], labels=[f'p %' for p in df['% of Total in A']])
ax.bar_label(ax.containers[1], labels=[f'p %' for p in df['% in A']], color='white')
for spine in ['top', 'right']:
    ax.spines[spine].set_visible(False)

【讨论】:

【参考方案2】: 条形图未正确堆叠。补丁按 z 顺序堆叠,而不是垂直堆叠(y 顺序)。此外,x 轴不正确,因为第二个图中缺少 x='X'。 使用zip组合containerscols,然后将自定义labels传递给labels=参数。 另请参阅Stacked Bar Chart with Centered Labels 和Adding value labels on a matplotlib bar chart,了解有关.bar_label 的详细说明。
ax = df.plot(kind='bar', x='X', y=['A', 'B'], stacked=True, rot=0, color=['tab:blue', 'tab:green'])
ax.legend(bbox_to_anchor=(1, 1.02), loc='upper left')

# specify the columns to uses for alternate labels, in order based on the order of y=
cols = ['% of Total in A', '% in A']

for c, col in zip(ax.containers, cols):
    
    labels = df[col]

    # Use the alternate column for the labels instead of the bar height (or width of horizontal bars)
    labels = [f'v%' for v in labels]
    
    # remove the labels parameter if it's not needed for customized labels
    ax.bar_label(c, labels=labels, label_type='edge')

ax.margins(y=0.1)

【讨论】:

以上是关于熊猫栏如何标记所需的值的主要内容,如果未能解决你的问题,请参考以下文章

为 Facebook 和 LinkedIn 提供特定值所需的元标记?

从 web api 加载谷歌地图所需的标记,并在相机移动时动态加载其他标记

Antd,Form,无标签,但我想显示所需的红色标记

为啥浏览器可以推断出某些省略的 HTML 元素,但不能推断出形成有效标记所需的所有省略的元素?

XSD - 仅根据父标记创建所需的属性

您的 android 清单中所需的元数据标记不存在。 MobileAds.initialize() 处的应用程序崩溃;