Plotly：如何使用长格式或宽格式的 pandas 数据框制作线图？

Posted 2023-02-18

技术标签:

【中文标题】Plotly：如何使用长格式或宽格式的 pandas 数据框制作线图？【英文标题】：Plotly: How to make a line plot from a pandas dataframe with a long or wide format? 【发布时间】：2020-09-12 16:03:17 【问题描述】：

（这是一篇自我回答的帖子，通过不必解释 plotly 如何最好地处理长格式和宽格式数据来帮助其他人缩短他们对 plotly 问题的答案）

我想在尽可能少的行中基于 pandas 数据框构建一个绘图图。我知道你可以使用 plotly.express 来做到这一点，但这对于我称之为标准 pandas 数据框的方法来说是失败的；描述行顺序的索引，以及描述数据框中值名称的列名：

示例数据框：

    a           b           c
0   100.000000  100.000000  100.000000
1   98.493705   99.421400   101.651437
2   96.067026   98.992487   102.917373
3   95.200286   98.313601   102.822664
4   96.691675   97.674699   102.378682

尝试：

fig=px.line(x=df.index, y = df.columns)

这会引发错误：

ValueError：所有参数的长度应该相同。参数y的长度是3，而前面的参数['x']的长度是100`

【问题讨论】：

很好的问答对。我想知道 df.T 是否有用？ @anon01 谢谢！ df.T非常有用。但是你有什么特别的想法？ 【参考方案1】：

在这里，您尝试使用宽格式的 pandas 数据框作为 px.line 的源。 plotly.express 旨在与 long format 的数据帧一起使用，通常称为 tidy data（请看看。没有人能比 Wickham 更好地解释它）。许多人，尤其是那些因多年与 Excel 斗争而受伤的人，经常发现以宽格式组织数据更容易。那么有什么区别呢？

宽幅：

数据在单独的列中与每个不同的数据变量一起显示每一列只有一种数据类型缺失值通常由np.nan 表示最适合plotly.graphobjects (go) 线条通常使用fid.add_traces()添加到图形中颜色通常分配给每个轨迹

示例：

            a          b           c
0   -1.085631    0.997345   0.282978
1   -2.591925    0.418745   1.934415
2   -5.018605   -0.010167   3.200351
3   -5.885345   -0.689054   3.105642
4   -4.393955   -1.327956   2.661660
5   -4.828307    0.877975   4.848446
6   -3.824253    1.264161   5.585815
7   -2.333521    0.328327   6.761644
8   -3.587401   -0.309424   7.668749
9   -5.016082   -0.449493   6.806994

长格式：

数据显示为一列包含所有值，另一列列出值的上下文缺失值根本不包含在数据集中。最适合plotly.express (px) 颜色由默认颜色循环设置并分配给每个唯一变量

示例：

    id  variable    value
0   0   a        -1.085631
1   1   a        -2.591925
2   2   a        -5.018605
3   3   a        -5.885345
4   4   a        -4.393955
... ... ... ...
295 95  c        -4.259035
296 96  c        -5.333802
297 97  c        -6.211415
298 98  c        -4.335615
299 99  c        -3.515854

from wide to long怎么走？

df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])

下面的两个 sn-ps 将产生完全相同的图：

如何使用px绘制长数据？

fig = px.line(df, x='id', y='value', color='variable')

如何使用 go 绘制宽数据？

colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()

从表面上看，go 更复杂，或许更灵活？嗯，是。和不。您可以使用px 轻松构建图形并添加您想要的任何go 对象！

完成 go sn-p:

import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)  
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index

# plotly.graph_objects
colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()

完成 px sn-p：

import numpy as np
import pandas as pd
import plotly.express as px
from plotly.offline import iplot

# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)  
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index

# dataframe of a long format
df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])

# plotly express
fig = px.line(df, x='id', y='value', color='variable')
fig.show()

【讨论】：

感谢您对 Wickham 文章的参考！由于写了这个答案，plotly express now does accept wide form data 在某些情况下。 @mcat 不客气！ Wickhams 对 R 的贡献是我对使用 R 最怀念的地方。关于这个问答，这是我很长一段时间以来一直在考虑的事情。当我最终发布它时，新的 px 功能就在第二天发布了...... 我认为这是一个错字“如何从长到宽？”，melt 应该是“从宽到长” @miaoz2001 你是对的！感谢您指出这一点！【参考方案2】：

我将把它添加为答案，以便有据可查。首先感谢@vestland。这是一个反复出现的问题，因此很高兴能够解决这个问题，并且可以更轻松地标记重复的问题。

Plotly Express 现在接受宽格式和混合格式数据 你可以查看post。

【讨论】：

哈！我想这对我来说是回学校了……这篇文章的日期是 5 月 26 日。今天真的发布了吗？（现在没时间看书。我在船上……） Plotly 4.8 刚刚发布。我在我的推特上找到了 TL【参考方案3】：

您可以将 pandas 绘图后端更改为使用 plotly：

import pandas as pd
pd.options.plotting.backend = "plotly"

那么，要得到一个无花果，你只需要写：

fig = df.plot()

fig.show() 显示上图。

【讨论】：

以上是关于Plotly：如何使用长格式或宽格式的 pandas 数据框制作线图？的主要内容，如果未能解决你的问题，请参考以下文章