如何根据不同的dataFrame部分绘制(plotly.express)多条线

Posted

技术标签:

【中文标题】如何根据不同的dataFrame部分绘制(plotly.express)多条线【英文标题】:how to plot (plotly.express) multiple lines based on different dataFrame parts 【发布时间】:2021-05-18 06:48:56 【问题描述】:

我有一个数据框,例如:

In [1]: import pandas as pd

In [2]: df = pd.DataFrame(data = ['key': '1', 'value': '1', 'metadata': '3', 'key': '2', 'value': '2', 'metadata': '3', 'key': '1', 'value': '3', 'metadata': '3', 'key': '2', 'value': '4', 'metadata':
   ...: '3'])

In [3]: df
Out[3]: 
  key value metadata
0   1     1        3
1   2     2        3
2   1     3        3
3   2     4        3

我想用“键”分割df,即

In [4]: df_list = [d for _, d in df.groupby(['key'])]

In [5]: df_list
Out[5]: 
[  key value metadata
 0   1     1        3
 2   1     3        3,
   key value metadata
 1   2     2        3
 3   2     4        3]

现在我有基于唯一键数量的 N (2) dataFrames 列表。如何使用plotly 绘制此图?

我可以

In [6]: import plotly.express as px

In [7]: fig = px.line(df_list[0])

但是如何添加其他行? plotly.express.Figure 没有 add_line 方法...

【问题讨论】:

【参考方案1】:

运行 plotly.express 将返回一个 plotly.graph_objs._figure.Figure 对象。 plotly.graph_objectsgo.Figure() 也是如此。因此,在使用 plotly express 构建图形后,您可以使用以下方法添加线条或轨迹:

fig.add_trace(go.Scatter)

或者:

fig.add_scatter()

其他选项有:

fig.add_area()
fig.add_bar()

构建fig 后,您可以运行dir(fig) 以了解更多信息。

所以在这样的数据框中:

   2021  2022  2023
0     0     0     0
1     0    -1    -2
2    -1    -1    -3
3    -1    -2    -2
4    -1    -1    -3

您可以使用以下方法将线条/轨迹添加到现有图形:

fig.add_trace(go.Scatter(x = df.index, y = df['2023']))

如果您希望通过字典控制数据子集,添加多个跟踪的一种方法是:

extra = '2024': df['2024'],
         '2025': df['2025']

for k, v in extra.items():
    fig.add_scatter(x=v.index, y = v, name = k + ' from dict' )

完整代码:

import pandas as pd
import numpy as np
import plotly
import plotly.express as px
import plotly.graph_objects as go

# data
np.random.seed(1)
start = 2021
ncols = 6
nrows = 1000
cols = [str(i) for i in np.arange(start, start+ncols)]
df = pd.DataFrame(np.random.randint(-1,2, (nrows,ncols)), columns = cols).cumsum()
df.iloc[0] = 0

# figure
fig = px.line(df, x=df.index, y=cols[:-4])
fig.update_layout(template = 'plotly_dark')

# fig.add_trace(go.Scatter(x = df.index, y = df['2023'], name = '2023 = added trace'))

fig.add_scatter(x = df.index, y = df['2023'], name = '2023 from add_trace')


extra = '2024': df['2024'],
         '2025': df['2025']

for k, v in extra.items():
    fig.add_scatter(x=v.index, y = v, name = k + ' from dict' )

fig.show()

【讨论】:

你的回答似乎真的很棒,但我想我问错了问题......这是我的 csv:设备,名称,稳定温度(C),元数据 01:00.0,a,40, foo 03:00.0,a,42,foo 01:00.0,b,38,foo 03:00.0,b,44,foo 01:00.0,c,41,foo 03:00.0,c,42,foo 01:00.0, d,20,foo 03:00.0,d,28,foo 我想绘制它以便变量 = 设备、x = 名称、y = 温度,并且元数据是悬停的 - 我不能让你的答案坚持下去这种情况 @CIsForCookies 包含here 所述的数据样本,我相信我们可以坚持下去。 '设备': 0: '01:00.0', 1: '03:00.0', 2: '01:00.0', 3: '03:00.0', 4: '01 :00.0', 5: '03:00.0', 6: '01:00.0', 7: '03:00.0', '名称': 0: 'a', 1: 'a', 2: 'b ', 3: 'b', 4: 'c', 5: 'c', 6: 'd', 7: 'd', '稳定温度 (C)': 0: 40, 1: 42, 2: 38, 3: 44, 4: 41, 5: 42, 6: 20, 7: 28, '元数据': 0: 'foo', 1: 'foo', 2: 'foo', 3: 'foo', 4: 'foo', 5: 'foo', 6: 'foo', 7: 'foo' 顺便说一句,我正在研究pd.melt - 因为我认为它会给出一个简洁的解决方案。还没有成功..

以上是关于如何根据不同的dataFrame部分绘制(plotly.express)多条线的主要内容,如果未能解决你的问题,请参考以下文章

Plotly:将多个图形绘制为子图

plotly基于dataframe数据绘制线形图(line plot)

plotly基于dataframe数据绘制柱状图(bar plot)

plotly基于dataframe数据绘制散点图(scatter plot)

plotly基于dataframe数据绘制股票OHLC图

cufflinks基于dataframe数据绘制线图(line plot)散点图(scatter plot)