带有整数 xaxis 的甘特图的 Plotly Express 时间线?

Posted

技术标签:

【中文标题】带有整数 xaxis 的甘特图的 Plotly Express 时间线?【英文标题】:Plotly Express timeline for Gantt Chart with integer xaxis? 【发布时间】:2021-05-10 17:12:42 【问题描述】:

我正在使用 plotly express 时间线来生成甘特图,如下所示:https://medium.com/dev-genius/gantt-charts-in-python-with-plotly-e7213f932f1e

它会自动将 x 轴设置为使用日期,但我实际上只想使用整数(即 Project Kick-Off +1、Project Kick-Off +6 等)。

有没有办法让时间线图不使用 xaxis 的日期?

如果我尝试使用整数,它会将它们视为毫秒。

【问题讨论】:

我的建议对你有什么效果? 不完全。我仍然需要深入研究它,但它已接近成为我需要的解决方案。谢谢! 您是否考虑将我的建议标记为已接受的答案? 【参考方案1】:

答案:

是的,这是可能的!只需将整数作为开始和结束“日期”,计算它们之间的差异 (delta),然后对您的 fig 进行这些更改:

fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()

情节

详情:

实际上有一种方法可以实现这一点,尽管docs 声明:

px.timeline 函数默认设置 X 轴为 type=date,因此可以像任何时间序列图一样进行配置。

因此px.timeline() 中的所有其他功能似乎都围绕着这一事实。但是,如果您忽略这一点并使用整数作为StartFinish 的值,那么您可以调整一些属性以获得您想要的。您只需要计算每个StartStop 之间的差异。比如这样:

df = pd.DataFrame([
    dict(Task="Job A", Start=1, Finish=4),
    dict(Task="Job B", Start=2, Finish=6),
    dict(Task="Job C", Start=3, Finish=10)
])
df['delta'] = df['Finish'] - df['Start']

然后再稍微调整一下:

fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()

完整代码:

import plotly.express as px
import pandas as pd

df = pd.DataFrame([
    dict(Task="Job A", Start=1, Finish=4),
    dict(Task="Job B", Start=2, Finish=6),
    dict(Task="Job C", Start=3, Finish=10)
])
df['delta'] = df['Finish'] - df['Start']

fig = px.timeline(df, x_start="Start", x_end="Finish", y="Task")
fig.update_yaxes(autorange="reversed") 

fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()
f = fig.full_figure_for_development(warn=False)
fig.show()

【讨论】:

【参考方案2】:

我尝试了此处列出的其他答案,但如果我指定 color,这将不起作用。如果我尝试,数据fig.data 有多个Bar 对象,我认为它不包含分配所有增量所需的数据。但是,我确实发现我可以通过猴子补丁 plotly code 不将其转换为时间对象,并且我得到了正确的结果:

import plotly.express as px
import pandas as pd

def my_process_dataframe_timeline(args):
    """
    Massage input for bar traces for px.timeline()
    """
    print("my method")
    args["is_timeline"] = True
    if args["x_start"] is None or args["x_end"] is None:
        raise ValueError("Both x_start and x_end are required")

    x_start = args["data_frame"][args["x_start"]]
    x_end = args["data_frame"][args["x_end"]]

    # note that we are not adding any columns to the data frame here, so no risk of overwrite
    args["data_frame"][args["x_end"]] = (x_end - x_start)
    args["x"] = args["x_end"]
    del args["x_end"]
    args["base"] = args["x_start"]
    del args["x_start"]
    return args
px._core.process_dataframe_timeline = my_process_dataframe_timeline

df = pd.DataFrame([
    dict(Task="Job A", Start=1, Finish=4, color="1"),
    dict(Task="Job B", Start=2, Finish=6, color="2"),
    dict(Task="Job C", Start=3, Finish=10, color="1")
])
df['delta'] = df['Finish'] - df['Start']

fig = px.timeline(df, x_start="Start", x_end="Finish", y="Task", color="color")
fig.update_yaxes(autorange="reversed") 

fig.layout.xaxis.type = 'linear'
fig.show()

显然不希望这样做...获得正式支持会很好。

【讨论】:

【参考方案3】:

当我们必须指定color时,我认为这比上面的解决方案要简单得多

for d in fig.data:
  filt = df['color'] == d.name
  d.x = df[filt]['Delta'].tolist()

【讨论】:

很抱歉,您没有回答问题 仅供参考,这是对 vestland 答案的附加评论,如果您自己尝试一下,您会发现它比像 amos 的答案那样覆盖 process_dataframe_timeline 函数要简单得多。 这确实是一个有用的评论,因为它大大简化了解决方案!初始解决方案中的问题在fig.data[0].x,因此这个 0 索引将仅修复第一系列柱,其余柱将不可见。这里提到的几行代码为我解决了这个问题,而无需修补情节代码。

以上是关于带有整数 xaxis 的甘特图的 Plotly Express 时间线?的主要内容,如果未能解决你的问题,请参考以下文章

Plotly:如何使用 plotly express 自定义 xaxis 刻度标签?

在 plotly 中使用数值来创建甘特图

Plotly:如何在甘特图上标记条形?

plotly 将我的 xaxis 标记为错误。如何解决这个问题?

甘特图上的显示问题(Jupyter、Plotly、Python)

可视化神器Plotly玩转甘特图