带有整数 xaxis 的甘特图的 Plotly Express 时间线?
Posted
技术标签:
【中文标题】带有整数 xaxis 的甘特图的 Plotly Express 时间线?【英文标题】:Plotly Express timeline for Gantt Chart with integer xaxis? 【发布时间】:2021-05-10 17:12:42 【问题描述】:我正在使用 plotly express 时间线来生成甘特图,如下所示:https://medium.com/dev-genius/gantt-charts-in-python-with-plotly-e7213f932f1e
它会自动将 x 轴设置为使用日期,但我实际上只想使用整数(即 Project Kick-Off +1、Project Kick-Off +6 等)。
有没有办法让时间线图不使用 xaxis 的日期?
如果我尝试使用整数,它会将它们视为毫秒。
【问题讨论】:
我的建议对你有什么效果? 不完全。我仍然需要深入研究它,但它已接近成为我需要的解决方案。谢谢! 您是否考虑将我的建议标记为已接受的答案? 【参考方案1】:答案:
是的,这是可能的!只需将整数作为开始和结束“日期”,计算它们之间的差异 (delta
),然后对您的 fig
进行这些更改:
fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()
情节
详情:
实际上有一种方法可以实现这一点,尽管docs 声明:
px.timeline 函数默认设置 X 轴为 type=date,因此可以像任何时间序列图一样进行配置。
因此px.timeline()
中的所有其他功能似乎都围绕着这一事实。但是,如果您忽略这一点并使用整数作为Start
和Finish
的值,那么您可以调整一些属性以获得您想要的。您只需要计算每个Start
和Stop
之间的差异。比如这样:
df = pd.DataFrame([
dict(Task="Job A", Start=1, Finish=4),
dict(Task="Job B", Start=2, Finish=6),
dict(Task="Job C", Start=3, Finish=10)
])
df['delta'] = df['Finish'] - df['Start']
然后再稍微调整一下:
fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()
完整代码:
import plotly.express as px
import pandas as pd
df = pd.DataFrame([
dict(Task="Job A", Start=1, Finish=4),
dict(Task="Job B", Start=2, Finish=6),
dict(Task="Job C", Start=3, Finish=10)
])
df['delta'] = df['Finish'] - df['Start']
fig = px.timeline(df, x_start="Start", x_end="Finish", y="Task")
fig.update_yaxes(autorange="reversed")
fig.layout.xaxis.type = 'linear'
fig.data[0].x = df.delta.tolist()
f = fig.full_figure_for_development(warn=False)
fig.show()
【讨论】:
【参考方案2】:我尝试了此处列出的其他答案,但如果我指定 color
,这将不起作用。如果我尝试,数据fig.data
有多个Bar
对象,我认为它不包含分配所有增量所需的数据。但是,我确实发现我可以通过猴子补丁 plotly code 不将其转换为时间对象,并且我得到了正确的结果:
import plotly.express as px
import pandas as pd
def my_process_dataframe_timeline(args):
"""
Massage input for bar traces for px.timeline()
"""
print("my method")
args["is_timeline"] = True
if args["x_start"] is None or args["x_end"] is None:
raise ValueError("Both x_start and x_end are required")
x_start = args["data_frame"][args["x_start"]]
x_end = args["data_frame"][args["x_end"]]
# note that we are not adding any columns to the data frame here, so no risk of overwrite
args["data_frame"][args["x_end"]] = (x_end - x_start)
args["x"] = args["x_end"]
del args["x_end"]
args["base"] = args["x_start"]
del args["x_start"]
return args
px._core.process_dataframe_timeline = my_process_dataframe_timeline
df = pd.DataFrame([
dict(Task="Job A", Start=1, Finish=4, color="1"),
dict(Task="Job B", Start=2, Finish=6, color="2"),
dict(Task="Job C", Start=3, Finish=10, color="1")
])
df['delta'] = df['Finish'] - df['Start']
fig = px.timeline(df, x_start="Start", x_end="Finish", y="Task", color="color")
fig.update_yaxes(autorange="reversed")
fig.layout.xaxis.type = 'linear'
fig.show()
显然不希望这样做...获得正式支持会很好。
【讨论】:
【参考方案3】:当我们必须指定color
时,我认为这比上面的解决方案要简单得多
for d in fig.data:
filt = df['color'] == d.name
d.x = df[filt]['Delta'].tolist()
【讨论】:
很抱歉,您没有回答问题 仅供参考,这是对 vestland 答案的附加评论,如果您自己尝试一下,您会发现它比像 amos 的答案那样覆盖 process_dataframe_timeline 函数要简单得多。 这确实是一个有用的评论,因为它大大简化了解决方案!初始解决方案中的问题在fig.data[0].x
,因此这个 0 索引将仅修复第一系列柱,其余柱将不可见。这里提到的几行代码为我解决了这个问题,而无需修补情节代码。以上是关于带有整数 xaxis 的甘特图的 Plotly Express 时间线?的主要内容,如果未能解决你的问题,请参考以下文章
Plotly:如何使用 plotly express 自定义 xaxis 刻度标签?
plotly 将我的 xaxis 标记为错误。如何解决这个问题?