ipython plotly:无法将x轴绘制为日期时间

Posted

技术标签:

【中文标题】ipython plotly:无法将x轴绘制为日期时间【英文标题】:ipython plotly: cannot plot x-axis as datetime 【发布时间】:2015-01-19 03:33:46 【问题描述】:

所以,我在 pandas 数据框中有数据,其中行名在 datetime pandas.tseries 中给出。我可以在 matplotlib 中绘制数据,我得到这个数字:

但是,我想使用 plotly 以 intarctive 模式绘制相同的图形。它的工作原理如下,但它不显示日期时间,而是用整数索引替换 x 轴!

https://plot.ly/~vmirjalily/5/

上面网址中的图是用这段代码绘制的:

dfmean = df.mean(axis=1)
dfmean_mavg = pd.rolling_mean(dfmean, 50)

dfmean.plot(linewidth=1.5, label='Mean of 20')
dfmean_mavg.plot(linewidth=3, label='Moving Avg.')
#plt.legend(loc=2)

l1 = plt.plot(dfmean, 'b-', linewidth=3)
l2 = plt.plot(dfmean_mavg, 'g-', linewidth=4)

mpl_fig1 = plt.gcf()

py.iplot_mpl(mpl_fig1, filename='avg-price.20stocks')

但此代码未在 x 轴上显示日期时间索引。我试图强制日期时间索引如下:

l1 = plt.plot(np.array(dfmean.index), dfmean, 'b-', linewidth=3)
l2 = plt.plot(np.array(dfmean_mavg.index), dfmean_mavg, 'g-', linewidth=4)

mpl_fig1 = plt.gcf()

py.iplot_mpl(mpl_fig1, filename='avg-price.20stocks')

但它给出了一长串错误,如下所示

:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-35-4a3ca217202d> in <module>()
     14 mpl_fig1 = plt.gcf()
     15 
---> 16 py.iplot_mpl(mpl_fig1, filename='avg-price.20stocks')

/usr/local/lib/python2.7/dist-packages/plotly/plotly/plotly.pyc in iplot_mpl(fig, resize, strip_style, update, **plot_options)
    257             "object. Run 'help(plotly.graph_objs.Figure)' for more info."
    258         )
--> 259     return iplot(fig, **plot_options)
    260 
    261 

/usr/local/lib/python2.7/dist-packages/plotly/plotly/plotly.pyc in iplot(figure_or_data, **plot_options)
    113     if 'auto_open' not in plot_options:
    114         plot_options['auto_open'] = False
--> 115     res = plot(figure_or_data, **plot_options)
    116     urlsplit = res.split('/')
    117     username, plot_id = urlsplit[-2][1:], urlsplit[-1]  # TODO: HACKY!

/usr/local/lib/python2.7/dist-packages/plotly/plotly/plotly.pyc in plot(figure_or_data, validate, **plot_options)
    212                 pass
    213     plot_options = _plot_option_logic(plot_options)
--> 214     res = _send_to_plotly(figure, **plot_options)
    215     if res['error'] == '':
    216         if plot_options['auto_open']:

/usr/local/lib/python2.7/dist-packages/plotly/plotly/plotly.pyc in _send_to_plotly(figure, **plot_options)
    971     fig = tools._replace_newline(figure)  # does not mutate figure
    972     data = json.dumps(fig['data'] if 'data' in fig else [],
--> 973                       cls=utils._plotlyJSONEncoder)
    974     username, api_key = _get_session_username_and_key()
    975     kwargs = json.dumps(dict(filename=plot_options['filename'],

/usr/lib/python2.7/json/__init__.pyc in dumps(obj, skipkeys, ensure_ascii, check_circular, allow_nan, cls, indent, separators, encoding, default, **kw)
    236         check_circular=check_circular, allow_nan=allow_nan, indent=indent,
    237         separators=separators, encoding=encoding, default=default,
--> 238         **kw).encode(obj)
    239 
    240 

/usr/lib/python2.7/json/encoder.pyc in encode(self, o)
    199         # exceptions aren't as detailed.  The list call should be roughly
    200         # equivalent to the PySequence_Fast that ''.join() would do.
--> 201         chunks = self.iterencode(o, _one_shot=True)
    202         if not isinstance(chunks, (list, tuple)):
    203             chunks = list(chunks)

/usr/lib/python2.7/json/encoder.pyc in iterencode(self, o, _one_shot)
    262                 self.key_separator, self.item_separator, self.sort_keys,
    263                 self.skipkeys, _one_shot)
--> 264         return _iterencode(o, 0)
    265 
    266 def _make_iterencode(markers, _default, _encoder, _indent, _floatstr,

/usr/local/lib/python2.7/dist-packages/plotly/utils.pyc in default(self, obj)
    144                 if s is not None:
    145                     return s
--> 146             raise e
    147         return json.JSONEncoder.default(self, obj)
    148 

TypeError: masked is not JSON serializable

这是我的软件包版本:

IPython 2.0.0
numpy 1.9.0
numexpr 2.2.2
pandas 0.15.0
matplotlib 1.4.0
plotly 1.4.7

我的数据框的前 10 行:

Date
2011-01-04    54.2430
2011-01-05    54.3935
2011-01-06    54.4665
2011-01-07    54.5920
2011-01-10    54.9435
2011-01-11    54.9340
2011-01-12    55.4755
2011-01-13    55.5495
2011-01-14    56.0230
dtype: float64

【问题讨论】:

【参考方案1】:

这里发生了一些事情。

回溯:

此回溯告诉您无法序列化屏蔽数字。掩码数字与 NaN 略有不同。如果你好奇,这里有一些信息:http://pandas.pydata.org/pandas-docs/dev/gotchas.html#nan-integer-na-values-and-na-type-promotions

拥有屏蔽数字的原因是您所做的移动平均计算。它生成第一个 N 值,其中 N 是您平均的点数,被屏蔽。

因此,如果您通过操作数据框来消除屏蔽值,您将不会再看到 问题。

DataFrame.to_json() 对掩码值的处理(将它们转换为null)中排队,如果您尝试走这条路,那么在您的列表中替换为最合适的值将是NoneNone 最好转换为 null

x 轴上的整数

一点背景。当日期在 matplotlib 中时,它们是表示自 0001-01-01 + 1 以来的天数的浮点值(有关更多信息,请参阅 matplotlib 日期)。但是,导入pandas 会改变它以使用不同的日期表示,即自 unix 纪元以来的天数,另一个浮点数。 plotly 中的 1.4.7 版本旨在通过转换回 ISO 字符串来处理这两种差异,但也许您找到了另一种途径。不过,我似乎无法重新创建此错误。这是我尝试过的代码:

import random
import pandas as pd
import matplotlib.pyplot as plt
import plotly.plotly as py
import plotly.tools as tls
num_pts = 1000
data = [random.random() for i in range(num_pts)]
index = pd.date_range('2011-01-04', periods=num_pts)
df = pd.DataFrame(data=data, index=index)
dfmean = df.mean(axis=1)
dfmean_mavg = pd.rolling_mean(dfmean, 50)
dfmean.plot(linewidth=1.5, label='Mean of 20')
# dfmean_mavg.plot(linewidth=3, label='Moving Avg.')

mpl_fig1 = plt.gcf()
py.plot_mpl(mpl_fig1, filename='avg-price.20stocks')

在系列中致电plt.plot

您似乎尝试将数据部分绘制两次?我比较熟悉直接在数据框上调用plot方法,这就是为什么我选择在上面的代码sn-p中只包含这个版本。

TL;DR,请修复它。

Plotly 的 python api GH repo 上有一个公开的 PR 来处理这个问题:https://github.com/plotly/python-api/pull/159。明天应该会在 PyPi 上运行。

【讨论】:

谢谢!是的,这就是问题所在!当我删除移动平均图时,x 轴会正确显示日期

以上是关于ipython plotly:无法将x轴绘制为日期时间的主要内容,如果未能解决你的问题,请参考以下文章

在 matplotlib 中更改日期时间轴的格式

在 Plotly 图中重新排序轴

R语言ggplot2可视化:可视化所有日期不同时段任务的持续时间将持续时间绘制成一条线(起始时间到结束时间),y轴表示活动发生的日期,x轴表示以小时为单位的时间

Matplotlib:每个时间序列子图绘制多条线

Plotly:如何从 x 轴删除空日期?

R为线图指定x轴刻度