Matplotlib:如何在使用日期时间轴绘图时跳过一系列小时?

Posted

技术标签:

【中文标题】Matplotlib:如何在使用日期时间轴绘图时跳过一系列小时?【英文标题】:Matplotlib: How to skip a range of hours when plotting with a datetime axis? 【发布时间】:2018-06-23 07:41:23 【问题描述】:

我有一种金融工具的逐笔报价数据,我正在尝试使用matplotlib 绘制这些数据。我正在使用pandas,并且数据使用DatetimeIndex 进行索引。

问题是,当我尝试绘制多个交易日时,我不能跳过收市时间和第二天开市之间的时间范围(见示例),这当然是我不感兴趣的。

有没有办法让 matplotlib 忽略这一点,而只是将结束报价与第二天的开场“粘在一起”?我试图通过一个自定义的时间范围:

plt.xticks(time_range)

但结果是一样的。任何想法如何做到这一点?

# Example data
instrument = pd.DataFrame(data=
    'Datetime': [
        dt.datetime.strptime('2018-01-11 11:00:11', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-11 13:02:17', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-11 16:59:14', '%Y-%m-%d %H:%M:%S'),

        dt.datetime.strptime('2018-01-12 11:00:11', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-12 13:15:24', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-12 16:58:43', '%Y-%m-%d %H:%M:%S')
    ],
    'Price': [127.6, 128.1, 127.95, 129.85, 129.7, 131.2],
    'Volume': [725, 146, 48, 650, 75, 160]
).set_index('Datetime')

plt.figure(figsize=(10,5))
top = plt.subplot2grid((4,4), (0, 0), rowspan=3, colspan=4)
bottom = plt.subplot2grid((4,4), (3,0), rowspan=1, colspan=4)
top.plot(instrument.index, instrument['Price'])
bottom.bar(instrument.index, instrument['Volume'], 0.005) 

top.xaxis.get_major_ticks()
top.axes.get_xaxis().set_visible(False)
top.set_title('Example')
top.set_ylabel('Price')
bottom.set_ylabel('Volume')

【问题讨论】:

当询问一些不受欢迎的行为时,您需要提供问题的minimal reproducible example。 我添加了一些代码。我认为这种行为并不是不受欢迎的,因为它是默认行为;是我试图产生不同的结果。 好吧,不清楚。我猜你有两个选择:绘制两个或多个子图(请参阅broken axis example)或使用新的连续索引来绘制;后者将要求您手动将刻度标签设置为原始日期索引的子集。 【参考方案1】:

TL;DR

替换 matplotlib 绘图函数:

top.plot(instrument.index, instrument['Price'])
bottom.bar(instrument.index, instrument['Volume'], 0.005)

有了这些:

top.plot(range(instrument.index.size), instrument['Price'])
bottom.bar(range(instrument.index.size), instrument['Volume'], width=1)

或者使用这些 pandas 绘图功能(只有 x 轴限制看起来不同):

instrument['Price'].plot(use_index=False, ax=top)
instrument['Volume'].plot.bar(width=1, ax=bottom)

通过与sharex=True 共享 x 轴来对齐两个图,并使用数据框索引根据需要设置刻度,如下面的示例所示。


让我首先创建一个示例数据集,并展示如果我使用 matplotlib 绘图函数绘制它的样子,就像在您的示例中使用 DatetimeIndex 作为 x 变量一样。

创建示例数据集

样本数据是使用pandas_market_calendars 包创建的,以创建一个真实的DatetimeIndex,其频率跨越几个工作日和一个周末。

import numpy as np                        # v 1.19.2
import pandas as pd                       # v 1.1.3
import matplotlib.pyplot as plt           # v 3.3.2
import matplotlib.ticker as ticker
import pandas_market_calendars as mcal    # v 1.6.1

# Create datetime index with a 'minute start' frequency based on the New
# York Stock Exchange trading hours (end date is inclusive)
nyse = mcal.get_calendar('NYSE')
nyse_schedule = nyse.schedule(start_date='2021-01-07', end_date='2021-01-11')
nyse_dti = mcal.date_range(nyse_schedule, frequency='1min', closed='left')\
               .tz_convert(nyse.tz.zone)
# Remove timestamps of closing times to create a 'period start' datetime index
nyse_dti = nyse_dti.delete(nyse_dti.indexer_at_time('16:00'))

# Create sample of random data consisting of opening price and
# volume of financial instrument traded for each period
rng = np.random.default_rng(seed=1234)  # random number generator
price_change = rng.normal(scale=0.1, size=nyse_dti.size)
price_open = 127.5 + np.cumsum(price_change)
volume = rng.integers(100, 10000, size=nyse_dti.size)
df = pd.DataFrame(data=dict(Price=price_open, Volume=volume), index=nyse_dti)
df.head()

#                             Price       Volume
#  2021-01-07 09:30:00-05:00  127.339616  7476
#  2021-01-07 09:31:00-05:00  127.346026  3633
#  2021-01-07 09:32:00-05:00  127.420115  1339
#  2021-01-07 09:33:00-05:00  127.435377  3750
#  2021-01-07 09:34:00-05:00  127.521752  7354

使用 matplotlib 使用 DatetimeIndex 绘制数据

现在可以使用 matplotlib 绘图函数绘制此示例数据,如您的示例中一样,但请注意,子图是通过使用 plt.subplotssharex=True 参数创建的。这将线与条正确对齐,并可以将 matplotlib 的交互式界面与两个子图一起使用。

# Create figure and plots using matplotlib functions
fig, (top, bot) = plt.subplots(2, 1, sharex=True, figsize=(10,5),
                               gridspec_kw=dict(height_ratios=[0.75,0.25]))
top.plot(df.index, df['Price'])
bot.bar(df.index, df['Volume'], 0.0008)

# Set title and labels
top.set_title('Matplotlib plots with unwanted gaps', pad=20, size=14, weight='semibold')
top.set_ylabel('Price', labelpad=10)
bot.set_ylabel('Volume', labelpad=10);

使用 matplotlib 绘制数据,使用整数范围无任何间隙

可以通过简单地忽略DatetimeIndex 并改用整数范围来解决这些差距的问题。然后大部分工作在于创建适当的刻度标签。这是一个例子:

# Create figure and matplotlib plots with some additional formatting
fig, (top, bot) = plt.subplots(2, 1, sharex=True, figsize=(10,5),
                               gridspec_kw=dict(height_ratios=[0.75,0.25]))
top.plot(range(df.index.size), df['Price'])
top.set_title('Matplotlib plots without any gaps', pad=20, size=14, weight='semibold')
top.set_ylabel('Price', labelpad=10)
top.grid(axis='x', alpha=0.3)
bot.bar(range(df.index.size), df['Volume'], width=1)
bot.set_ylabel('Volume', labelpad=10)

# Set fixed major and minor tick locations
ticks_date = df.index.indexer_at_time('09:30')
ticks_time = np.arange(df.index.size)[df.index.minute == 0][::2] # step in hours
bot.set_xticks(ticks_date)
bot.set_xticks(ticks_time, minor=True)

# Format major and minor tick labels
labels_date = [maj_tick.strftime('\n%d-%b').replace('\n0', '\n')
               for maj_tick in df.index[ticks_date]]
labels_time = [min_tick.strftime('%I %p').lstrip('0').lower()
               for min_tick in df.index[ticks_time]]
bot.set_xticklabels(labels_date)
bot.set_xticklabels(labels_time, minor=True)
bot.figure.autofmt_xdate(rotation=0, ha='center', which='both')

为交互式绘图创建动态刻度

如果您喜欢使用 matplotlib 的交互界面(带有平移/缩放),您将需要使用来自 matplotlib ticker 模块的定位器和格式化程序。这是一个如何设置刻度的示例,其中主要刻度是固定的并像上面一样格式化,但在您放大/缩小绘图时会自动生成次要刻度:

# Set fixed major tick locations and automatic minor tick locations
ticks_date = df.index.indexer_at_time('09:30')
bot.set_xticks(ticks_date)
bot.xaxis.set_minor_locator(ticker.AutoLocator())

# Format major tick labels
labels_date = [maj_tick.strftime('\n%d-%b').replace('\n0', '\n')
               for maj_tick in df.index[ticks_date]]
bot.set_xticklabels(labels_date)

# Format minor tick labels
def min_label(x, pos):
    if 0 <= x < df.index.size:
        return df.index[int(x)].strftime('%H:%M')
min_fmtr = ticker.FuncFormatter(min_label)
bot.xaxis.set_minor_formatter(min_fmtr)

bot.figure.autofmt_xdate(rotation=0, ha='center', which='both')

文档:example of an alternative solution; datetime string format codes

【讨论】:

【参考方案2】:

也许使用https://pypi.org/project/mplfinance/ 允许模仿您在大多数服务中看到的常见财务图。

当您调用 mplfinance mpf.plot() 函数时,有一个 kwarg show_nontrading,默认设置为 False,以便自动绘制这些不需要的间隙。 (要绘制它们,请设置show_nontrading=True)。

【讨论】:

仅链接的答案不合适。你可以给出一个使用这个库的代码示例来回答这个问题。

以上是关于Matplotlib:如何在使用日期时间轴绘图时跳过一系列小时?的主要内容,如果未能解决你的问题,请参考以下文章

使用 matplotlib 绘图没有给出所需的日期时间格式

是否可以使用 matplotlib 将 x 轴设置为仅显示开始日期和结束日期?

如何使用 matplotlib 在日期时间轴上绘制一个矩形?

如何使用 Python matplotlib 绘制具有 4 个象限的图形或绘图?

如何使用 Matplotlib 调整图形的 x 轴“日期”标签?

如何更改 matplotlib 中绘图的轴、刻度和标签的颜色