Matplotlib 中的内联标签
Posted
技术标签:
【中文标题】Matplotlib 中的内联标签【英文标题】:Inline labels in Matplotlib 【发布时间】:2013-06-04 05:30:02 【问题描述】:在 Matplotlib 中,制作图例并不难(example_legend()
,下图),但我认为将标签直接放在正在绘制的曲线上会更好(如下图 example_inline()
)。这可能非常繁琐,因为我必须手动指定坐标,而且,如果我重新格式化绘图,我可能必须重新定位标签。有没有办法在 Matplotlib 中自动生成曲线上的标签?能够以与曲线角度对应的角度定位文本的奖励积分。
import numpy as np
import matplotlib.pyplot as plt
def example_legend():
plt.clf()
x = np.linspace(0, 1, 101)
y1 = np.sin(x * np.pi / 2)
y2 = np.cos(x * np.pi / 2)
plt.plot(x, y1, label='sin')
plt.plot(x, y2, label='cos')
plt.legend()
def example_inline():
plt.clf()
x = np.linspace(0, 1, 101)
y1 = np.sin(x * np.pi / 2)
y2 = np.cos(x * np.pi / 2)
plt.plot(x, y1, label='sin')
plt.plot(x, y2, label='cos')
plt.text(0.08, 0.2, 'sin')
plt.text(0.9, 0.2, 'cos')
【问题讨论】:
【参考方案1】:很好的问题,前段时间我对此进行了一些实验,但没有大量使用它,因为它仍然不是防弹的。我将绘图区域划分为一个 32x32 的网格,并根据以下规则为每条线的标签的最佳位置计算了一个“势场”:
空白是放置标签的好地方 标签应靠近相应行 标签应远离其他行代码是这样的:
import matplotlib.pyplot as plt
import numpy as np
from scipy import ndimage
def my_legend(axis = None):
if axis == None:
axis = plt.gca()
N = 32
Nlines = len(axis.lines)
print Nlines
xmin, xmax = axis.get_xlim()
ymin, ymax = axis.get_ylim()
# the 'point of presence' matrix
pop = np.zeros((Nlines, N, N), dtype=np.float)
for l in range(Nlines):
# get xy data and scale it to the NxN squares
xy = axis.lines[l].get_xydata()
xy = (xy - [xmin,ymin]) / ([xmax-xmin, ymax-ymin]) * N
xy = xy.astype(np.int32)
# mask stuff outside plot
mask = (xy[:,0] >= 0) & (xy[:,0] < N) & (xy[:,1] >= 0) & (xy[:,1] < N)
xy = xy[mask]
# add to pop
for p in xy:
pop[l][tuple(p)] = 1.0
# find whitespace, nice place for labels
ws = 1.0 - (np.sum(pop, axis=0) > 0) * 1.0
# don't use the borders
ws[:,0] = 0
ws[:,N-1] = 0
ws[0,:] = 0
ws[N-1,:] = 0
# blur the pop's
for l in range(Nlines):
pop[l] = ndimage.gaussian_filter(pop[l], sigma=N/5)
for l in range(Nlines):
# positive weights for current line, negative weight for others....
w = -0.3 * np.ones(Nlines, dtype=np.float)
w[l] = 0.5
# calculate a field
p = ws + np.sum(w[:, np.newaxis, np.newaxis] * pop, axis=0)
plt.figure()
plt.imshow(p, interpolation='nearest')
plt.title(axis.lines[l].get_label())
pos = np.argmax(p) # note, argmax flattens the array first
best_x, best_y = (pos / N, pos % N)
x = xmin + (xmax-xmin) * best_x / N
y = ymin + (ymax-ymin) * best_y / N
axis.text(x, y, axis.lines[l].get_label(),
horizontalalignment='center',
verticalalignment='center')
plt.close('all')
x = np.linspace(0, 1, 101)
y1 = np.sin(x * np.pi / 2)
y2 = np.cos(x * np.pi / 2)
y3 = x * x
plt.plot(x, y1, 'b', label='blue')
plt.plot(x, y2, 'r', label='red')
plt.plot(x, y3, 'g', label='green')
my_legend()
plt.show()
以及由此产生的情节:
【讨论】:
非常好。但是,我有一个不完全有效的示例:plt.plot(x2, 3*x2**2, label="3x*x"); plt.plot(x2, 2*x2**2, label="2x*x"); plt.plot(x2, 0.5*x2**2, label="0.5x*x"); plt.plot(x2, -1*x2**2, label="-x*x"); plt.plot(x2, -2.5*x2**2, label="-2.5*x*x"); my_legend();
这会将其中一个标签放在左上角。有想法该怎么解决这个吗?似乎问题可能是线条太靠近了。
抱歉,忘记x2 = np.linspace(0,0.5,100)
。
有没有办法在没有 scipy 的情况下使用它?在我目前的系统上,安装起来很痛苦。
这对我在 Python 3.6.4、Matplotlib 2.1.2 和 Scipy 1.0.0 下不起作用。更新print
命令后,它运行并创建了 4 个图,其中 3 个似乎是像素化的乱码(可能与 32x32 有关),第四个带有奇怪位置的标签。【参考方案2】:
@Jan Kuiken 的回答肯定是经过深思熟虑和彻底的,但有一些警告:
并非在所有情况下都有效 它需要相当多的额外代码 从一个情节到下一个情节可能会有很大差异一个更简单的方法是注释每个绘图的最后一个点。为了强调,也可以圈出这一点。这可以通过额外的一行来完成:
import matplotlib.pyplot as plt
for i, (x, y) in enumerate(samples):
plt.plot(x, y)
plt.text(x[-1], y[-1], f'sample i')
变体是to use 方法matplotlib.axes.Axes.annotate
。
【讨论】:
+1!它看起来是一个不错且简单的解决方案。抱歉懒惰,但这看起来怎么样?文本是在绘图内还是在右侧 y 轴的顶部? @rocarvaj 这取决于其他设置。标签可能会突出到绘图框之外。避免这种行为的两种方法是:1) 使用不同于-1
的索引,2) 设置适当的轴限制以允许标签空间。
如果绘图集中在某个 y 值上,也会变得一团糟——端点变得太近,文本看起来不好看
@LazyCat:确实如此。要解决此问题,可以使注释可拖动。我想有点痛苦,但它会解决问题。
给这家伙一枚勋章。【参考方案3】:
更新: 用户 cphyc 已为此答案中的代码创建了一个 Github 存储库(请参阅 here),并将代码捆绑到一个可以使用 pip install matplotlib-label-lines
安装的包中.
漂亮的图片:
在matplotlib
中,label contour plots 非常容易(自动或通过单击鼠标手动放置标签)。 (还)似乎没有任何等效的能力来以这种方式标记数据系列!不包括我缺少的此功能可能有一些语义原因。
无论如何,我已经编写了以下模块,它允许半自动绘图标签。它只需要numpy
和标准math
库中的几个函数。
说明
labelLines
函数的默认行为是将标签沿x
轴均匀分布(当然,自动放置在正确的y
值处)。如果你愿意,你可以只传递每个标签的 x 坐标数组。您甚至可以调整一个标签的位置(如右下图所示),如果您愿意,可以将其余标签均匀地隔开。
此外,label_lines
函数不考虑在plot
命令中未分配标签的行(或更准确地说,如果标签包含'_line'
)。
传递给labelLines
或labelLine
的关键字参数被传递给text
函数调用(如果调用代码选择不指定,则设置一些关键字参数)。
问题
注释边界框有时会干扰其他曲线。如左上图中的1
和10
注释所示。我什至不确定这是否可以避免。
有时最好指定y
位置。
在正确的位置获取注释仍然是一个迭代过程
仅当x
-axis 值为float
s 时才有效
陷阱
默认情况下,labelLines
函数假定所有数据系列都跨越由轴限制指定的范围。看看漂亮图片左上角的蓝色曲线。如果只有x
范围0.5
-1
的数据可用,那么我们不可能在所需位置放置标签(比0.2
少一点)。请参阅this question 以获取一个特别讨厌的示例。目前,代码不能智能地识别这种情况并重新排列标签,但是有一个合理的解决方法。 labelLines 函数采用xvals
参数;由用户指定的x
-values 列表,而不是宽度上的默认线性分布。因此,用户可以决定将哪些x
-values 用于每个数据系列的标签放置。
另外,我相信这是完成将标签与它们所在的曲线对齐的奖励目标的第一个答案。 :)
label_lines.py:
from math import atan2,degrees
import numpy as np
#Label line with line2D label data
def labelLine(line,x,label=None,align=True,**kwargs):
ax = line.axes
xdata = line.get_xdata()
ydata = line.get_ydata()
if (x < xdata[0]) or (x > xdata[-1]):
print('x label location is outside data range!')
return
#Find corresponding y co-ordinate and angle of the line
ip = 1
for i in range(len(xdata)):
if x < xdata[i]:
ip = i
break
y = ydata[ip-1] + (ydata[ip]-ydata[ip-1])*(x-xdata[ip-1])/(xdata[ip]-xdata[ip-1])
if not label:
label = line.get_label()
if align:
#Compute the slope
dx = xdata[ip] - xdata[ip-1]
dy = ydata[ip] - ydata[ip-1]
ang = degrees(atan2(dy,dx))
#Transform to screen co-ordinates
pt = np.array([x,y]).reshape((1,2))
trans_angle = ax.transData.transform_angles(np.array((ang,)),pt)[0]
else:
trans_angle = 0
#Set a bunch of keyword arguments
if 'color' not in kwargs:
kwargs['color'] = line.get_color()
if ('horizontalalignment' not in kwargs) and ('ha' not in kwargs):
kwargs['ha'] = 'center'
if ('verticalalignment' not in kwargs) and ('va' not in kwargs):
kwargs['va'] = 'center'
if 'backgroundcolor' not in kwargs:
kwargs['backgroundcolor'] = ax.get_facecolor()
if 'clip_on' not in kwargs:
kwargs['clip_on'] = True
if 'zorder' not in kwargs:
kwargs['zorder'] = 2.5
ax.text(x,y,label,rotation=trans_angle,**kwargs)
def labelLines(lines,align=True,xvals=None,**kwargs):
ax = lines[0].axes
labLines = []
labels = []
#Take only the lines which have labels other than the default ones
for line in lines:
label = line.get_label()
if "_line" not in label:
labLines.append(line)
labels.append(label)
if xvals is None:
xmin,xmax = ax.get_xlim()
xvals = np.linspace(xmin,xmax,len(labLines)+2)[1:-1]
for line,x,label in zip(labLines,xvals,labels):
labelLine(line,x,label,align,**kwargs)
测试代码生成上面漂亮的图片:
from matplotlib import pyplot as plt
from scipy.stats import loglaplace,chi2
from labellines import *
X = np.linspace(0,1,500)
A = [1,2,5,10,20]
funcs = [np.arctan,np.sin,loglaplace(4).pdf,chi2(5).pdf]
plt.subplot(221)
for a in A:
plt.plot(X,np.arctan(a*X),label=str(a))
labelLines(plt.gca().get_lines(),zorder=2.5)
plt.subplot(222)
for a in A:
plt.plot(X,np.sin(a*X),label=str(a))
labelLines(plt.gca().get_lines(),align=False,fontsize=14)
plt.subplot(223)
for a in A:
plt.plot(X,loglaplace(4).pdf(a*X),label=str(a))
xvals = [0.8,0.55,0.22,0.104,0.045]
labelLines(plt.gca().get_lines(),align=False,xvals=xvals,color='k')
plt.subplot(224)
for a in A:
plt.plot(X,chi2(5).pdf(a*X),label=str(a))
lines = plt.gca().get_lines()
l1=lines[-1]
labelLine(l1,0.6,label=r'$Re=$'.format(l1.get_label()),ha='left',va='bottom',align = False)
labelLines(lines[:-1],align=False)
plt.show()
【讨论】:
@blujay 很高兴您能够对其进行调整以满足您的需求。我会将该约束添加为问题。 @Liza 阅读我刚刚添加的问题,了解为什么会发生这种情况。对于您的情况(我假设它类似于 this question 中的情况),除非您想手动创建xvals
的列表,否则您可能需要稍微修改 labelLines
代码:更改 @987654359 下的代码@scope 以创建基于其他条件的列表。你可以从xvals = [(np.min(l.get_xdata())+np.max(l.get_xdata()))/2 for l in lines]
开始
@Liza 你的图表让我很感兴趣。问题是您的数据没有均匀地分布在绘图中,并且您有很多曲线几乎彼此重叠。使用我的解决方案,在许多情况下可能很难区分标签。我认为最好的解决方案是在绘图的不同空白部分放置堆叠标签块。请参阅this graph 以获取具有两个堆叠标签块的示例(一个带有 1 个标签的块,另一个带有 4 个标签的块)。实现这将是相当多的跑腿工作,我可能会在未来的某个时候这样做。
注意:自 Matplotlib 2.0 起,.get_axes()
和 .get_axis_bgcolor()
已被弃用。请分别替换为.axes
和.get_facecolor()
。
关于labellines
的另一个很棒的事情是与plt.text
或ax.text
相关的属性适用于它。这意味着您可以在labelLines()
函数中设置fontsize
和bbox
参数。【参考方案4】:
一种更简单的方法,例如 Ioannis Filippidis 所做的:
import matplotlib.pyplot as plt
import numpy as np
# evenly sampled time at 200ms intervals
tMin=-1 ;tMax=10
t = np.arange(tMin, tMax, 0.1)
# red dashes, blue points default
plt.plot(t, 22*t, 'r--', t, t**2, 'b')
factor=3/4 ;offset=20 # text position in view
textPosition=[(tMax+tMin)*factor,22*(tMax+tMin)*factor]
plt.text(textPosition[0],textPosition[1]+offset,'22 t',color='red',fontsize=20)
textPosition=[(tMax+tMin)*factor,((tMax+tMin)*factor)**2+20]
plt.text(textPosition[0],textPosition[1]+offset, 't^2', bbox=dict(facecolor='blue', alpha=0.5),fontsize=20)
plt.show()
code python 3 on sageCell
【讨论】:
【参考方案5】:matplotx(我写的)有line_labels()
,它将标签绘制在线条的右侧。当太多线集中在一个地方时,它也足够聪明以避免重叠。 (有关示例,请参见 stargraph。)它通过解决标签目标位置上的特定非负最小二乘问题来做到这一点。无论如何,在许多开始时没有重叠的情况下,例如下面的示例,这甚至没有必要。
import matplotlib.pyplot as plt
import matplotx
import numpy as np
# create data
rng = np.random.default_rng(0)
offsets = [1.0, 1.50, 1.60]
labels = ["no balancing", "CRV-27", "CRV-27*"]
x0 = np.linspace(0.0, 3.0, 100)
y = [offset * x0 / (x0 + 1) + 0.1 * rng.random(len(x0)) for offset in offsets]
# plot
with plt.style.context(matplotx.styles.dufte):
for yy, label in zip(y, labels):
plt.plot(x0, yy, label=label)
plt.xlabel("distance [m]")
matplotx.ylabel_top("voltage [V]") # move ylabel to the top, rotate
matplotx.line_labels() # line labels to the right
plt.show()
# plt.savefig("out.png", bbox_inches="tight")
【讨论】:
以上是关于Matplotlib 中的内联标签的主要内容,如果未能解决你的问题,请参考以下文章
%matplotlib 内联魔术命令无法从 AWS-EMR Jupyterhub Notebook 中的先前单元格读取变量