python - 如何在 matplotlib 图中添加轴偏移?
问题描述
我在同一张图上在 seaborn 中绘制了几个点图。x 轴是有序的,而不是数字的;每个点图的序数值相同。我想将每个图稍微移到一边,pointplot(dodge=...) 参数在单个图中的多行内执行的方式,但在这种情况下,对于绘制在彼此之上的多个不同的图。我怎样才能做到这一点?
理想情况下,我想要一种适用于任何 matplotlib 图的技术,而不仅仅是 seaborn。向数据添加偏移量并不容易,因为数据不是数字的。
显示图重叠并使其难以阅读的示例(每个图中的闪避都可以)
import pandas as pd
import seaborn as sns
df1 = pd.DataFrame({'x':list('ffffssss'), 'y':[1,2,3,4,5,6,7,8], 'h':list('abababab')})
df2 = df1.copy()
df2['y'] = df2['y']+0.5
sns.pointplot(data=df1, x='x', y='y', hue='h', ci='sd', errwidth=2, capsize=0.05, dodge=0.1, markers='<')
sns.pointplot(data=df2, x='x', y='y', hue='h', ci='sd', errwidth=2, capsize=0.05, dodge=0.1, markers='>')
我可以使用 seaborn 以外的东西,但是自动置信度/误差条非常方便,所以我更愿意在这里坚持使用 seaborn。
解决方案
首先针对最一般的情况回答这个问题。可以通过将图中的艺术家移动一些量来实现闪避。将点用作该班次的单位可能很有用。例如,您可能希望将绘图上的标记移动 5 个点。
这种转变可以通过向艺术家的数据转换添加翻译来实现。在这里我提出一个ScaledTranslation
.
现在为了保持这一点最一般,可以编写一个函数,该函数将绘图方法、轴和数据作为输入,此外还可以应用一些闪避,例如
draw_dodge(ax.errorbar, X, y, yerr =y/4., ax=ax, dodge=d, marker="d" )
完整的功能代码:
import matplotlib.pyplot as plt
from matplotlib import transforms
import numpy as np
import pandas as pd
def draw_dodge(*args, **kwargs):
func = args[0]
dodge = kwargs.pop("dodge", 0)
ax = kwargs.pop("ax", plt.gca())
trans = ax.transData + transforms.ScaledTranslation(dodge/72., 0,
ax.figure.dpi_scale_trans)
artist = func(*args[1:], **kwargs)
def iterate(artist):
if hasattr(artist, '__iter__'):
for obj in artist:
iterate(obj)
else:
artist.set_transform(trans)
iterate(artist)
return artist
X = ["a", "b"]
Y = np.array([[1,2],[2,2],[3,2],[1,4]])
Dodge = np.arange(len(Y),dtype=float)*10
Dodge -= Dodge.mean()
fig, ax = plt.subplots()
for y,d in zip(Y,Dodge):
draw_dodge(ax.errorbar, X, y, yerr =y/4., ax=ax, dodge=d, marker="d" )
ax.margins(x=0.4)
plt.show()
您可以将其与ax.plot
等一起使用ax.scatter
。但不能与任何 seaborn 函数一起使用,因为它们不会返回任何有用的艺术家来使用。
现在对于有问题的情况,剩下的问题是以有用的格式获取数据。一种选择如下。
df1 = pd.DataFrame({'x':list('ffffssss'),
'y':[1,2,3,4,5,6,7,8],
'h':list('abababab')})
df2 = df1.copy()
df2['y'] = df2['y']+0.5
N = len(np.unique(df1["x"].values))*len([df1,df2])
Dodge = np.linspace(-N,N,N)/N*10
fig, ax = plt.subplots()
k = 0
for df in [df1,df2]:
for (n, grp) in df.groupby("h"):
x = grp.groupby("x").mean()
std = grp.groupby("x").std()
draw_dodge(ax.errorbar, x.index, x.values,
yerr =std.values.flatten(), ax=ax,
dodge=Dodge[k], marker="o", label=n)
k+=1
ax.legend()
ax.margins(x=0.4)
plt.show()