首页 > 解决方案 > 使用第三列值将颜色渐变映射到第 1 列和第 2 列的图;Matplotlib

问题描述

我有一个包含 3 列的数据框。我使用 df['name'] 作为 x 轴,使用 df['value1'] 作为 y 轴。我想使用第 3 列 (df['value2']) 为条形图生成颜色渐变。

使用中的数据

df['name'] 是名称。df['value1'] 是主要测量值。df['value2'] 是 df['value1'] 值的置信度指标。我认为以颜色渐变显示 df['value2'] 会产生强大的视觉效果。

问题

我尝试了无数种方法来使用 matplotlib.colors 模块实现这一目标,但没有产生我想要的结果。这是代码的基础(没有颜色映射到 df['value2'])。

输入

import pandas as pd
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib import cm
from matplotlib.colors import ListedColormap, LinearSegmentedColormap
import matplotlib.colors as colors


df = {'name': ['a','b','c','d'], 'value1': [10.1,13.3,9.5,15.1], 'value2': [1.5,2.0,3.5,1.3]}
df = pd.DataFrame(df)
print(df)


colorbar_1 = LinearSegmentedColormap.from_list('colorbar', ['#990000','#FF6666'], N=100)
df[['name','value1']].plot(kind='bar', colormap=colorbar_1 ,width=0.8, ylim=[9,16], fontsize=5)
plt.xticks(df.index,df['name'].values, rotation=90)
plt.ylim([9,16])
plt.gcf().subplots_adjust(bottom=0.15)
plt.tight_layout()
plt.savefig('test.png',dpi=600)
plt.show()

输出

  name  value1  value2
0    a    10.1     1.5
1    b    13.3     2.0
2    c     9.5     3.5
3    d    15.1     1.3

结果: '测试.png'

所需格式

['所需格式'

我还制作了第 4 列,其中包含生成的十六进制代码,可用于执行手头的任务。我假设有更简单的方法可以合并 df['value2'] 但是生成十六进制代码可能很方便?

输入

import pandas as pd
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib import cm
from matplotlib.colors import ListedColormap, LinearSegmentedColormap
import matplotlib.colors as colors

df = {'name': ['a','b','c','d'], 'value1': [10.1,13.3,9.5,15.1], 'value2': [1.5,2.0,3.5,1.3]}
df = pd.DataFrame(df)
print(df)

norm = mpl.colors.Normalize(vmin=0, vmax=16, clip=True)
mapper = plt.cm.ScalarMappable(norm=norm, cmap=plt.cm.viridis)
df['hex_code'] = df['value2'].apply(lambda x: colors.to_hex(mapper.to_rgba(x)))
print(df)

输出

  name  value1  value2
0    a    10.1     1.5
1    b    13.3     2.0
2    c     9.5     3.5
3    d    15.1     1.3
  name  value1  value2 hex_code
0    a    10.1     1.5  #482374
1    b    13.3     2.0  #472d7b
2    c     9.5     3.5  #3e4989
3    d    15.1     1.3  #481d6f

标签: pythonpandasmatplotlibcolormap

解决方案


问题之一是使用df[['name', 'value1']].plot使熊猫认为您希望数据框中每行有两个条,一个用于“name”,一个用于“value1”。然后 pandas 感到困惑,因为它无法为“名称”绘制条形并跳过这些。然后,对于color=参数,pandas 现在认为颜色列表中的第一个颜色是“name”,第二个是“value1”。

因此,首先,您需要将其称为df['value1'].plot(). 然后,pandas 真的很喜欢使用 x 轴的索引。要将“名称”作为索引,只需将其设为数据框的索引即可。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap, LinearSegmentedColormap, Normalize

df = {'name': ['a','b','c','d'], 'value1': [10.1,13.3,9.5,15.1], 'value2': [1.5,2.0,3.5,1.3]}
df = pd.DataFrame(df)
df.set_index('name', inplace=True)
print(df)

colormap_1 = LinearSegmentedColormap.from_list('colorbar', ['#990000','#FF6666'], N=100)
norm = Normalize(vmin=min(df['value2']), vmax=max(df['value2']))
colors = [colormap_1(norm(v)) for v in df['value2']]
df['value1'].plot(kind='bar', color=colors, width=0.8, ylim=[9,16], fontsize=5)
plt.xticks(rotation=90)
plt.ylim([9,16])

plt.tight_layout()
plt.savefig('test.png',dpi=600)
plt.show()

示例图

PS:要获得与链接图像类似的内容(因此不使用“value2”),您可以尝试:

# same dataframe as before, with 'name' as index
ymin = 9
ymax = 16
barplot = df['value1'].plot(kind='bar', width=0.8, ylim=[ymin, ymax], fontsize=5)
plt.xticks(rotation=90)

gradient = np.linspace(1,0,256).reshape(256,1)
for bar in barplot.containers[0]:
    bar.set_facecolor("none")
    x, y = bar.get_xy()
    w, h = bar.get_width(), bar.get_height()
    plt.imshow(gradient, extent=[x, x + w, y + ymin, y + h], aspect="auto", cmap='bone')
plt.imshow(gradient, extent=[*plt.xlim(), *plt.ylim()] ,aspect="auto", cmap='copper_r', zorder=-1)

plt.tight_layout()
#plt.savefig('test.png',dpi=600)
plt.show()

推荐阅读