首页 > 解决方案 > 如何使用 seaborn.relplot 绘制宽格式数据框

问题描述

我正在尝试使用 5 个城市(C1-C5)的虚拟数据绘制以下折线图。

已经导入的数据框

根据我的理解x="Year"y="Number of Employees"hue="City"。我将如何设置它的代码?我尝试过以下方式,但它不起作用!

当前代码

import seaborn as sns
import pandas as pd

Areas = r'C:\Users\Tachi\Desktop\City.xlsx'
df = pd.read_excel(Areas)
df.set_index('City', inplace=True)

sns.relplot(x="Year", y="Number of Employees",hue="City", kind="line", data=df)

样本数据

data = {'City': ['C1', 'C2', 'C3', 'C4', 'C5'], 
        2015: [28564, 2585, 4679, 33227, 2000], 
        2016: [83659, 4429, 35834, 1447, 3454], 
        2017: [0, 453, 40903, 46826, 646], 
        2018: [39470, 8364, 29464, 36443, 8364]}
df = pd.DataFrame(data)
df.set_index('City', inplace=True)

       2015   2016   2017   2018
City                            
C1    28564  83659      0  39470
C2     2585   4429    453   8364
C3     4679  35834  40903  29464
C4    33227   1447  46826  36443
C5     2000   3454    646   8364

标签: pythonpandasmatplotlibseaborn

解决方案


  • 给定 OP 中的测试数据框 ,df绘制数据框的最简单方法是使用pandas.DataFrame.transpose, 并seaborn.relplot使用宽格式绘制。
    • 这会自动将数据框索引用作 x 轴,并将列标题用作hue.
    • 也可以使用sns.lineplot(data=df, marker='o')而不是使用来生成可视化relplot
# transpose the dataframe
df = df.T

# display(df)
City     C1    C2     C3     C4    C5
2015  28564  2585   4679  33227  2000
2016  83659  4429  35834   1447  3454
2017      0   453  40903  46826   646
2018  39470  8364  29464  36443  8364

# plot the dataframe
sns.relplot(data=df, kind='line', marker='o')

在此处输入图像描述

  • 索引值为int dtype,因此 x 轴使用中间数字格式化。
    • str dtype解决此问题的一种方法是在绘图之前将索引转换为 a 。
# set the index of years to a str dtype
df.index = df.index.astype(str)

# plot the dataframe
sns.relplot(data=df, kind='line', marker='o')

在此处输入图像描述


推荐阅读