首页 > 解决方案 > 遍历一列中的唯一字符串,并从与唯一字符串关联的其他 2 列创建字典或数据数组

问题描述

我有许多具有相同数据结构的 csv 文件,如下所示:

是的 X 变体名称
82 12 F^W#Bfr18
76 3 F^W#Bfr18
45 18 *BCDS%q3rn
59 14 *BCDS%q3rn
... ... ...

我正在尝试遍历每个文件并使用列的groupby函数并收集和列variant_name中的相应数据并生成散点图(轴是 x 和 y,如本例中的列名)。xy

group = df.groupby('variant_name')

我以为我可以使用 lambda 函数来保存与特定相关的所有 x 和 y 值,variant_name但我完全卡住了。我希望这是有道理的。如果我需要澄清,请告诉我。谢谢!

标签: pythonpandasmatplotlibdata-wrangling

解决方案


你可以.groupby得到平均值plotscatter

df = df.groupby('variant_name', as_index=False).mean()
df.plot(kind='scatter', x='x', y='y')

在此处输入图像描述

或者,您可以将 a 传递hue给 asns.scatterplot而不传递groupby

import seaborn as sns
sns.scatterplot(data=df, x='x', y='y', hue='variant_name')

在此处输入图像描述


推荐阅读