首页 > 解决方案 > 对来自 csv 文件的数据进行处理和分组 - 使用 pandas

问题描述

关于这个主题Convert data from CSV to list of dict,我想问一些关于处理 CSV 文件中包含的数据的其他问题。

  1. 如何最好地用条件重命名“school_subject”的值: where term = 2 and school_subject == “foreign language” - 我想将“foreign language”重命名为“oth_lang” - 我正在寻找最好的性能方式来做到这一点。我可以创建一个循环并更改值,但这是最简单的方法,但不是最好的,

1 个问题的部分答案。

df.loc[(df['school_subject'].str.contains('foreign language')) & (df['term'] == '2'), 'school_subject'] = 'oth_language'

是否可以将另一组条件放在同一个“loc”中,例如(df['school_subject'].str.contains('Informatics'))?在当前版本中,我需要创建 2 行具有下一个条件的类似代码。

  1. @jezrael 帮助我为分组数据创建了正确的“查询”。我们如何:
    • 使用链接代码中的代码排除数据?我需要按术语单独的数据吗?
    • 如何加入数据 - 例如。第一学期和第二学期的学生 我想加入一年

感谢您的帮助和潜在的代码示例。

标签: pythonpandascsvpandas-groupby

解决方案


推荐阅读