python - 对来自 csv 文件的数据进行处理和分组 - 使用 pandas
问题描述
关于这个主题Convert data from CSV to list of dict,我想问一些关于处理 CSV 文件中包含的数据的其他问题。
- 如何最好地用条件重命名“school_subject”的值: where term = 2 and school_subject == “foreign language” - 我想将“foreign language”重命名为“oth_lang” - 我正在寻找最好的性能方式来做到这一点。我可以创建一个循环并更改值,但这是最简单的方法,但不是最好的,
1 个问题的部分答案。
df.loc[(df['school_subject'].str.contains('foreign language')) & (df['term'] == '2'), 'school_subject'] = 'oth_language'
是否可以将另一组条件放在同一个“loc”中,例如(df['school_subject'].str.contains('Informatics'))
?在当前版本中,我需要创建 2 行具有下一个条件的类似代码。
- @jezrael 帮助我为分组数据创建了正确的“查询”。我们如何:
- 使用链接代码中的代码排除数据?我需要按术语单独的数据吗?
- 如何加入数据 - 例如。第一学期和第二学期的学生 我想加入一年
感谢您的帮助和潜在的代码示例。
解决方案
推荐阅读
- sql - 在 JSONB 中查询对象数组
- c++ - X DevAPI mysqlx::Session() over linux socket 失败并显示“CDK 错误:意外消息”
- laravel - 当我们输入输入元素时的 Livewire 触发方法
- python - 尽管我在 settings.py 文件中提供了 CORS_ORIGIN_ALLOW_ALL = True
- c# - 代码优先 类型 '' 的属性 '' 上的 ForeignKeyAttribute 无效。实体框架
- redux-saga - redux-saga/core/effects 和 redux-saga/effects 之间有区别吗
- python - 如何在类中使用“lambda”作为输入
- java - 异常并发修改异常
- jupyter-notebook - jupyter notebook 在训练模型后崩溃了
- list - LISP 按 2 个参数对列表进行排序