python - 如何使用熊猫选择csv文件中的某些列
问题描述
我才刚刚开始我的编码之旅,并且已经在 youtube 上观看了一堆教程,现在我正在尝试使用 jupyter 将 SPSS 中的数据集“导入”到 python 中。
到目前为止,我已经设法将 .sav 转换为 .csv 文件并使用下面的代码读取它。我想在我的数据中选择某些列并将它们存储在一个新的 csv 文件中,以便对它们进行一些分析并尝试构建一个脚本来预测某些事物和特征。问题是我有数百个数据列,只需要 3 或 4 个开始。
我尝试使用 data.drop() 函数,但很快意识到必须有更好的方法来做到这一点?
对于我无法以更好的方式解释这一点,我提前道歉,因为这是我在这里的第一篇文章。
import pandas as pd
df = pd.read_csv('csvfile.csv')
df
解决方案
您可以按名称选择列。
import pandas as pd
df = pd.read_csv('csvfile.csv')
final_df = df[['col1','col2','col3']]
或者您可以通过索引选择它们
final_df = df.iloc[:,[0,1,2]]
推荐阅读
- angular - 使用 Angular cli 构建应用程序
- postgresql - 如何在 Postgresql 中显示特定状态下客户和产品的每个组合的最大数量?
- r - 选择具有特定条件的行并应用函数
- python - 随着字典长度/顺序的变化,如何从字典列表中提取特定值
- firebase - Firebase 自定义声明未在规则中更新
- embedded - 抢占式 RTOS 内核中的 WDT
- javascript - 尝试将 POST 请求从前端正确传递到 java servlet 后端
- php - 如何使用 Google Language API 在使用 PHP 语言的网站中添加多语言?
- typescript - 如何声明导入另一个类型的 TypeScript 模块
- javascript - 如何找到 typedArray 的类型?