首页 > 解决方案 > 如何使用熊猫选择csv文件中的某些列

问题描述

我才刚刚开始我的编码之旅,并且已经在 youtube 上观看了一堆教程,现在我正在尝试使用 jupyter 将 SPSS 中的数据集“导入”到 python 中。

到目前为止,我已经设法将 .sav 转换为 .csv 文件并使用下面的代码读取它。我想在我的数据中选择某些列并将它们存储在一个新的 csv 文件中,以便对它们进行一些分析并尝试构建一个脚本来预测某些事物和特征。问题是我有数百个数据列,只需要 3 或 4 个开始。

我尝试使用 data.drop() 函数,但很快意识到必须有更好的方法来做到这一点?

对于我无法以更好的方式解释这一点,我提前道歉,因为这是我在这里的第一篇文章。

import pandas as pd
df = pd.read_csv('csvfile.csv')
df

标签: pythonpandasmultiple-columnsxlsx

解决方案


您可以按名称选择列。

import pandas as pd 
df = pd.read_csv('csvfile.csv')
final_df = df[['col1','col2','col3']]

或者您可以通过索引选择它们

final_df = df.iloc[:,[0,1,2]]

推荐阅读