首页 > 解决方案 > 如何在 Python 3.6 中将 csv 文件转换为数据框

问题描述

我正在努力应对 Kaggle Titanic 挑战。请耐心等待,因为我对数据科学相当陌生。我以前一直在努力使以下语法起作用:我以前的问题(Reading CSV files in Python 3.6, using IntelliJ IDEA) Reading CSV files in Python, using Jupyter Notebook through IntelliJ IDEA

import numpy as np
import pandas as pd
from pandas import Series,Dataframe

titanic_df = pd.read_csv('train.csv')
titanic.head()

但是,使用下面的代码,我可以打开文件并读取它/打印它的内容,但是我需要将数据转换为数据框以便可以使用它。有什么建议么?

file_path = '/Volumes/LACIE SETUP/Data_Science/Data_Analysis_Viz_InPython/Example_Projects/train.csv'

with open(file_path) as train_fp:
    for line in train_fp:
#         print(line)

上面的代码能够打印出数据,但是当我尝试将“file_path”传递给:

titanic_df = pd.read_csv('file_path.csv')

我收到与以前相同的错误。不知道我做错了什么。我知道文件“train.csv”存在于那个位置,因为 1)我把它放在那里 2)当指向它的位置时可以打印它的内容。

那我到底做错了什么???:/

标签: pythoncsv

解决方案


read_csv将创建一个 Pandas DataFrame。所以,只要你的文件路径是正确的,下面的代码应该可以工作。另外,请确保使用file_path变量而不是字符串“file_path.csv”

import pandas as pd

file_path = '/Volumes/LACIE SETUP/Data_Science/Data_Analysis_Viz_InPython/Example_Projects/train.csv'

titanic_df = pd.read_csv(file_path)
titanic_df.head()

推荐阅读