首页 > 解决方案 > 如何创建一个 Pandas 函数来读取不同大小的数据帧

问题描述

我正在尝试自动化我的工作的里程旅行,其中涉及读取 .csv 文件并使用 pandas 模块。问题是 .csv 文件的长度不同,因为每个人都有不同的行程。无论 .csv 文件的长度如何,是否可以创建一个函数来准确读取行程次数?.csv 文件在我不想读入 DataFrame 的行程下方有一些额外的行。

      a  b  c  
trip1 x  x  x  
trip2 x  x  x 
trip3 x  x  x  
      a  b  c  
trip1 x  x  x  
trip2 x  x  x 
trip3 x  x  x
trip4 x  x  x
      ...
trip9 x  x  x 

标签: pythonpandas

解决方案


我假设您想从 .csv 文件中读取 n 行,您可以这样做:

pd.read_csv('path_to_file.csv', nrows=10)

这将只读取 csv 中的前 10 行。如果您要读取包含大量数据和大小的文件,这将很有帮助。

如果要跳过最后 n 行,可以执行以下操作:

pd.read_csv('path_to_file.csv', skipfooter=2)

这将始终跳过 csv 的最后 2 行。

文档:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html


推荐阅读