python - 如何创建一个 Pandas 函数来读取不同大小的数据帧
问题描述
我正在尝试自动化我的工作的里程旅行,其中涉及读取 .csv 文件并使用 pandas 模块。问题是 .csv 文件的长度不同,因为每个人都有不同的行程。无论 .csv 文件的长度如何,是否可以创建一个函数来准确读取行程次数?.csv 文件在我不想读入 DataFrame 的行程下方有一些额外的行。
a b c
trip1 x x x
trip2 x x x
trip3 x x x
a b c
trip1 x x x
trip2 x x x
trip3 x x x
trip4 x x x
...
trip9 x x x
解决方案
我假设您想从 .csv 文件中读取 n 行,您可以这样做:
pd.read_csv('path_to_file.csv', nrows=10)
这将只读取 csv 中的前 10 行。如果您要读取包含大量数据和大小的文件,这将很有帮助。
如果要跳过最后 n 行,可以执行以下操作:
pd.read_csv('path_to_file.csv', skipfooter=2)
这将始终跳过 csv 的最后 2 行。
文档:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html