首页 > 解决方案 > 通过 Pandas 从 CSV 文件中读取最后一行

问题描述

我正在尝试从存储在 GCS 中的 CSV 文件中读取最后一行。

我的代码 -

import pandas as pd
import gcsfs 
fs = gcsfs.GCSFileSystem(project='my-project') 
with fs.open('my-bucket/my_file.csv') as f:  
 file = pd.read_csv(f)  
 print(file.tail(1))

输出:

John       Doe 120 jefferson st. Riverside   NJ   08075
5   business-name Internal                 6       NaN  NaN     NaN

公共示例 CSV 文件 -

John,Doe,120 jefferson st.,Riverside, NJ, 08075
Jack,McGinnis,220 hobo Av.,Phila, PA,09119
"John ""Da Man""",Repici,120 Jefferson St.,Riverside, NJ,08075
Stephen,Tyler,"7452 Terrace ""At the Plaza"" road",SomeTown,SD, 91234
,Blankman,,SomeTown, SD, 00298
"Joan ""the bone"", Anne",Jet,"9th, at Terrace plc",Desert City,CO,00123
business-name,Internal,6

我只想得到最后一行 - 业务名称,内部,6 但这不是我得到的。我不确定为什么 tail(1) 不起作用。

谁能帮帮我吗?

标签: python

解决方案


下面的熊猫代码应该可以解决您的问题。您可以使用 pandasread_scv函数来获取 csv 数据,而不是读取文件。

import pandas as pd
df = pd.read_csv('my-bucket/my_file.csv')
df.tail(1)

推荐阅读