首页 > 解决方案 > 如何检查 csv 生成的数据帧格式是否正确

问题描述

我正在从 S3 存储桶中检索 csv 文件。我需要检查 csv 文件的格式是否正确。例如

id,name,age
011,"person 1",24,"single"
012,"person 2",32,"married"
013,"person 3",28,"single"

如果 csv 文件不包含任何一个列字段(假设 single 不存在),则在执行以下操作时,它会以某种方式给出一个错误的 df。

s3 = boto3.client('s3')
obj = s3.get_object(Bucket= BUCKET, Key= PREFIX)
df = pd.read_csv(obj['Body'])
print(df)

回复

          id  name      age
11  person 1    24   single
12  person 2    32  married
13  person 3    28   single

建议一种方法来检查这一点。

标签: pythonpandasdataframeamazon-s3

解决方案


推荐阅读