首页 > 解决方案 > 熊猫未能分离 csv 文件的列

问题描述

我目前正在尝试使用 panda 的 read_csv 函数从 .csv 文件中提取数据。我的 .csv 文件具有以下格式:

[链接到第一张图片,因为我不允许包含图片][1]

在我看来,只有标题行中的 # 是一种合理的格式,这让我有点麻烦,但不会影响我面临的问题。

当我使用 读取文件时pandas.read_csv(csv_path),它会将所有行放入生成的数据帧的第一列,并为所有其他列分配 NAN 值,即使它正确分配了标题行。在我看来,它似乎没有检测到分隔符,因此将整行视为生成以下数据帧的一个大条目:[链接到第二张图像,因为我不允许包含图像][2]

我当前的代码:

import pandas

csv_path = 'sample.csv'
data_frame = pandas.read_csv(csv_path)

标签: pythonpandascsv

解决方案


您也可以尝试在 Pandas.read_csv() 中传递quotechar和参数:sep

data_frame = pd.read_csv(csv_path, sep=',', quotechar ='"')

运行它,我在调用时得到以下输出data.head()

                      filename  file_size file_attributes  region_count  \
0  video_0029-frame_00000.jpeg    1092976              {}            22   
1  video_0029-frame_00000.jpeg    1092976              {}            22   
2  video_0029-frame_00000.jpeg    1092976              {}            22   

   region_id                            region_shape_attributes  \
0          0  {"name":"rect","x":68,"y":283,"width":58,"heig...   
1          1  {"name":"rect","x":676,"y":297,"width":52,"hei...   
2          2             {"name":"rect","x":708,"y":254,"width"   

  region_attributes  
0   {"class":"Car"}  
1   {"class":"Car"}  
2               NaN  

推荐阅读