python - 熊猫未能分离 csv 文件的列
问题描述
我目前正在尝试使用 panda 的 read_csv 函数从 .csv 文件中提取数据。我的 .csv 文件具有以下格式:
[链接到第一张图片,因为我不允许包含图片][1]
在我看来,只有标题行中的 # 是一种合理的格式,这让我有点麻烦,但不会影响我面临的问题。
当我使用 读取文件时pandas.read_csv(csv_path)
,它会将所有行放入生成的数据帧的第一列,并为所有其他列分配 NAN 值,即使它正确分配了标题行。在我看来,它似乎没有检测到分隔符,因此将整行视为生成以下数据帧的一个大条目:[链接到第二张图像,因为我不允许包含图像][2]
我当前的代码:
import pandas
csv_path = 'sample.csv'
data_frame = pandas.read_csv(csv_path)
解决方案
您也可以尝试在 Pandas.read_csv() 中传递quotechar
和参数:sep
data_frame = pd.read_csv(csv_path, sep=',', quotechar ='"')
运行它,我在调用时得到以下输出data.head()
:
filename file_size file_attributes region_count \
0 video_0029-frame_00000.jpeg 1092976 {} 22
1 video_0029-frame_00000.jpeg 1092976 {} 22
2 video_0029-frame_00000.jpeg 1092976 {} 22
region_id region_shape_attributes \
0 0 {"name":"rect","x":68,"y":283,"width":58,"heig...
1 1 {"name":"rect","x":676,"y":297,"width":52,"hei...
2 2 {"name":"rect","x":708,"y":254,"width"
region_attributes
0 {"class":"Car"}
1 {"class":"Car"}
2 NaN
推荐阅读
- python - DeprecationWarning:调用已弃用的函数 get_sheet_by_name(使用 wb[sheetname])
- swift - Firestore 订购查询不像 Firebase 那样工作?
- python - 匹配多个 CSV 文件中的多个元素
- python-3.x - 在 python 中绘制形状
- python - Python - 如果只有一项,则 For 循环会失败。'TypeError:字符串索引必须是整数'
- java - 使用 Java for 循环制作时间表
- java - Android 应用 Toast 混乱
- reactjs - 使用带有电子的反应路由器
- python - 如何将我的 Python 文件导出到在命令 shell 中运行的 Linux 中的 exe?
- testing - 如何向下滚动到 Katalon 中的元素?