首页 > 解决方案 > 熊猫在读取csv时将表格修改为列表

问题描述

我在 google colab 上遇到了这个问题:电子表格变成了一个列表read_csv

原始文件是一个 3 列、6219 行(包括列标题)的蛋白质序列表:|未命名:0|aaSequence|medianBrightness| |----------------------|------------------|-------- ----------| |0|MSQEGDYGRWTISSSDESEEEKPKPDK|80000000.0| |1|MSQEGDYGRWTISSSDESEEEKPKPDK|100000000.0|

不确定我的表格是否正在显示,它在预览中看起来像这样(蛋白质截断):

在此处输入图像描述

我运行了这段代码:

df = pd.read_csv('/content/hydrolase_padded.csv')

当我打印df出来时,它会返回一个列表,其中包含我在数据集中从未见过的数字,长度为 6218:

[3500, 3605, 4804, 300, 2832, 6106, 2057, 4958, 3468, 2944, 4197, 3164, 5108, 679, ....]

有谁知道会发生什么?

标签: pythonpandaslistcsvgoogle-colaboratory

解决方案


您的表格由“|”分隔,请尝试添加delimiter="|"参数。要么,您确定您正在加载正确的文件吗?你能提供它来测试它吗?


推荐阅读