首页 > 解决方案 > 将表导入 DataFrame 并将列组设置为列表

问题描述

我有一个表格(制表符分隔的 .txt 文件),格式如下:

我的问题是如何导入和创建最后一列包含值列表的数据框?

-----问题1 ----

标题(第一行)“较短”,仅包含一些列的名称。7 号之后的所有值都没有标题(因为它应该是一个列表)。如果我按原样导入文件,这似乎会混淆导入功能

例如,如果我按如下方式导入

df = pd.read_table( path , sep="\t")

created的DataFrame列数仅与第一行中的元素一样多。此外,分配的数据值不匹配。

---- 问题 2 -----

真正让我困惑的是,如果我在 Excel 中打开 .txt 并将其保存为制表符分隔(不更改任何内容),然后我可以毫无问题地导入它,也可以使用标题:没有标题的列简单地给出一个“未命名的 XYZ”标签。为什么保存在 Excel 中会改变它?使用 Note++ 我只能看到一个区别:原始 .txt 是“Unix (LF)”形式,而保存在 Excel 中的是“Windows (CR LF)”。两者都是 UTF-8,所以我不明白这怎么会是一个问题?!?

尽管如此,我可以从这里操作数据并尝试收集我希望的所有列并将它们制成一个列表。不过,我希望有一种更优雅、更快捷的方式来做到这一点。

这是 .txt 文件的屏幕截图

在此处输入图像描述

谢谢,

标签: pythonpandasnumpy

解决方案


推荐阅读