python - 将表导入 DataFrame 并将列组设置为列表
问题描述
我有一个表格(制表符分隔的 .txt 文件),格式如下:
- 每一行都是一个条目;
- 第一行是标题
- 前 5 列是简单的数字参数
- 第 7 列之后的所有列都应该是值列表
我的问题是如何导入和创建最后一列包含值列表的数据框?
-----问题1 ----
标题(第一行)“较短”,仅包含一些列的名称。7 号之后的所有值都没有标题(因为它应该是一个列表)。如果我按原样导入文件,这似乎会混淆导入功能
例如,如果我按如下方式导入
df = pd.read_table( path , sep="\t")
created的DataFrame
列数仅与第一行中的元素一样多。此外,分配的数据值不匹配。
---- 问题 2 -----
真正让我困惑的是,如果我在 Excel 中打开 .txt 并将其保存为制表符分隔(不更改任何内容),然后我可以毫无问题地导入它,也可以使用标题:没有标题的列简单地给出一个“未命名的 XYZ”标签。为什么保存在 Excel 中会改变它?使用 Note++ 我只能看到一个区别:原始 .txt 是“Unix (LF)”形式,而保存在 Excel 中的是“Windows (CR LF)”。两者都是 UTF-8,所以我不明白这怎么会是一个问题?!?
尽管如此,我可以从这里操作数据并尝试收集我希望的所有列并将它们制成一个列表。不过,我希望有一种更优雅、更快捷的方式来做到这一点。
这是 .txt 文件的屏幕截图
谢谢,
解决方案
推荐阅读
- netlogo - 如何让代理/乌龟看不到多堵墙?(网标)
- python - Python将变量转换为案例
- python - 将文本文件中的字符串重新格式化为字符串集python
- python - 根据列表大小(即否)生成弹性搜索和查询。查询中的 AND 将基于否。列表中的项目
- django-templates - 从数据库动态更改我在 django 模板中的背景图像
- webpack - 为什么 `import` 语句会在 Webpack 4 中返回不同的实例?
- swift - 如何在单个 Vapor 路线中分支出“未来”序列?
- python - 通过原生 pip 在 macOS 上安装 Tensorflow
- symfony - Symfony DOM Crawler:查询匹配当前项目的标签
- amazon-web-services - 将 Namecheap 区域文件导入 AWS Route53