python - 合并 CSV 文件与其中任何一个的架构有关
问题描述
我有多个 csv 文件(大约 100 个),每个文件都有相同的标题。但是,每个文件中的标题顺序是不同的。我应该如何将它们合并到一个 csv 中,其中正确的数据放在右列中
前任:
- csv 有标题:{header1, header2, header3, ... header10}
- csv 有标题:{header2, header5, header10, ... header9}
我想合并它们,使 resultant.csv 看起来像 {header1, header2, header3, ... header10} 但将数据正确映射到每一列。就像 1.csv 中的 header1 数据与 2.csv 中的 header1 数据正确映射一样,依此类推。
解决方案
它不是 Python,但它可以解决您的目标。使用 Miller ( https://github.com/johnkerl/miller ),一个很棒的命令行实用程序,命令是
mlr --csv unsparsify ./*.csv >output.csv
如果您还想重新排序字段
mlr --csv unsparsify ./*.csv then reorder -f header1, header2, header3, ... header10 >output.csv
推荐阅读
- typescript - Laravel groupby 就像 costum group by 管道
- asp.net-mvc - 在 Visual Studio 中使用 Razor 和 MVC“在浏览器中查看”
- dart - ListView.builder 上的交替背景颜色
- android - 使用 rn-fetch-blob 和 POST 下载文件
- gitlab-ci - 无法完成 Gitlab-CI 作业
- c++ - 将类成员函数作为参数从同一类的另一个成员函数传递
- ruby-on-rails - Rails 5 - 空数组未序列化为 NULL?
- mysql - 使用 MySQL JSON 字段加入具有自定义字段的表
- ruby-on-rails - 如何更新 Docusign Envelope 的 Envelope 自定义字段,在 RoR 中使用 rest API
- sql - 如何使用 SQL Plus 从 DB 用户获取日志信息?