python - 根据 python 中的唯一值将 2 个 csv 文件拆分为较小的文件集
问题描述
抱歉,如果以前有人问过这个问题,我只是找不到一个简单的例子。
我有 2 个大型 CSV 文件,我想根据Location
&LocationType
列中的唯一值对其进行拆分。我想将拆分的 csv 文件存储到名为 item/{item_name}
where的文件夹中的每个值的子目录中,其中item_name
是 Location & Location_type 中的唯一值。
- 位置.csv
- 位置类型.csv
- 每个拆分的 csv 文件应具有与父文件相同的标题行
- 如果子目录已存在,请在写入新文件之前删除这些文件。
最终结果将是一个目录,其中包含两个名为&item
的子目录,其中存储了我们的拆分 CSV 文件。location.csv & location_type.csvfm5
fm15
先感谢您
解决方案
想知道这类项目的工作流程
- 打开文件
- 对所需列上的内容进行排序
- 按所需列分组
- 将每个组写入一个新文件
推荐阅读
- python-3.x - 无法使用 dbc 文件从 MF4 中提取 Flexray 信号
- haproxy - 使用 Docker (Zalando Spilo) 使用 HA PostgreSQL 集群配置 HAProxy 2.2
- list - 有什么办法可以将下面代码中的 toLowerCase 方法更改为 substring 方法?
- excel - 刚接触excel,我想问一下是否可以根据一个输入从表中收集特定数据
- reactjs - 从 BitBucket CI/CD 将 MERN 应用程序部署到 Heroku
- android - java.lang.NoClassDefFoundError:测试模块无法解析其他功能模块的类,单元测试 - Kotlin - Android
- python-3.8 - 我可以同时给 if 和 else 语句另一个 if 和 else 语句吗?
- c++ - 使用相同的泰勒级数评估 log(1+x) 的递归
- docker - 无法让 nginx 在带有 webpack-dev-server 的 docker-compose 上下文中工作
- c++ - 通过 new 运算符初始化结构的问题