csv - 使用终端在 CSV 文件中搜索 2 个关键词并创建一个新的 csv 文件
问题描述
我有几个相当大的 CSV 文件(最大 130GB)。由于我不需要 2017 年及以后的数据,因此我想 grep 2018 年以上的数据(数据仅到 2019 年 6 月)并创建一个新的 csv 文件以使其更小。
我试过这个:
grep "2018-" file.csv | grep "2019-" > file_1819.csv
目前它只查找在一行中同时具有两个时间戳的文件(所以基本上评论在 2018-04-01 到期 2019-04-01)。我也需要这个,但我也需要:
是一行只做了 2018-05-01 并且没有过期日期。目前它不包含在新的 csv 文件中。
样本将是:
输入文件
4108,48.74,"2017-09-16 16:15:04"
4249,8.1,"2017-09-16 16:15:04"
4197,3.81,"2017-09-16 17:20:00"
4139,26.81,"2018-09-16 16:15:04"
4218,24.83,"2018-09-16 17:20:00"
4260,79.72,"2018-09-16 16:15:04"
4270,450.12,"2019-09-16 17:20:00"
4242,30.38,"2019-09-16 16:15:04"
4193,1.42,"2019-09-16 16:15:04"
4134,3.77,"2019-09-16 16:15:04
输出文件:
4139,26.81,"2018-09-16 16:15:04"
4218,24.83,"2018-09-16 17:20:00"
4260,79.72,"2018-09-16 16:15:04"
4270,450.12,"2019-09-16 17:20:00"
4242,30.38,"2019-09-16 16:15:04"
4193,1.42,"2019-09-16 16:15:04"
4134,3.77,"2019-09-16 16:15:04
谢谢
解决方案
推荐阅读
- firebase - Flutter firebase_remote_config 是否应该强制更新?
- javascript - 获取承诺的返回值
- apache - 有没有办法用 Prometheus 和 Grafana 监控 Apache 服务器?
- android - Which API is used for end the call or cut the call in android version 23 to 27?
- spring - 在 STS 中创建 Springboot 启动项目时出现以下错误
- python - 如何安全地将用户输入的文件名传递给 ImageMagick?
- reporting-services - SSRS 报告订阅数据过滤器
- python - 了解 protobuff 协议
- r - R如何只留下人口普查地图的外边界?geom_sf,底格里斯河
- ros - rosbag在播放过程中会播放保证数据吗?