首页 > 解决方案 > 使用 Python 按列值将大文本文件拆分为较小的文本文件

问题描述

我有一个非常大的文本文件,内容如下:

12/03/2015,1300 ,       .01,15 ,  10024101,QA                                   
12/03/2015,1715 ,       .01,15 ,  10024101,QA                                   
12/03/2015,1730 ,       .04,15 ,  10024102,QA                                   
12/04/2015,0200 ,       .01,15 ,  10024102,QA                                   
12/04/2015,0215 ,       .05,15 ,  10024102,QA                                   
12/04/2015,0245 ,       .01,15 ,  10024103,QA                                   
12/04/2015,0300 ,       .03,15 ,  10024103,QA                                   
12/04/2015,0315 ,       .02,15 ,  10024104,QA                                   
12/04/2015,0330 ,       .03,15 ,  10024105,QA                                   
12/04/2015,0445 ,       .01,15 ,  10024105,QA   

该文件持续 300K+ 行。是否有一个 python 脚本可以为第 5 列中的每个唯一值分离并创建一个新的文本文件(例如,一个所有行都包含 10024101 的单独文本文件)?新文件将包含与每个唯一值相关的所有行。

我想在 python 中做到这一点是可能的。谢谢!

标签: pythonarrayssorting

解决方案


推荐阅读