python - 如何在txt文件中重新排序cloumn?
问题描述
我有一个sample.txt
超过 54000 列的大型 txt 文件。它们的顺序如下:
1011001 1 1001164 981328 1 -9 A G G G G G C C A . . . .
1011002 1 1001164 981328 1 -9 A G G G G G A C A . . . .
我需要重新排序列,如下所示:
1 1011001 1001164 981328 1 -9 A G G G G G C C A . . . .
1 1011002 1001164 981328 1 -9 A G G G G G A C A . . . .
即我希望第二列是第一列。
我有什么办法可以用 Python 做到这一点吗?
解决方案
对于 54000 列,我会使用正则表达式,这很快:
import re
with open('sample.txt', 'r') as f_in, open('sample_out.txt', 'w', newline='') as f_out:
for line in f_in.readlines():
g = re.findall(r'[^\s]+', line)
if g:
f_out.write(' '.join([g[1], g[0]] + g[2:]) + '\n')
推荐阅读
- python - 当我添加新命令进行撰写时,Docker Compose with Django 错误
- python - 抑制 numpy 异常消息
- c# - 如何修复:System.ArgumentException:值不能为空或为空。参数名称:partialViewName
- elasticsearch - 布尔过滤器的 Kibana 自定义控件
- android - 由于未解决的依赖关系,Gradle 无法同步
- scala - 如何根据预定义的模式将缺失的字段添加到数据框中?
- php - 如何使用上传文件夹中的php在tinymce中添加和删除图像
- c++ - 使用 std::map const_iterator 更改/更新值
- json - 计算序列化 x 兆字节文件所需内存的公式
- java - Problem drawing some 16bit transparent images with PDPageContentStream.drawImage after updating PDFBox from Version 2.08 to 2.12/2.16