python - 文本文件迭代、切片、将较大的行分成大小相等的较小行
问题描述
我是在 Python 中处理文本文件的新手。我有一个巨大的文本文件(200 万行)a.txt,如下所示:
1 0
34715 0 1 8 0 29 5 5 11 4 8 4 150 0 1
0
2200859 1 4 8 1 18 5 5 10 189 8 4 309 0 4
0
749279 1 1 5 4 38 5 5 0 157 8 4 370 0 2106576 1 1 5 4 38 5 5 1 157 6 18 370 0 2140134 1 1 5 4 38 5 5 1 157 6 13 370 0 2140408 0 1 5 4 38 5 5 1 157 6 16 370 0 1
0
1149510 0 5 8 2 19 5 2 1 111 5 4 388 0 2
0
471429 0 1 6 0 29 5 5 11 4 8 18 414 0 2629646 0 1 6 0 29 5 5 11 4 8 4 414 0 1
0
48249 0 1 8 0 30 5 5 1 115 0 6 458 0 3
0
1515836 0 0 8 2 7 5 3 1 163 2 4 522 0 1516727 0 0 8 2 7 5 3 1 163 2 4 522 0 1516995 0 0 8 2 7 5 3 1 163 2 4 522 0
第一行包含 0 1
第 2 行包含 15 个数字,从 34715, 0, ... ,1 开始
第三行只包含一个数字 0
第 4 行再次包含 15 个数字
第 5 行再次只包含一个数字 0
第 6 行包含 57 个数字
等等....我想要一个新的文本文件 b.txt,它看起来像这样:
1 0
34715 0 1 8 0 29 5 5 11 4 8 4 150 0
1 0
2200859 1 4 8 1 18 5 5 10 189 8 4 309 0
4 0
749279 1 1 5 4 38 5 5 0 157 8 4 370 0
2106576 1 1 5 4 38 5 5 1 157 6 18 370 0
2140134 1 1 5 4 38 5 5 1 157 6 13 370 0
2140408 0 1 5 4 38 5 5 1 157 6 16 370 0
1 0
1149510 0 5 8 2 19 5 2 1 111 5 4 388 0
2 0
471429 0 1 6 0 29 5 5 11 4 8 18 414 0
2629646 0 1 6 0 29 5 5 11 4 8 4 414 0
1 0
48249 0 1 8 0 30 5 5 1 115 0 6 458 0
3 0
1515836 0 0 8 2 7 5 3 1 163 2 4 522 0
1516727 0 0 8 2 7 5 3 1 163 2 4 522 0
1516995 0 0 8 2 7 5 3 1 163 2 4 522 0
这有
第一行相同 0 1
第 2 行包含 14 个数字,从 34715, 0, 1, ...., 0 开始
第三行现在包含两个数字 1, 0
第 4 行包含 14 个数字
5th 包含两个数字 4, 0
然后从第 6 行到第 9 行,每个包含 14 个数字
等等
我猜这可以通过两个步骤来实现 -
a.text 的较大行(长度>1)的最后一个数字在 0 之前的下一行中移动,它在 b.text 中看起来像 1 0、4 0 等
在此之后,长度 > 14 的较大行将被分成更多行,行数将等于上述数字,即如果它是 4 0,那么每个长度为 14 的行将有 4 行(行)。
示例 - a.txt 中的第 6 行包含 57 个数字将被转换为 4 行,每行长度为 14,并且最后一个数字已经在下一行中移动。
我尝试了几件事但没有成功
with open('words.txt','r+') as f, open("B.txt", "w") as b:
for line in f:
index = 0
if line.count(' ') > 1:
words = line.split(' ')
temp = words[-1]
使用此代码,我可以获得最后几行较大的行,但是如何将它们添加到 0 之前的下一行中?在这之后如何做第二步?
解决方案
我现在能够解决它。
f=open('sachin.txt','r')
lines=f.readlines()
new_file=open('updated.txt','w')
new_file.write(lines[0])
for i in range(1,len(lines)-1,2):
l1=lines[i]
l2=lines[i+1]
l1.strip("\n")
l2.strip("\n")
l1=l1.split()
l2=l2.split()
l2.append(l1[-1])
l2[0],l2[1]=l2[1],l2[0]
temp=[]
count=0
j=0
while j<(len(l1)):
if count==13:
temp.append(l1[j])
new_temp=" ".join(temp)
new_file.write(new_temp+'\n')
count=0
temp=[]
j+=1
else:
temp.append(l1[j])
j+=1
count+=1
l2=" ".join(l2)
new_file.write(l2+"\n")
new_file.close()
f.close()
推荐阅读
- python - 使用 Python 将 PDF 文件拖放到 word 文档中
- javascript - SVG 动画不填充 Safari 中的容器
- sql-server - Python.NET - 尝试在 SQL Server 中执行存储过程
- .net - 'IServiceCollection' 不包含使用 dot net 5 对 webapi vs 代码项目的 'AddApiVersioning' 的定义
- python - 编写测验时如何添加有限提示?
- php - 如何获取数组名称。Blade.Laravel.PHP
- google-chrome - 谷歌浏览器日志网络通话时间计算
- python - 我想更改我电脑的壁纸,但它变成了黑色
- perl - Plack 如何调试请求?
- javascript - 在地图中调用异步函数