首页 > 解决方案 > 如何格式化文本文件以删除空白文件和尾随空格

问题描述

在此处输入图像描述我有 test.txt 看起来像截图

PS:第二行有尾随空格,所以是<空格>第2行

结果我们必须得到:

第 1
行 第 2
行 第 3 行

这是我到目前为止所拥有的

with open("test", 'r+') as fd:
    lines = fd.readlines()
    fd.seek(0)
    fd.writelines(line for line in lines if line.strip())
    fd.truncate() 

但它不处理行以空格开头的情况(在示例中为第 2 行),如何修改我的代码?我想要我们 Python

标签: pythontextnlp

解决方案


我建议格式化输入(文本文件的屏幕截图可以)。假设您的输入看起来像这样,您可以在文本以空格开头时使用 strip 。

#Code
with open(r"demo.txt","r") as f:
    data = f.read()

data_list = [s.strip() for s in data.split("\n") if len(s)>0]
print("\n".join(data_list))

推荐阅读