python - 使用 Python 读取多个文本文件时删除重复项
问题描述
我在尝试着:
- 读取多个文本文件
- 只保留第一个文件的标题
- 解决格式问题(例如特殊字符)
- 将它们合并到一个文件中
这是代码,我想出了:
import glob
read_files = glob.glob(data_path + "*.txt")
header_saved = False
with open(data_path +"result.txt","w") as outfile:
for f in read_files:
with open(f) as infile:
header = next(infile)
if not header_saved:
outfile.write(header)
header_saved = True
text = infile.read()
replaced_text = re.sub(r"[-()\"#@;:<>{}`+=~|.!?,]", "", text)
outfile.write(replaced_text+"\n")
问题是,由于某种原因,这会产生重复的行。
有人看到有问题的代码部分吗?
我很感激任何帮助。
谢谢!
解决方案
推荐阅读
- node.js - Razorpay Web API 验证步骤
- python - ffmpeg 不和谐机器人 python
- docker - 如何连接到 Bitbucket 管道中的 docker 守护进程
- xml - 连接 WebParts Sharepoint 2016
- python - 基于常数参数的报告生成。面向对象设计
- csv - CSV - 删除包含错误结构数字的行
- tensorflow - 如何在 Tensorflow 数据管道中正确矢量化地图函数
- oauth-2.0 - 将 Okta 配置为 AWS Cognito 的 OIDC IdP
- python - 如何将按钮与滑块的当前索引结合起来
- redux - 如何在使用 Redux Toolkit 的多个切片时监听全局操作并直接更新 rootState?