python - 删除 Python 输出中的换行符
问题描述
我正在清理一个文本文件并编写了以下代码来删除不需要的字符。我的问题是最终输出显示为单词列表,当我希望将其组合为文本时。我认为问题出在这一行中,该行旨在通过将新行替换为“(\ n)”来删除换行符。
Step4 = re.sub(r"(\n)"," ",Step3)
print(Step4)
完整代码如下:
f=open("/Applications/Python 3.9/cleaning text.txt",encoding='Latin-1')
raw=f.read()
#print(raw)
import re
import nltk
from nltk import word_tokenize
Data = re.split(r" ",raw)
for D in Data:
# print(str(raw)+'\n')
Step1 = re.sub(r"(\\.*)","",D)
# print(Step1)
Step2 = re.sub(r"(M)","hl",Step1)
# print(Step2)
Step3 = re.sub(r"(\[aa\])","[a::]",Step2)
# print(Step3)
Step4 = re.sub(r"(\n)"," ",Step3)
print(Step4)
解决方案
我认为您不需要将整个文本逐字拆分为列表。您可以将原始数据作为re.sub()函数的输入。如果要从原始数据的开头或结尾删除空格字符,可以使用strip()函数。
f=open("/Applications/Python 3.9/cleaning text.txt",encoding='Latin-1')
raw=f.read()
import re
raw = str(raw).strip()
Step1 = re.sub(r"(\\.*)","",raw)
Step2 = re.sub(r"(M)","hl",Step1)
Step3 = re.sub(r"(\[aa\])","[a::]",Step2)
Step4 = re.sub(r"(\n)"," ",Step3)
推荐阅读
- javascript - 反应错误:严格模式下不允许使用八进制文字
- firebase - 如何正确地将 google-services.json 添加到 Xamarin 表单 android?
- html - 为什么从 ReactJS 切换到 NextJS 后我有两个垂直滚动条?
- rust - 如何手动向 lld 提供 core::panicking::panic*?
- javascript - ESLint 为具有单个声明的全局变量抛出 `no-redeclare` 错误
- html - 带有固定元素的响应列
- visual-studio-code - 替换而不找到下一个匹配项
- jquery - 键上的 jquery 脚本允许 2 位小数,不是负数,最大 100
- firebase - 如何为 Firebase Firestore rest api 调用提供身份验证数据
- javascript - 如何修复必须使用导入来加载 ES 模块 discord.js