python - 删除 HTML 文件中的换行符
问题描述
我有一个 HTML 文件,我需要删除 body 标记之间的所有换行符
<HTML>
<HEAD>
<TITLE>
</TITLE>
</HEAD>
<BODY>
<P></P>
<P></P>
</BODY>
</HTML>
为拿到它,为实现它
<HTML>
<HEAD>
<TITLE>
</TITLE>
</HEAD>
<BODY><P></P><P></P></BODY>
</HTML>
解决方案
尝试将整个 html 转换为字符串并执行此操作。
bodystring = htmlstring[htmlstring.index('<BODY>'):htmlstring.index('</BODY>')+7]
htmlstring = htmlstring.replace(bodystring, bodystring.replace('\n',''))
推荐阅读
- javascript - React:componentWillRecieveProps 始终比父状态落后一步
- oracle - 如何从pl sql中的变量将元素添加到数组中
- sapui5 - sapui5 TreeTable 更新绑定
- kotlin - Kotlin - 使扩展功能在整个项目中都可以访问
- java - 在Java中将字符串拆分为字符串(包含一些特殊字符)和整数
- docker - Docker - 在构建期间可访问的配置文件
- java - 使用 Jackson 将不同数量的对象反序列化为 Java 中的列表
- alexa - Alexa Skill - 在多轮对话中检索用户的邮件
- php - Codeigniter 3 升级会话锁定导致问题
- elasticsearch - Kubernetes 集群上的 Elasticsearch 集群。进还是出?