首页 > 解决方案 > 删除 HTML 文件中的换行符

问题描述

我有一个 HTML 文件,我需要删除 body 标记之间的所有换行符

<HTML>
  <HEAD>
    <TITLE>
    </TITLE>
  </HEAD>
<BODY>
  <P></P>
  <P></P>
</BODY>
</HTML>

为拿到它,为实现它

<HTML>
  <HEAD>
    <TITLE>
    </TITLE>
  </HEAD>
<BODY><P></P><P></P></BODY>
</HTML>

标签: python

解决方案


尝试将整个 html 转换为字符串并执行此操作。

bodystring = htmlstring[htmlstring.index('<BODY>'):htmlstring.index('</BODY>')+7]
htmlstring = htmlstring.replace(bodystring, bodystring.replace('\n',''))

推荐阅读