python - 如何使用正则表达式函数删除所有 html 标签,包括其中的内容,如类名等?
问题描述
例如,我有一个文本文件
<p class="className" style="background-color:black">Hello World</p>
它应该给我一个输出:
Hello World
解决方案
最好使用XML 解析器:
import xml.etree.ElementTree as ET
s = '<p class="className" style="background-color:black">Hello World</p>'
root = ET.fromstring(s)
output = root.text
推荐阅读
- authentication - 询问登录凭据的共享点 Web 部件
- drop-down-menu - 在悬停时显示一个 Bootstrap 下拉菜单,而不是全部
- node.js - 猫鼬填充,execPopulate 不起作用
- node.js - 如何在激活断点的 Visual Studio Code 中调试 NodeJS start-server-and-test Jest 测试
- firebase - 为什么出现在 Firebase StreamView 中的某些用户的名称旁边显示“0”,而其他用户的名称旁边显示“1”?
- python - 熊猫读取和大型数据库并在之后将其写回
- keycloak - Keycloak 中的授权码授予流程
- c - C中的&p和*p_p有什么区别?
- c++ - 如何将类的属性从 c++ 获取到 QML
- xamarin.android - 在列和另一个集合中搜索