python - 如何删除额外的 XML 标签?
问题描述
我正在尝试从 XML 文件中提取文本。我得到了大部分内容,但仍然有一些标签。
我使用 BeautifulSoup 删除标签,但我仍然有 span 标签。为什么?
from bs4 import BeautifulSoup
f = open(directory+files[4],"r")
soup = BeautifulSoup(f, features="lxml")
for content in soup.findAll([re.compile('us-gaap:.*'), 'span','table','p']):
print(content.text)
解决方案
推荐阅读
- angular - 在加载时计算输入字段中的标签长度
- javascript - 如何获取产品列表 - 使用正确的代码更新
- integer-division - 整数除法 (%) Python 中是否存在错误?
- php - 如何在php中获取标签为日期的字段
- sql-server - 从 EF Core 2 迁移到 EF Core 3 - 日期时间毫秒精度
- ios - 如何在 Apple 订阅的服务器发送事件中识别客户?
- javascript - ListView 问题“无法解析构造函数 arrayadapter 匿名”
- ubuntu - ubuntu 18.04 上的 Apt 错误:无法握手:拉取函数中的错误
- javascript - 将参数从 .Net 中的 Aspx 传递给 Common.js
- scala - 如何在 Scaladoc 中启用编译器插件?