python - 从 URL 解析 XML 并从标签获取信息
问题描述
我尝试使用 python 从 XML 中的标签“CRS”获取信息并收集所有 CRS 标签,或者稍后我将编辑代码以检查特定的 CRS。
网址:https ://wms.geonorge.no/skwms1/wms.adm_enheter_historisk?service=WMS&request=GetCapabilities
我可以获取数据,但我不知道如何从正确的标签中获取信息。
到目前为止,这是我的代码:
import urllib.request, urllib.parse, urllib.error
import xml.etree.ElementTree as ET
url = 'https://wms.geonorge.no/skwms1/wms.adm_enheter_historisk?service=WMS&request=GetCapabilities'
uh = urllib.request.urlopen(url)
data = uh.read()
tree = ET.fromstring(data)
从这里我不确定如何继续使用 tree.find() 或 tree.findall()
谢谢。
解决方案
尝试这个。
from simplified_scrapy import req, SimplifiedDoc
xml = req.get(
'https://wms.geonorge.no/skwms1/wms.adm_enheter_historisk?service=WMS&request=GetCapabilities'
)
doc = SimplifiedDoc(xml)
listCRS = doc.selects('CRS')
print(listCRS)
推荐阅读
- laravel - Laravel 分页显示奇怪的箭头
- python - Pandas:将密集表高效向量化为稀疏形式
- c++ - 非编译时计算函数 constexpr 如何?
- python - 尝试在 Django 项目中显示所选图像的文件名
- python - 带有 Apache 的 django-rest-framework-datatables 显示 414 URI too long 错误
- lua - Tarantool 上热重载 Lua 应用程序的问题
- c# - 只限制玩家输入而不限制外力(Rigidbody 3D)
- vue.js - 访问 vue $ref 返回 undefined
- python - 如何序列化 Tensorflow Serving 请求以减少推理/预测延迟?
- excel-formula - 如何更改 Excel vlookup 中的参考列