python - 如何使用 BS4 和 LXML 获取 xpath
问题描述
我尝试txt
从网站获取,我BS4
用来解析网站
<ul class="sub-data-list">
<li>Monday : 11:00 - 18:00</li>
</ul>
这是来自网站的来源(来自检查元素)
这是我尝试获取数据的代码
from bs4 import BeautifulSoup
from lxml import etree
from lxml import html
import requests
URL = "https://example.com"
webpage = requests.get(URL)
soup = BeautifulSoup(webpage.content, "html.parser")
dom = etree.HTML(str(soup))
print("საათი: :", dom.xpath('//*[@class="data-list"]')[0].text)
我也尝试[0].text , [1].text
等,还有其他方法吗?
解决方案
如果您正在尝试获取<li>
元素的内容,请尝试以下操作:
from bs4 import BeautifulSoup
html = """<ul class="sub-data-list">
<li>Monday : 11:00 - 18:00</li>
</ul>"""
soup = BeautifulSoup(html, "html.parser")
ul = soup.find('ul', class_='sub-data-list')
print(ul.li.text)
推荐阅读
- testing - 无法激活最新的 Katalon studio 测试工具
- javascript - 在 Extjs 表单提交中 fileupload true 时编码表单数据
- events - 如何为 Ext.Msg 定义监听器?
- python - 如何修复“Pymysql 数据库未更新但您没有收到任何错误”
- javascript - 如何使用数据表添加自定义标题并制作全宽 PDF
- javascript - 输入值jQuery检查长度和值?
- sql-server - 有没有办法在 Azure SQL 中使用 CLR 程序集?
- powershell - 计算自上次使用 PowerShell 安装程序以来的天数
- bash - make 函数如何在 makefile 中运行的 Bash 循环中工作
- algorithm - 黑白滑块滤镜控制