python - 如何爬取页面的标题?
问题描述
我不知道如何抓取页面标题,下面是我的代码(很简单),但我不知道哪里错了,如果你有任何想法请告诉我,谢谢。
from selenium import webdriver
url="https://sukebei.nyaa.si/?s=seeders&o=desc&p=1"
driver_path = "C:\\webdriver\\chromedriver.exe"
option = webdriver.ChromeOptions()
driver = webdriver.Chrome(driver_path, options=option)
driver.implicitly_wait(10)
driver.get(url)
print(driver.find_element_by_xpath("/html/head/title").text)
解决方案
要抓取页面的标题,您必须为 with torrent-list 诱导WebDriverWait,您可以使用visibility_of_element_located()
以下任一定位器策略:<table>
使用
CSS_SELECTOR
:driver.get('https://sukebei.nyaa.si/?s=seeders&o=desc&p=1') WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.CSS_SELECTOR, "table.torrent-list"))) print(driver.title)
使用
XPATH
:driver.get('https://sukebei.nyaa.si/?s=seeders&o=desc&p=1') WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//table[contains(@class, 'torrent-list')]"))) print(driver.title)
控制台输出:
Browse :: Sukebei
注意:您必须添加以下导入:
from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC
推荐阅读
- android-studio - Android Studio 未使用自定义 VM 选项启动
- sql - 避免用于 spark SQL 查询的笛卡尔连接
- r - 如何纠正数据框中的拼写错误
- python - 如何在 m1 芯片上安装 python 第三方库?
- c# - 从 JSON API 数据中获取字段
- objective-c - 我在 NSUrlConnection sendSynchronousRequest 中收到 EXC_BAD_INSTRUCTION
- sql - 更新多行(最多 100 行)的所有列(最多 30 列)中的值
- rust - 如何指定 Cargo.toml 中我的主目录中的依赖项的路径?
- clojure - :keys 解构的逆过程:从序列构造映射
- python - 如何捆绑数据文件以使用 py2exe 将 python 脚本转换为 exe?