python - Selenium 和 BeautifulSoap,抓取 JS 生成的部分页面
问题描述
我正在尝试抓取由 JS 生成的页面的一部分,因此源代码中不存在该值。
我正在使用 Selenium(第一次)和 BeautifulSoap(熟悉这个)。
注意:该网址是成人网站!
这是我的代码:
import sys
import urllib2
from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from bs4 import BeautifulSoup
import re
import pandas as pd
import os
url = "https://www.kink.com/shoot/5540"
options = Options()
options.headless = True
driver = webdriver.Firefox(options=options)
driver.implicitly_wait(30)
driver.get(url)
soup = BeautifulSoup(driver.page_source, 'lxml')
print url
print soup
但是我得到的汤不包含 JS 生成的位。
我特别需要仅显示“平均评分:58 评分”的评分部分。
我错过了什么?
解决方案
推荐阅读
- javascript - PDFTRON - 将 FreeHandAnnotation 签名导出为图像
- c++ - 多个函数中的相同变量或对象
- ruby - RUBY:如何从字符串中提取 5 位数字(仅当存在时)
- c++ - 如何在c ++中将二叉搜索树的元素递归存储在向量中
- postgresql - PostgreSQL:将时区添加到列而不转换时间
- css - 在 CSS 中使用这些行的原因是什么
- reactjs - 如何在 React 的 Docker-Compose 中配置 .env 文件?
- javascript - 在角度日历中添加下拉菜单以更改活动状态
- python - Pystray 的 pyautogui 问题
- api - 显示 Stripe 帐单历史记录的最佳做法?