javascript - 将 HTML 数据从浏览器导出到 html 文件
问题描述
我有一个 html DOM 数据不断变化的网站。但我想在一定的时间间隔内导出该 html 内容。因为我必须解析那个 html 数据。网站不允许从 api 获取数据。所以我需要可以作为浏览器插件或任何可以在浏览器控制台上运行的 javascript 的解决方案。
解决方案
德文德拉·米什拉
mnit.devd@gmail.com
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
import time
# TIME AFTER WHICH YOU WANTED TO TAKE SNAPSHOT
TIME_AFTER_TAKE_SNAPSHOT = 5
# Specifying incognito mode as you launch your browser[OPTIONAL]
option = webdriver.ChromeOptions()
# Create new Instance of Chrome in incognito mode
browser = webdriver.Chrome(executable_path='/var/lib/chromedriver', chrome_options=option)
# Go to desired website
browser.get("https://google.com/")
for i in range(1000):
# complate page your want to take snapshot
print browser.page_source
# all text content of tag index print below.
val = browser.find_elements_by_class_name("index{}".format(i))
print val[0].text
time.sleep(TIME_AFTER_TAKE_SNAPSHOT)
推荐阅读
- java - 错误查看更改时 JSON 输入意外结束
- sas - SAS ODS 无法在打印机中打印报告
- vb.net - StreamWriter 对象不使用提供的绝对路径
- sas - 如何在if语句中使用变量四分位数和四分位数范围?
- ruby - 语法错误,意外的 '}',期待 =>
- c++ - 如何在 WSL 上修复智能感知“无法找到符号的定义”
- javascript - Vue中的无效字符串长度RangeError仅在某些环境中
- verilog - 使线向量与一根线具有相同的值
- java - 如果将 Tomcat 网站从 http 移动到 https,我在哪里放置重定向
- ruby-on-rails - 设计中的预授权