python - 如何从我当前在机器上的浏览器中打开的网页中获取文本/html?
问题描述
我想做这样的事情:
from lxml import html
import requests
page = requests.get('https://a-website.com/')
但是,我不想传递定义的硬编码 url,而是想获取我当前在我的网络浏览器中打开的页面。即page = requests.get(whateverisopeninmychrome)
。对于它的价值,它是我专门寻找的 div 的文本内容。
有什么办法可以做到这一点,甚至有可能吗?我找不到任何其他有关从您机器上当前打开的浏览器中提取 html/内容的信息。
解决方案
不,你不能喜欢这样。一种方法是在您的网站打开的情况下在Google Chrome或Firefox上打开开发者控制台并使用如下 javascript 语法:
对于按className搜索,它将返回一个列表,您将必须获取一个元素:
var html = document.getElementsByClassName('htmlClassHere')[0].innerText
对于按id搜索,它将返回元素,您可以像这样使用它:
var html = document.getElementsById('htmlIdHere').innerText
推荐阅读
- haskell - 在 Aeson 中解析嵌套数组
- list - 保存到文件和从文件中检索的元素
- cmd - 如何在 Windows Server 2019 上打开启动时启动的 cmd 进程?
- xamarin - Xamarin 将两个内容页面合二为一
- flutter - 如何在颤动中制作可滚动的框?
- c# - 如何在 Asp.net MVC 中使用 Jquery 在 Html 输入框上绑定 JSON 数据
- docker - Docker swarm:节点未加入入口网络
- python-3.x - 在 GEKKO 中定义控制变量和目标函数
- firebase - Firebase 实时数据库 - 根据时间间隔加载文档
- clojure - 在clojure中调用conj中的函数