python - 网络抓取:获取图表背后的数据
问题描述
我希望下载网页上滑块图表背后的历史数据。任何python脚本?以及我们如何识别滑块图表/表格背后的数据?这是网站:https ://opstra.definedge.com/ivchart和https://traderslounge.in/ivrank-JETAIRWAYS/
import requests
import pandas as pd
from datetime import date
r = requests.get('https://traderslounge.in/ivrank-JETAIRWAYS/')
da=str(date.today())
Data=pd.DataFrame(r.json()["data"])
解决方案
事实证明,您可以直接从他们的 api 获取这些数据而无需抓取。例如,将其插入您的 URL 栏中,点击输入https://tools.traderslounge.in/optionsdashboardapp/iv/NIFTY 这是一个获取请求。我尝试使用来自不同选项卡的 fetch API,但没有遇到 CORS 问题。当您检查页面网络活动时,您可以看到该页面从何处获取数据。
press f12 on the page to open the dev tools ->
open the network pane ->
refresh the page ->
examine requests named NIFTY ->
copy url form headers pane ->
make your own request from python with the requests package,
that you seem to know already.
注意响应是 json。
我没有对第二个 URL 进行 100% 测试,但我认为你想得到这个(这也没有 CORS 错误) https://traderslounge.in/FNO/ivrank/JETAIRWAYS_IV.json
推荐阅读
- html - 如何在 node express 中包含 css 文件?
- python - 将整列中的时间转换为字符串
- ios - 在复杂的 UI 中使用 SwiftUI 的matchedGeometryEffect
- javascript - 无法正确获取全名,我该如何解决?
- pandas - 使用多列索引堆叠数据框
- javascript - 使用 HTML 和 JS 在地址栏中更新 url 以模式打开显示页面
- tensorflow - 更高的训练集精度,更低的测试集精度
- java - 如何在 AWS Secret Manager 中存储 JKS 证书?
- java - 当 Singleton 不为空时,Singleton 对象中的包装器变量是否可以被垃圾收集?
- charts - 嗨,我看到堆叠折线图中存在问题,如果有负数和正数,它们不会堆叠,是否可以将它们堆叠在一起?