python - 有没有办法抓取使用 python 加载的数据
问题描述
我正在从网站上抓取数据。我发现表格数据在页面的源代码中显示为加载。我想知道如何使用 python 收集这些数据。它似乎是一个反应 js 网络应用程序。
解决方案
如果您转到网络选项卡,您将在下面找到以 json 格式返回数据的 API。你不需要selenium
或beautifulsoup
。
这是下面的代码。
import requests
res=requests.get("https://api.ycombinator.com/companies/export.json?").json()
for item in res:
try:
print('name:' + item['name'])
except:
continue
try:
print('URL:' + item['url'])
except:
continue
try:
print('batch:' + item['batch'])
except:
continue
try:
print('Description:' + item['description'])
except:
continue
API 快照
回应:
推荐阅读
- google-bigquery - 字符串列表上的 BigQuery 左连接返回 null
- laravel - SQLSTATE [42000]:语法错误或访问冲突:1064 在进行迁移时,您的 SQL 语法有错误
- c++ - 如何在 GDB 中打印与程序流相关的源文件中的所有行号
- android - AlarmManager 未取消
- node.js - UseState() 函数中的错误 - 预期的;
- jmeter - 为什么在查看结果树中,URL 显示为加号,并且在扩展后显示为 'URL'-0 和 'URL'-1
- rust - 迭代器收集“Vec”类型值的问题
` 不能从 `Iterator 构建 - `
- javascript - 为什么在这种情况下我会收到未处理的承诺拒绝?
- java - GCP 下载/获取服务帐号密钥
- php - Laravel 5.4 orWhereBetween 查询无法正常工作不返回数据