python - 如何在 Python 中从网站中抓取和迭代表格
问题描述
我试图在 Python 中抓取和迭代一个表,然后将其输入到 pandas DataFrame,但我什至无法使用 BeautifulSoup 找到表。这是我通常做的,但源代码中似乎没有表格。我将如何在此页面上拉主表?
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np
import requests
url = 'https://markets.ft.com/data/director-dealings'
site = requests.get(url)
soup = BeautifulSoup(site.content, 'html.parser')
table = soup.find('table')
print(table)
我也不知道如何遍历表格,所以如果你能给我一些指示,我也将不胜感激。
谢谢!
解决方案
获取表格后,将表格的 HTML 标记定义为字典dict
或列表list
,例如“tablex”,然后您可以执行以下操作
for x in tablex:
#x represents each item from the table
print(x)
推荐阅读
- python - 如何使用 selenium 和 python 抓取谷歌地图查询?
- r - 在 R 中有条件地添加列元素
- javascript - 类作为 Async 和 Guy 的参考
- python - 在python中解析Json文件以返回特定值
- python - 使用 SciPy 最小化配送中心总距离的线性规划
- recaptcha - recaptcha v3 验证和分数问题
- ssis - 由于超时,集成服务同步运行包失败
- react-native - 胜利原生饼图动画
- elasticsearch - Kibana 服务器尚未准备好 - [security_exception] 无法验证用户 [elastic]
- flutter - 如何修复错误;方法 '[]' 在 null 上被调用...尝试调用:[]("image")