python - 无法使用请求从下一页获取公司链接
问题描述
我在 python 中创建了一个脚本来从网站上获取不同货运公司的链接。那里有 3501 条记录遍历多个页面。我想获取这些记录的链接。我目前的尝试可以从中获取链接;登陆页面,但我找不到任何方法可以继续到下一页来解析那里的链接,依此类推。
我试过:
import requests
from bs4 import BeautifulSoup
url = 'http://www.truckingcompanies.ca/trucking_new-york/'
def get_links(link):
r = requests.get(link)
soup = BeautifulSoup(r.text,"lxml")
for item in soup.select("[id^='trucking_company_record_'] a[id^='company_name_']"):
print(item.get("href"))
if __name__ == '__main__':
get_links(url)
如何使用请求获取遍历下一页的不同公司的链接?
解决方案
推荐阅读
- c# - C# - 任务始终处于“WaitingForActivation”状态
- bash - 如果在线部分重复,请删除行
- google-cloud-platform - 授权来自 Cloud Function 的 Cloud SQL Admin API 调用
- python - 无法使用moviepy合并多个音频文件
- informatica - 如何使用 informatica cloud 将数据从 REST API 提取到 csv 文件
- gatsby - 将 CSS 类传递到 sanity block-content root
- c# - UWP。如何将数据传递到我的数据库然后填充网格?
- ios - 在 Flutter 上为 ios 深度链接的 XCode 设置而苦苦挣扎
- batch-file - 执行 .bat 文件并将它们移动到不同文件夹的脚本
- c# - 从 UserControl 属性绑定到其视图模型不起作用