python - 使用 Python 从互联网上获取与给定关键字相关的所有 url
问题描述
我正在学习使用 BeautifulSoup 进行抓取。我想做的是从互联网上获取与关键字相关的所有可用网址。
有没有办法做到这一点?
解决方案
您可以使用 requests python 库在 google 上搜索。安装请求pip install requests
您可以使用 google 搜索任何内容并使用 Beautifulsoup 解析结果。以下代码query
在 google 上搜索,然后使用 BeautifulSoup 获取 Google 返回的 URL。
import requests
import urllib
from bs4 import BeautifulSoup
query = 'any search term'
r = requests.get('https://www.google.com/search?q={}'.format(query))
soup = BeautifulSoup(r.text, "html.parser")
links = []
for item in soup.find_all('h3', attrs={'class' : 'r'}):
links.append(item.a['href'])
print(links)
推荐阅读
- python - 此处引发了 TypeError 异常:init() 采用 2 个位置参数,但通过 Selenium 和 Python 使用显式等待给出了 3 个
- reactjs - 如何防止用户在 React-Js 网站截图
- sql - 考虑假期/周末后如何找到去年的同一天?
- c# - 为什么找不到方法 app.UseSwaggerUI(...)?
- ios - XMLHttpRequest 无法加载
由于访问控制检查 [IOS] - qt - QML 使用中间按钮在缩放图表内移动
- python - Python 抓取网页查询并将其放入 .csv
- git - 撤消 git 远程分支删除
- c# - 将数据插入数据库 c# WPF LINQ to SQL
- python - Docker/Rocker - 无法找到包 python3.8