python - 如何使用 BeautifulSoup 在页面上抓取价格数据
问题描述
我是网络抓取的新手,无法弄清楚如何抓取下面网页中的所有价格。我试过的返回空白,任何指针都会很棒!
import bs4
import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen
import pandas as pd
from datetime import datetime
from pytz import timezone
import urllib.request
url = 'https://www.remax.ca/find-real-estate'
page = urlopen(url)
soup = bs4.BeautifulSoup(page,'html.parser')
price = soup.findAll('h3', {'class' : 'price'})
解决方案
首先,如果你使用from bs4 import BeautifulSoup
,也不要使用import bs4
。
二、写soup = BeautifulSoup(page,'html.parser
)
然后使用price = soup.find_all('h3',{'class':'price})
在此之后,您应该在“价格”中包含所有价格,但您仍然需要改进,因为您将从 h3 中复制所有代码。
编辑
import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen
from datetime import datetime
import urllib.request
url = 'https://www.remax.ca/find-real-estate'
page = urlopen(url)
soup = BeautifulSoup(page,'html.parser')
price = soup.find_all('h3', {'class' : 'price'})
for p in price:
print(p.text)
这应该可以完成这项工作。我消除了熊猫,因为我没有安装它。
推荐阅读
- oracle - 如何修复存储过程中 OUT 变量中的字符串缓冲区太小错误
- shell - build-simple-cdd 在 tmp/mirror/README 中校验和无效
- android - 底部的BottomAppBar
- python-3.x - 正确响应来自另一个上下文的等待条件
- vue.js - 在 axios.all() 之后将数据分配给 Vue 实例
- c - 在 GTK3 中,如何让 DrawingArea 响应键盘事件?
- alexa - 如何编写不显示任何卡片的 Alexa 技能
- react-native - 在 AsyncStorage 中设置项目时,未定义不是对象
- java - 使用 Hibernate DAO 保存界面
- c# - 如何从 API 发送 aspx 页面作为响应?