python - 无法使用 Python 获取网页的完整源代码
问题描述
我正在学习使用 python 抓取网页并使用一些库(Beautifulsoup 和 requests)来获得结果。但是当我试图提取任何网页的数据时,让我们说西尔斯产品网址 - https://www.sears.com/tradesman-talg1670-70-inch-economy-line-aluminum-gull/p-00937054000P?plpSellerId =Sears&prdNo=1&blockNo=1&blockType=G1,所以这里我没有得到完整的页面源代码,我需要获取产品标题、价格、规格等。
我在浏览器控制台检查时找到了一个 url,它包含 json 格式的所有产品详细信息但我仍然无法提取这些 json 数据。这是 json 格式的网址 - https://www.sears.com/content/pdp/config/products/v1/products/04403935070P?site=sears
以下是拉取源代码的代码:
from bs4 import BeautifulSoup
import requests
import re
import json
s = requests.session() #start requests session
page = s.get("https://www.sears.com/tradesman-talg1670-70-inch-economy-line-aluminum-gull/p-00937054000P?plpSellerId=Sears&prdNo=1&blockNo=1&blockType=G1") #get the page
soup = BeautifulSoup(page.content)
#print(soup.encode("utf-8"))
print(soup)
请检查这些代码并建议我获得更好的解决方案,在此先感谢。
解决方案
推荐阅读
- javascript - react-i18next:如何同步浏览器和 Express LanguageDetector?
- html - 即使向右浮动,元素也会向左移动
- android - Android,Animate只是父视图,而不是子视图?
- android - Android 相机 2:ImageReader 的图像没有步幅值
- python - Flask-Sqlalchemy:过滤列包含某个对象的行
- python - 从源代码构建 tensorflow-1.8,没有名为 numpy 的模块
- python - 随机选择 fasta 文件中的行子集
- spring-boot - 在部署 jar 上解析模板或在 Spring Boot 上发生战争时出错
- javascript - 为什么标签没有被添加到我的所有路径中?
- tsx - 构建一个简单的表格组件