python-3.x - 我可以做些什么来让我的网络爬虫看起来更好吗?
问题描述
我得到了我想要的输出,但它到处都是,我怎样才能让它更干净?
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.titan.fitness/strength/dumbbells/rubber-coated-hex/rubber-hex-dumbbells-with-cast-iron-handle/HEXDBB-GROUP.html')
soup = BeautifulSoup(page.text, 'html.parser')
dumbbells_availability = soup.find(class_="set-items bundle-items container")
item = dumbbells_availability.find_all(class_="row product-detail set-item")
dumbbell1 = item[0]
availability = dumbbell1.find(class_="availability").get_text()
product_name = dumbbell1.find(class_="product-name").get_text()
print(availability)
print(product_name)
结果如下:
解决方案
是的你可以。
只需使用参数设置为的getText()
方法。strip
True
例如:
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.titan.fitness/strength/dumbbells/rubber-coated-hex/rubber-hex-dumbbells-with-cast-iron-handle/HEXDBB-GROUP.html')
soup = BeautifulSoup(page.text, 'html.parser')
dumbbells_availability = soup.find(class_="set-items bundle-items container")
item = dumbbells_availability.find_all(class_="row product-detail set-item")
dumbbell1 = item[0]
availability = dumbbell1.find(class_="availability").getText(strip=True)
product_name = dumbbell1.find(class_="product-name").getText(strip=True)
print(availability)
print(product_name)
输出:
availability:Out of Stock.Notify me when this is in stockSign up
5 LB Rubber Hex Dumbbells
推荐阅读
- ios - Xcode ViewController 中的文本不再着色并且自动完成不再起作用
- c++ - 用于 Visual Studio 或第三方工具的工具,用于检测缺失或不必要的包含
- wordpress - 如何在 wordpress 中被 robots.txt 阻止?
- c# - 将文本文件内容传递给 Console.ReadLine() 而不是键入
- flutter - 更新后无法在 VSCode 中使用 CTRL + F5 运行我的 Flutter 应用程序
- python - 考拉中的样本数据集
- reactjs - 为什么在使用 npx create-react-app my-app 时会出现此错误?
- html - 将 SVG 附加到另一个 SVG 并使其具有响应性
- javascript - 在 react js 中不使用 useState 改变状态的值
- ruby-on-rails - Sidekiq -ra 单个 demo_worker.rb 文件,并且需要该工作人员的积极支持不起作用