首页 > 解决方案 > 如何在 Python 中使用 bs4 从 html 中刮取这个值

问题描述

想从迪士尼商店抓取以下值,但我无法正确获取它们,这是我需要获取的值,您可以在结帐步骤找到它:

<form action="https://www.shopdisney.it/carrello?dwcont=C2055615000" method="post" name="dwfrm_cart_d0pvbnrmmxtk" novalidate="">

我基本上需要在动作中刮取价值,但是以这种方式进行时,我什么也没得到:

soup = BeautifulSoup(checkout.content,'lxml')
    step1 = soup.find('form')['action']
    print(step1)

而不是得到:https://www.shopdisney.it/carrello?dwcont=C2055615000我不断得到https://www.shopdisney.it/search,我怎样才能得到它?如果我试图通过寻找“行动”来刮掉它,我什么也得不到,我该怎么做?

soup = BeautifulSoup(checkout.content,'lxml')
    step1 = soup.find('action')
    print(step1)

HTML 的来源可以在https://www.shopdisney.it/carrello中找到,但在到达之前,您需要将一件商品添加到购物车,然后您会找到一个与我正在寻找的类似的网址刮。

PS:如果您需要更多东西,请不要像以前那样报告我的问题,只需提出要求...

标签: python

解决方案


尝试:

step1 = soup.find('form').get('action')

更多信息: 使用 beautifulsoup 提取属性值


推荐阅读