首页 > 解决方案 > Beautiful Soup 中的表结构(新)

问题描述

当我检查网页时,我想要提取的信息包含在:

<table class="Buy-Table" id="Book">
<tbody>
    <tr class="position" data-pos="1">
        <td class="time">16:50</td>
        <td class="Price">0.26</td>

我想拉出价格。但是价格是一个多次使用的类,位置也是如此。

任何帮助将不胜感激。

我认为这将find_parent在 Price 上使用。但它不起作用。

标签: python

解决方案


您可以使用 CSS 选择器table#Book td.Price(使用with下<td>的类Price进行选择):<table>id="Book"

data = '''<table class="Buy-Table" id="Book">
<tbody>
    <tr class="position" data-pos="1">
        <td class="time">16:50</td>
        <td class="Price">0.26</td>'''


from bs4 import BeautifulSoup

soup = BeautifulSoup(data, 'html.parser')

price = soup.select_one('table#Book td.Price').text

print(price)

印刷:

0.26

方法select_one()只选择一项。如果要选择多个项目,请使用select()方法。

进一步阅读:

CSS 选择器参考


推荐阅读