首页 > 解决方案 > Python在html中提取表格的标题

问题描述

我有一个很大的网页,上面有一张桌子。我将使用熊猫提取表格。我很难提取标题。

  <div class="col"> <p>State Name: <span class="badge badge-info1">S01-Class 8</span> &nbsp;&nbsp;|&nbsp;&nbsp; PC Name: <span class="badge badge-info1">1-John </span></p> <div class="clearfix">

我怎样才能只提取S01-Class 81-John?我的桌子跟在这堂课后面。

标签: python

解决方案


你可以试试lxml

from lxml import html

tree = html.fromstring(html_text)
eles = tree.xpath('//span[@class="badge badge-info1"]')

for e in eles:
    print(e.text) # S01-Class 8, 1-John

推荐阅读