首页 > 解决方案 > 从每个 List 元素中提取项目并用它填充 Dataframe

问题描述

这会生成一个结果集作为list

#Dates
from bs4 import BeautifulSoup as bs
import pandas as pd
pd.set_option('display.max_colwidth', 500)
import requests
myURL =  "xxxxx"
page = requests.get(myURL)
#print (page)
soup = bs(page.content,"html.parser")
#print(soup.prettify)
rSet = soup.find_all("td", class_="first")
for el in rSet :
 print (el.find("first")) <-- returns "None"
 print (el) <-- returns <td class="first" rowspan="1">00:00 - 01:00</td> (for eaxmple)

使用如下所示的元素:

<td class="first" rowspan="1">00:00 - 01:00</td>
<td class="first" rowspan="1">01:00 - 02:00</td>

我想提取“00:00”和“01:00”(它们是开始时间和结束时间)并将数据框填充到两列中。实现这一目标的最佳方法是什么?

标签: pythonhtmlpandasweb-scrapingbeautifulsoup

解决方案


你有没有尝试过?:

print(el.text)

推荐阅读