python - Python 抓取 | 美汤
问题描述
我想为每个“日期”部分提取,什么是刮掉<p>
.
<div class="kefufloat" id="targetObj">
<img src=" " width="44"></div>
<div class="reblock">
<p><span>运单编号:</span>w44036</p>
<p><span>下单时间:</span>2020-04-21 14:17:56</p>
<p><span>到齐时间:</span>2020-04-10 11:33</p>
<p><span>已称重时间:</span>2020-04-21</p>
</div>
<style>
解决方案
我希望这个片段能帮助你。
from bs4 import BeautifulSoup
html = """<div class="reblock">
<p><span>运单编号:</span>w44036</p>
<p><span>下单时间:</span>2020-04-21 14:17:56</p>
<p><span>到齐时间:</span>2020-04-10 11:33</p>
<p><span>已称重时间:</span>2020-04-21</p>
</div>
<style>"""
soup = BeautifulSoup(html, 'html.parser')
for row in soup.find_all('p'):
print(row.get_text())
输出如下所示:
运单编号:w44036
下单时间:2020-04-21 14:17:56
到齐时间:2020-04-10 11:33
已称重时间:2020-04-21
为了进一步处理,您可以使用split()方法仅获取字符串的 Date 部分。然后您可以使用日期时间库轻松操作日期。特别是strftime() 和 strptime( ) 函数非常有用。
推荐阅读
- android - Android MVVM Dagger 2 - ViewModelFactory 注入
- c - 非常大的结构并出现分段错误
- css - 垂直对齐 ::before 的绝对定位内容以匹配父级的基线
- r - ggplot2:在离散轴上显示每第 n 个值
- arduino - 根据目标定义环境变量(构建或上传)
- date - 我应该如何将 SAS 中的日期从字符串格式化为数字
- python - sqlite3 获取日期和周数 python
- c++ - 使用 MxN 矩阵获得意想不到的结果
- r - 使用 R 中的“多样性”函数从 blau 的索引中获取下标错误
- python - 将字典中的一项与字典中的另一项一一进行比较