python - 返回知道以前的 美丽的汤 - Python3
问题描述
两天前我开始使用 BeautifulSoup4。我想<dd>
知道前一个标签(<dt>
)。我试图从https://www.animeclick.it/anime/2683/yojouhan-shinwa-taikei<dt>Episodi</dt>
获取剧集数( )等,但由于它们不是静态的(有时我想要的标签可能是'不是每次第三个标签,例如)我想知道如何得到它。
解决方案
在这种情况下,您可以使用 python 的zip()
方法将 zip<dt>
和<dd>
标签一起压缩。如果<dt>
标签将包含Episodi
您知道下一个<dd>
标签包含剧集数的文本:
import requests
from bs4 import BeautifulSoup
r = requests.get('https://www.animeclick.it/anime/2683/yojouhan-shinwa-taikei')
soup = BeautifulSoup(r.text, 'lxml')
for dt, dd in zip(soup.select('#dettagli dl > dt'),
soup.select('#dettagli dl > dd')):
if 'Episodi' in dt.text.strip():
print('Number of episodes:', dd.text.strip())
break
印刷:
Number of episodes: 11
推荐阅读
- python - sqlite3.OperationalError:在“ORDER”附近:语法错误
- vba - 如何从Word中提取嵌入的文件
- java - 关于docker-java的withCmd命令
- reactjs - 使用 useReducer 和其他 reducer 清除表单
- matlab - FFT(快速傅立叶变换)的频率分辨率(或增量)
- python - MaxPooling2D 给出 ValueError
- list - Haskell 编译器在简单列表代码上的错误
- cuda - CUDA cudaMemcpyAsync 使用单个流来托管
- python - 通过python具有多个组的ngroup
- java - 在 Android Studio 中读取二进制数据