python - 如何通过bs4 python中的类似字符串在页面中查找特定链接
问题描述
有没有办法找到包含此示例字符串的链接Top 100 Club Tracks Vol.1 2019.rar
但也许链接包含这种类型的字符串
Top_100_Club_Tracks_Vol.1_2019.rar
(大写和_)
top 100 club tracks vol.1 2019.rar
(小写和空格)
top.100.club.tracks.vol1.2019.rar
(小写和 dote)
我只是尝试这段代码,它不能只找到包含特定字符串的链接:
mystr = Top 100 Club Tracks Vol.1 2019.rar
links = soup_music.find('a', text=Title).findNext("div",{"class":"postContent"}).findAll('a', attrs={'href':re.compile(mystr)})
解决方案
假设它在a
标签中,您可以使用 * contains 运算符并将 Or 字符串列表传递给select
soup.select('[href*="Top 100 Club Tracks Vol.1 2019.rar"],[href*="top 100 club tracks vol.1 2019.rar"]')
继续添加逗号分隔的变体以进行选择,如上所示。
推荐阅读
- javascript - HTML5 Canvas JS 上的碰撞检测
- php - PHP:如何无法读取函数返回值
- ios - SWIFT - UIBarButtonItem 没有调用动作
- android - 如何在kotlin字符串中的特定单词后获取一些字母?
- javascript - 在 NextJS 中使用 useState 对象时,上下文对象为空
- html - 如何在 css/div 容器中调整背景图像的大小?
- javascript - 将结果推送到对象
- android - 由于 Hilt 错误,应用程序未初始化
- python-3.x - 计算均匀性的度量标准,对较低的值进行惩罚
- r - 根据一组字符串条件创建一个新列