首页 > 解决方案 > selenium - 如何通过预期文本后面/之后的内容来剪切字符串 - 例如图片中给出的

问题描述

我目前正在尝试对网站进行网络爬网并遇到一个日期范围

例如开催期间:2021年4月1日~2022年3月31日(最终更新日:2021年04月18日)</p>

我如何遍历文本以便提取

“2021年4月1日~2022年3月31日”和“2021年04月18日”

我最初将它放入一个数组并切片并切块,但因为日期期间可能会根据发布日期而改变,所以我不能使用数组

我想知道是否有办法在检测到某些单词或符号时提取日期期间

例如,在“开催期间:”之后开始记录,直到“(”导致 2021 年 4 月 1 日~2022 年 3 月 31 日</p>

例如,在“最终更新日:”之后开始录制,直到到达“)”或行尾才停止

希望这是有道理的

当前正在抓取的网站的 EG 图片附在下面:(链接附在下面)https://stamprally.org/s/25459

在下面尝试但由于某种原因 .split 似乎也不起作用,我也在在线编译器上尝试了相同的代码并且 split 方法不起作用......

postExpireDate = (driver.find_element_by_css_selector( 'time.entry-date updated')).text.split("(").replace(開催期間:)

网站日期

标签: pythonseleniumweb-crawler

解决方案


推荐阅读