首页 > 解决方案 > 如何使用 bs4 去除字符串“2019 年 7 月 27 日的结果”中的“结果”?

问题描述

我需要去掉“结果”文本,以便稍后将其格式化为特定的日期格式。

问题是

当我在没有 .strip 的情况下运行代码时,我得到:

'Results for 27th July 2019'

当我试图剥离文本时,我收到此错误:

TypeError: a bytes-like object is required, not 'str'

蟒蛇3:

date = res.parent.find("span", {"class": "standard-headline"}).text.encode('utf8').strip("Results for ")
TypeError: a bytes-like object is required, not 'str'

有解决方法吗?我一直在研究正则表达式,但在没有分隔符的情况下似乎无法解决我的问题。

此致

标签: pythonpython-3.xweb-scrapingbeautifulsoupstrip

解决方案


错误是因为encode('utf8')return bytes。你需要decode('utf-8')。它返回一个str()你可以剥离的。


推荐阅读