首页 > 解决方案 > 如何正确存储 BeautifulSoup 对象以供以后使用

问题描述

最近,我一直在尝试存储一些页面的源代码,以便以后可以从它们那里删除我需要的东西,而不必担心互联网或可能的反抓取措施。我的第一种方法是将bs.prettify每个链接的对象保存到同一 DataFrame 的列中。过了一会儿,我意识到我无法在这些对象上导航解析树(例如,访问bs.h1)。所以,我想知道是否有办法将bs.prettify对象中的字符串转换为可导航的 BeautifulSoup 对象,或者是否有比将源代码存储到 DataFrame 中以供以后使用更好的方法?

标签: pythonpython-3.xweb-scrapingbeautifulsoup

解决方案


推荐阅读