python - 如何访问报纸3k中的缓存文章
问题描述
报纸是一个很棒的库,它允许抓取网络数据,但是我对文章缓存有点困惑。它缓存文章以加快操作,但我如何访问这些文章?
我有这样的东西。现在,当我使用同一组文章两次运行此命令时,我None
第二次获得了返回类型。如何访问那些以前缓存的文章进行处理?
newspaper_articles = [Article(url) for url in links]
解决方案
看看这个:https ://github.com/codelucas/newspaper/issues/481似乎 https://github.com/codelucas/newspaper/blob/master/newspaper/utils.py 中的缓存方法 'cache_disk '可能有一个错误。它确实将结果缓存到磁盘(搜索文件夹'.newspaper_scraper'),但之后不会加载它们。
一种解决方法是在构建报纸或使用 Config 类时设置 memoize_articles=False。
newspaper.build(url, memoize_articles=False)
推荐阅读
- java - 如何在 JUnit 中模拟静态方法
- python - 如何让 asksaveasfilename 将文件仅保存为图像并在文件目录中访问?
- php - PHP 电子表格 - 获得下划线效果
- gcc - GCC有:找不到命令[:参数太多
- html - 如何将悬停效果应用于特定按钮
- javascript - Nestjs Redis 微服务 cron 任务与 this.client.send
- firebase - 如何仅将具有查看者权限的新用户添加到 console.firebase 项目中的特定应用程序
- c# - 使用 HTTP.sys 启用 windows 身份验证 #Error: read ECONNRESET ASP.NET Core
- python - python中的空字符串问题
- ruby-on-rails - 如何按另一个表行的值对表的列进行排序?