web-crawler - 从 Apache Nutch 清除数据
问题描述
我刚开始使用 Apache Nutch,我一直在关注一些我已经成功的教程。我现在想删除在玩游戏时收集的所有数据,有没有办法轻松清除从 Nutch 下载的所有数据?
解决方案
纯粹从 Nutch 方面删除所有段(通常在crawldb
目录中)应该会让你回到一个干净的状态。如果您一直在将数据索引到 Solr/ES/etc.,您可能还希望(可能)删除所有这些数据。最后一步可能取决于您使用的存储引擎。
推荐阅读
- android - Recyclerview 项目在通过 ConstraintLayout 和 ConstraintSet 动画更改其大小后开始重叠
- blockchain - 如何防止从仲裁节点部署合约
- java - 当我在早些时候或午夜之后设置闹钟时,Android 闹钟会立即触发
- c# - ASP MVC 包含非强制的外键类
- c# - 从后台启动时将 Android 应用程序移到后面
- jenkins - Jenkins 管道身份验证步骤
- rust - Rust 中是否有 match 的简写形式?
- javascript - 如何在 jquery 中使用 localStorage?
- javascript - 如何动态生成 adwords 商业广告
- user-interface - 如何在 scilab 的 GUI 中绘制你想要的位置