首页 > 解决方案 > 从 Apache Nutch 清除数据

问题描述

我刚开始使用 Apache Nutch,我一直在关注一些我已经成功的教程。我现在想删除在玩游戏时收集的所有数据,有没有办法轻松清除从 Nutch 下载的所有数据?

标签: web-crawlernutch

解决方案


纯粹从 Nutch 方面删除所有段(通常在crawldb目录中)应该会让你回到一个干净的状态。如果您一直在将数据索引到 Solr/ES/etc.,您可能还希望(可能)删除所有这些数据。最后一步可能取决于您使用的存储引擎。


推荐阅读