solr - 如何获取nutch+solr爬取和索引的文档的最后修改时间或创建时间?
问题描述
需要获取nutch+solr爬取和索引的某个内网下文档的最后修改时间或创建时间?我尝试使用 Metadata.LAST_MODIFIED 字段,但它返回 null。我在显示搜索结果时需要它们。Date 正在返回爬行的日期。我在这方面不是很有经验,所以欢迎任何帮助!非常感谢。问候,亚历克斯
解决方案
您测试的 URL 很可能没有返回 Last-Modified 响应标头。大多数网页不返回此信息。由于它在您的 Intranet 中,我建议使用一些工具(例如 Chrome 开发人员工具的网络监视器)对其进行测试,以查看是否实际返回了标头。
推荐阅读
- javascript - Vue.js - 仅打印值而不是 JSON 键值表示法?
- literate-programming - ctwill - cweb 的迷你索引(再次)
- reactjs - 高阶组件和 Material-UI 的 makeStyles 的样式问题
- sql - 如何修复奇怪的 oracle PL/SQL 错误 - “PLS-00049: bad bind variable”
- python - 如何在 tf.function 内部进行“元素明智”比较?
- javascript - 选择不同数据库的设计模式
- regex - NiFi toDate() 函数改变内容
- ibm-watson - IBM Watson Speech To Text API 返回错误 403
- svg - 为什么我的 SVG 看起来不像波纹(关于 feDisplacementMap 过滤器)
- java - 关键经理可以引用 WildFly 中的凭证存储吗?