indexing - 修改现有的 Solr 7.6.0 / Lucene 索引(将另一个字段“URL”添加到已索引的文件(.pdf、.docx 等))
问题描述
我有一个 Solr 7.6.0 Lucene 索引(很多 .pdf、.docx 和 .xlsx 文件)
索引是在命令窗口中使用 post 命令创建的,指向文件所在的目录共享(映射文件路径)。
我在数据库中还有一个文档的 Web URL,Lucene 目前对此一无所知。我想用这个 URL 数据“丰富”现有索引。
我可以提取当前索引文件的 id,然后使用 Solr Web 界面修改现有索引,注入 URL 吗?
我正在查看以下教程以获取建议: https ://www.tutorialspoint.com/apache_solr/apache_solr_indexing_data.htm
本教程显示了一个添加文档但不修改文档的示例。
解决方案
谢谢@MatsLindh,我设法让它工作:
我使用Solr
GUI 运行JSON
add-field
更新:
{
"add-field" : {
"name":"URL",
"type":"string",
"stored":true
"indexed":true
}
}
然后我插入/设置属性:
{"id":"S:\\Docs\\forIndexing\\indexThisFile_001.pdf",
"URL":{"set":"https//localhost/urlToFiles/indexThisFile_001.pdf:"}
}
推荐阅读
- python - 对谷歌的http请求返回空的python套接字
- nim-lang - Nim:使用只读内存映射文件
- javascript - Remove vertical grid lines gridHelper Three.js
- c# - C# POST request with Json containing an array
- c# - Converting selected words to a specific casing
- python - Pandas group by rows chained across two columns
- version-control - How can I find out which release is associated with a commit in Mercurial?
- amazon-web-services - Can AWS EC2 describe-volumes show ownerarn?
- python - django redirect throw 302 and not redirecting
- mysql - 准备好的语句如何跳过转义字符?