marklogic - 通过 MLCP 摄取存储在 Archive 中的 XML
问题描述
使用以下命令通过 MLCP 导入存储在存档中的 XML 文档时:
mlcp import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_file_type archive -username admin -password admin -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/"
我收到以下错误:
18/08/10 11:09:41 INFO contentpump.LocalJobRunner: Content type: XML
18/08/10 11:09:41 INFO contentpump.FileAndDirectoryInputFormat: Total input paths to process : 2
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Error getting input splits:
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Not type information in Archive name
我正在使用 MarkLogic 8.0-7.1。
有谁知道这个错误?
解决方案
输入文件类型archive
是指使用 MLCP 存档导出 ( -output_type archive
) 创建的 MLCP 存档 zip 文件。
我想你打算-input_compressed
改用。就像是:
mlcp.bat import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_compressed -username xxx -password yyy -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/"
为了有选择地导入特定文件,我建议使用转换,$content
如果应该摄取文件,或者()
如果跳过(空序列),则通过转换。
可以在此处找到有关 MLCP 转换的文档:
http://docs.marklogic.com/guide/mlcp/import#id_82518
!
推荐阅读
- git - 如何更改 Azure DevOps 主机 Git Repo 的默认分支名称
- swift - SwiftUI 在按钮内获取 SF 图像
- python - ZeroDivisionError 即使在使用 try 和 except 之后
- error-handling - 如果没有结果,则从 for 循环返回结果或不返回任何内容
- python-3.x - 有没有一种方法可以遍历字典并在 while 循环中使用它?
- hashicorp-vault - 当以“没有已知的秘密 ID”开头时,hashicorp 保险库代理模板失败
- python - 在全球范围内设置 numpy.random.seed
- r - 用R提取字符串中间的字符串
- javascript - How to center a Scroll element with Overflow
- html - 301 将用户重定向到 https 协议,但前提是用户使用 http 协议