java - Manifoldcf documentum 爬行缓慢
问题描述
我们正在使用 ManiFoldCF documentum 连接器从 DCTM 存储库中爬取数据,并将爬取的数据写入 MongoDB。使用限制值 500 触发爬网。但是每分钟的爬网速度非常慢,连接器仅获取 170 个文档。安装 MCF 的服务器配置了足够的内存和 8 个逻辑核心 (CPU)。有人可以在这里帮助我们提高爬行速度吗?
解决方案
更好地调整爬行数据库(PostgreSQL)是一个好的开始。
您可以使用一些参考: https ://manifoldcf.apache.org/release/release-2.13/en_US/performance-tuning.html
推荐阅读
- apache - 无法传输工件:未解释 settings.xml 属性
- python - 如何退出在 Flask 应用程序中调用的 python 脚本?
- hadoop - Mapper 和 Reducer 如何在“没有”排序的情况下协同工作?
- jquery - 当 div 有程序员添加的类时如何向上滚动
- google-api - 如何使用 google places(或其他)api 访问“标语”?
- google-apps-script - 无法使用访问令牌访问部署为网络应用程序的 Google Apps 脚本
- php - 从格式化日期转换为变量
- php - Laravel 命令输出的节点版本与命令行不同
- scala - 如何打印 Scala 导入
- javascript - 在 Aurelia.io 应用程序中使用本机模块版本