amazon-web-services - 使用 accumulo 进行大规模摄取
问题描述
使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取(多 TB 数据摄取)。
我没有看到大量的参考资料,但是使用具有更大实例带宽和内存/cpu 和 HD 空间的更少节点以及预拆分表,或者使用更多具有更小内存/cpu 和更小的 HD 空间的节点是否会更好地提高速度? ?
我最初使用 EBS 卷进行存储,发现使用本地 NVME 存储然后在操作完成后将数据快照到 EBS 更有利,所以我认为我不会遇到任何与 I/O 相关的边界……</p>
解决方案
推荐阅读
- encoding - CBOR 诊断 notation - 表示项目的顺序
- bubble-sort - 冒泡排序输出不正确
- git - 为什么 github 'commmits on date' 和 commit date 不同?
- java - 无法实例化接口 org.springframework.context.aplicationContextInitializer org.springframework.boot.autoconfigure
- javascript - 如何在 React Native 中共享或接收来自第二屏的一些数据
- python - Selenium 没有在 Python 中选择下拉菜单,没有错误
- javascript - React.js 设计模式:保存带有来自 *parent* 节点的多个字段的可编辑文档
- r - 在ggplot中将最小值和最大值添加为胡须
- windows - Windows 窗体应用程序在高 DPI 显示 VB 上显得模糊
- windows - 登录 Windows 帐户时启动 Bash 控制台