apache-spark - Google Cloud Storage 存储分区副本
问题描述
我在 GCS 中有两个存储桶。每个桶都有一张桌子。我想使用 Java SPARK 将存储桶的内容复制到 Hadoop 中。是否可以通过 GCS Hadoop 连接器?
GCS 定价取决于操作数量及其类别(A 或 B),我如何估算所需的操作数量?例如,复制表格内容的操作数是否等于字段数(列数 * 行数),还是有其他计算方法?
解决方案
推荐阅读
- rest - 使用非拉丁字符的 A1 表示法访问 Google 表格中的值
- visual-studio-code - 一次打开两个侧边栏标签与代码
- asp.net - Facebook Adobe Flash 警告
- sql - 使用书签但从表单而不是 tbl 或 qry 访问 Word
- sql - SQL - 比较 2 个表并显示不存在的数据
- java - java 是否有与 pascal(type record...end) 相同的东西来对数据进行排序?
- c - 代码执行“延迟”从何而来?
- c# - Newtonsoft.Json.JsonSerializationException “无法反序列化当前 JSON 对象”
- angular - 让 npm 缓存适用于 azure devops 中的 .net core angular 项目
- sed - 如何防止在 sed 中被后续的 s///(替换的空模式)替换?