hbase - 如何在 HBase 部分扫描中进行优化
问题描述
我想对具有 40 亿条记录的 HBase 表执行扫描,每条记录的大小约为 500 字节。我预计每次扫描将返回最多 500K 条记录,大小约为 250MB。
表名:交易 列族:cf cf 中的列限定符:transactionTime、citycode、userid、amount、折扣金额、phoneNumber、email
RowKey 结构: salt_userid_citycode_phoneNumber_transactionTime
我必须扫描给定城市代码的所有交易。
我的STARTROW:salt_citycode
ENDROW : salt_(城市代码+1)
Scan scanRequest = new Scan();
scanRequest.setStartRow(#_445);
scanRequest.setStartRow(#_446);
scanRequest.setCaching(1000);
scanRequest.setFilter(filterListForAmounts);
如果有人可以帮助优化这一点,我将不胜感激。
解决方案
推荐阅读
- android - 参数类型SearchBar不能赋值给flutter中的参数类型Widget
- x86-64 - 这些 Windows 可执行元数据特征是否意味着我认为它们的作用?
- multiprocessing - 读取 hdf5 文件时的多处理问题
- dax - 如何多次重复表中的行
- firebase - 将 nextjs 应用程序部署到 firebase 失败,但在模拟器中工作正常
- api - 谷歌页面速度 API 中的百分位数是什么意思?
- c# - Oracle.ManagedDataAccess.Client.OracleException:“ORA-01843:无效月份”
- javascript - 使用 mocha 进行类继承测试:为一个类而不是另一个类获取“ReferenceError:配置未定义”
- svelte - SvelteKit req.body 未定义
- c# - 无法为 StreamWriter 应用 `using` 的新语法