首页 > 技术文章 > hbase按照时间戳删除记录

dolittle 2016-08-30 16:49 原文

1、按照时间戳范围查询记录

echo "scan 'event_log', { COLUMN => 'cf:sid', TIMERANGE => [1466265600272, 1471622400481]} " |  hbase shell > ./record.txt

其中这里的cf:sid和key一致, 时间戳范围需要按照时间自己转换:

#current=`date "+%Y-%m-%d %H:%M:%S"`     #获取当前时间,例:2015-03-11 12:33:41
current=“2015-03-11 12:33:41”
timeStamp=`date -d "$current" +%s`      #将current转换为时间戳,精确到秒
currentTimeStamp=$((timeStamp*1000+`date "+%N"`/1000000)) #将current转换为时间戳,精确到毫秒
echo $currentTimeStamp

2、通过shell命令提取record.txt中的sid字段,并拼成hbase删除行命令

cat record.txt|awk '{print "deleteall '\''event_log'\''", ",", "'\''"$1"'\''"}' > del.sh

3、生成hbase删除脚本

在del.sh头尾分别加上:

#!/bin/sh 
exec hbase shell <<EOF 
EOF 

4、执行删除脚本

sh del.sh

推荐阅读