有時候我們需要統計HBase表的行數,壹般要麽是寫MR程序,要麽是寫SQL。以下就是可用的幾種方式:
HBase Shell 自帶的統計函數命令
hbase> count 't1'
hbase> count 't1',INTERVAL => 100000
hbase> count 't1', CACHE => 1000
hbase> count 't1', INTERVAL => 10, CACHE => 1000
註意 :其中, INTERVAL 為統計的行數間隔,默認為1000, CACHE 為統計的數據緩存。這種方式效率很低,如果表行數很大的話不建議采用這種方式。
hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'tablename'
解釋:這種方式效率比上壹種要高很多,調用的hbase jar中自帶的統計行數的類。
創建 Hive 與 HBase 的關聯表,將 HBase 當作 Hive 的外部表。