database - Hbase 设计最佳实践
问题描述
我的 hdfs 中有一堆 xml,我需要将它们存储在 hbase 中。xml 属性(主要是 pdf 记录的元数据字段)对于所有人来说都不相同,但会有所不同,而且很少有人会比其他人拥有更多。其中一个属性是来自 pdf 的文本流。
什么是设计表的最佳方式。
据我了解,我需要 3 列 - key、 metadata cf 、 textstream 。
需要建议。谢谢
我的 hdfs 中有一堆 xml,我需要将它们存储在 hbase 中。xml 属性(主要是 pdf 记录的元数据字段)对于所有人来说都不相同,但会有所不同,而且很少有人会比其他人拥有更多。其中一个属性是来自 pdf 的文本流。
什么是设计表的最佳方式。
据我了解,我需要 3 列 - key、 metadata cf 、 textstream 。
需要建议。谢谢
标签: databasehbase