论文部分内容阅读
Hadoop数据库HBase作为基于HDFS的分布式大数据处理系统,其模式设计不能套用或模仿传统关系型数据库方式,而需要与自身特点相匹配,其性能的好坏主要取决于内部表的设计和资源的分配是否合理,如行键、列族的设计以及数据存储等。从行键设计、列族划分、数据量估算与控制、内存需求估算与配置等几个方面研究了HBase数据库模式设计应当遵循的准则,并且在读访问模式和写访问模式下应采用不同的行键设计方式。通过一个电商搜索平台的数据库设计实例说明如何应用这些准则。