NoSQL数据库
- 关系型数据库:用表格的行-列来保存数据
- 非关系型数据库:只用来存储数据,业务逻辑由应用程序处理
- 常见NoSQL数据库
- Redis:基于内存的NoSQL数据库
- MongoDB:基于文档型(BSON)的NoSQl数据库
- 设计一个数据库保存电影信息
- Oracle:至少三张表,每张1000行,笛卡尔积1000*1000*1000,性能低
- MongoDB:只有1000条记录,查询快(MongoDB 4.0 开始支持事务,支持分布式存储和MapReduce)

HBase
- Hadoop Database
- 以HDFS作为最基本的存储单元(表、列族-->目录,数据-->文件)
- 可快速随机访问海量结构化数据
- 支持数据随机查找,增量数据处理,数据更新
- 适用于大量数据存储,大量数据高并发操作,需要对数据进行随机读写的简单操作
- 内部使用哈希表,通过索引对HDFS文件中的数据进行快速查找(HDFS只能顺序访问)
- Zookeeper实现HA


安装
- 本地:单机,不需要HDFS,数据直接保存在操作系统,只启动HMaster
- 伪分布:单机模拟分布式,ZK+HMaster+RegionServer
- 全分布:
参考
/etc/profile 和 ~/.bash_profile 的区别
http://blog.chinaunix.net/uid-14735472-id-3190130.html
[BD] HBase
原文:https://www.cnblogs.com/cxc1357/p/12783721.html