来自云龙湖轮廓分明的月亮 发表于 2024-12-15 13:22:04

大数据技术之HBase:恁爹搞的数据库

HBase 和 HDFS、MapReduce 是 Google 三篇大论文对应的开源实现。全称为 Hadoop DataBase ,看到这个名称也就不难明确,HBase 是一款数据库。
提到数据库各人应该就有概念了,所有业务体系都离不开的增删改查利用都需要数据库。
没错,HBase 就是一个支持增删改查利用的“大”数据库,只不外 HBase 是基于 HDFS 实现的。
初学者在打仗HBase的时候,可能会产生一个疑问:“既然有支持SQL的Hive,为什么又有HBase,这两个有什么区别 ”。这里有几个概念补齐后可能会解答你的疑惑:

[*]第一,就如上面所说,两者的提出按照时间线来讲,HBase是前于Hive的。一个是为了办理关系数据库所存在的存储(增删改)和查询的瓶颈,一个是为了简化大数据的盘算难度。
[*]HBase 是基于 HDFS 办理存储和查询大规模数据的分布式数据库。Hive 被称为数据仓库,主要是可以通过 SQL 实现 MapReduce、Spark 等盘算任务,从而达到快速盘算统计的效果。(查询不等于统计)。
所以,这里需要把数据库和数据仓库的概念区分开。
如果对数据仓库没有概念的可以看下oracle对数仓的定义。
如果非要对两者区分的话,可以从增删改查来区分:


[*]HBase 是分布式 NoSQL 数据库, NoSQL 各人应该都不陌生,从Redis、MongoDB等一度要替换 SQL 的 No SQL ,到后来的 Not Only SQL 的各式各样数据库。所以 HBase 本身也是不支持SQL语句的,只提供一些API完成增删改查利用。
[*]Hive 通常应用在对海量数据进行盘算统计,整个过程比力耗时,替换不了数据库。
虽然基于 HDFS 存储,但是HBase却支持数据的实时增删改查。
这里有个概念需要知道:
传统的关系型数据库是单机的,通常一个表的数据在一个文件中,想要做到实时的增删改查是比力容易的。但是 HDFS 中的一个文件是要分布在不同的节点上,实时添加一条数据相对容易,直接在文件末尾追加数据即可。删除、修改这样的更新利用还要去定位到数据,是怎么做到实时的?
带上题目去了解 HBase,欢迎各人一起交流。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 大数据技术之HBase:恁爹搞的数据库