【云盘算】HBase表操纵

打印 上一主题 下一主题

主题 900|帖子 900|积分 2700


媒介

HBase是一个分布式、可扩展的、非关系型的NoSQL数据库。它是创建在Hadoop HDFS上的一个开源的数据库管理体系。HBase的计划目标是提供高可靠性、高可扩展性、高性能、高耽误、高容错性和高可用性。
HBase是一种面向列的数据库,可以处理海量的结构化和半结构化数据。它可以存储大量的数据,并能够快速索引和检索数据,适用于须要高速在线访问大量数据的应用程序。
在HBase中,数据按照表格的形式举行存储,类似于关系型数据库中的表。每个表格都具有一个行键和多个列族。行键是一个唯一标识符,用于在表格中定位一行数据。列族是相关列的集合,每个列族都由一个标识符和多个列构成。
HBase具有众多的特性,包括高可用性、自动分片、支持多版本数据、支持复杂的数据类型、支持MapReduce盘算等。它还具有精良的扩展性,可以根据须要添加新的节点来扩展集群的规模,以满足更高的数据处理需求。
总的来说,HBase是一个高性能、高可扩展性的NoSQL数据库,适用于须要处理大量结构化和半结构化数据的分布式应用程序。它可以通过灵活的数据模子和支持复杂数据类型的功能,资助开发人员快速构建可扩展的应用程序。
一、shell创建

Hbase命令:
  1. 进入shell:
  2. hbase shell
复制代码

  1. 使用help "COMMAND"命令获取特定命令的帮助信息,例如help "get"将显示关于get命令的帮助信息(注意需要使用引号)。
  2. 命令分组:命令被分组管理。使用help "COMMAND_GROUP"命令获取特定命令组的帮助信息,例如help "general"将显示关于general命令组的帮助信息。
  3. 常见的命令组包括:general、ddl、namespace、dml、tools、replication、snapshots、configuration、quotas、security、procedures、visibility labels、rsgroup和storefiletracker。
  4. 你可以执行各种命令来进行表的操作、数据的增删改查、配置管理、权限管理等。
  5. HBase Shell提供了一些常用命令示例:
  6. create:创建表。
  7. disable:禁用表。
  8. enable:启用表。
  9. describe:显示表的结构和属性。
  10. get:获取指定行的数据。
  11. put:插入或更新数据。
  12. scan:扫描表中的数据。
  13. delete:删除指定行或列的数据。
  14. list:列出所有表或命名空间。
  15. alter:修改表的结构或属性。
  16. count:统计表中的行数。
复制代码
二、操纵

创建命名空间类似于Mysql中的数据库:create_namespace
  1. 创建ns1,ns2命名空间
  2. hbase:005:0> create_namespace 'ns1'
  3. Took 0.2768 seconds                                                                                                                                                
  4. hbase:006:0> create_namespace 'ns2'
  5. Took 0.1402 seconds  
复制代码

检察一下创建的命令空间列表:list_namespace
这里的default,hbase是hbase自带的命名空间
  1. hbase:008:0> list_namespace
  2. NAMESPACE                                                                                                                                                           
  3. default                                                                                                                                                            
  4. hbase                                                                                                                                                               
  5. ns1                                                                                                                                                                 
  6. ns2                                                                                                                                                                 
  7. 4 row(s)
  8. Took 0.0132 seconds                                                                                                                                                
  9. #正则方式查看以ns开头命名空间
  10. hbase:009:0> list_namespace "ns*"
  11. NAMESPACE                                                                                                                                                           
  12. ns1                                                                                                                                                                 
  13. ns2                                                                                                                                                                 
  14. 2 row(s)
  15. Took 0.0156 seconds   
复制代码

检察命名空间属性:describe_namespace
因为没有设置这里没有,须要在创建命名空间时设置
  1. hbase:010:0> describe_namespace 'ns1'
  2. DESCRIPTION                                                                                                                                                         
  3. {NAME => 'ns1'}                                                                                                                                                     
  4. Quota is disabled
  5. Took 0.1844 seconds
复制代码

创建一个表t1包含三列f1,f2,f3:create
  1. hbase:011:0> create 't1','f1','f2','f3'
  2. Created table t1
  3. Took 1.2317 seconds                                                
  4. => Hbase::Table - t1
复制代码

检察我们创建的表:list

在我们的web端也是能够看到的:http://HbaseIP:16010/

如今我们做一个实例做一个门生表:


添加数据:put
  1. put 't1', 'row1', 'f1:name', 'tom'
  2. put 't1', 'row1', 'f1:age', 18
  3. put 't1', 'row1', 'f1:height', 172
  4. put 't1', 'row2', 'f1:name', 'jack'
  5. put 't1', 'row2', 'f1:age', 19
  6. put 't1', 'row2', 'f1:height', 180
复制代码

检察插入的数据(用于数据量较少情况):scan ‘t1’
注意:数据量少情况不然卡死
  1. scan 't1'
复制代码

使用get命令获取某单位格数据:get
  1. get 't1','row1','f1:name'
  2. get 't1','row1','f1:age'
  3. get 't1','row1','f1:height'
  4. get 't1','row2','f1:name'
  5. get 't1','row2','f1:age'
  6. get 't1','row2','f1:height'
复制代码


这样创建的表存在一个致命问题:版本只能存在一个,因为我们创建t1时并没有做属性
可以通过:alter ‘t1’,{NAME => ‘f1’,VERSIONS => 3}修改我们的表
我们这直接新建一个

我们重新创建一个可以保存多版本的表:create
创建一个可以保存三个版本的student表
  1. create 'student',{NAME => 'f1',VERSIONS => 3}
复制代码

再次写入数据到student表:
  1. put 'student', 'row1', 'f1:name', 'tom'
  2. put 'student', 'row1', 'f1:age', 18
  3. put 'student', 'row1', 'f1:height', 172
  4. put 'student', 'row2', 'f1:name', 'jack'
  5. put 'student', 'row2', 'f1:age', 19
  6. put 'student', 'row2', 'f1:height', 180
复制代码

修改一个数据再次检察版本:
  1. put 'student', 'row1', 'f1:name', 'julein'
  2. get 'student','row1',{COLUMN => 'f1:name',VERSIONS => 2}
复制代码

删除行数据:deleteall
  1. 删除行数据:deleteall 't1','row1'
复制代码
只剩下row2数据

删除一个单位格数据:delete
  1. delete 't1','row2','f1:name'
复制代码
删除后:

删除表:disable+drop
  1. disable 't1'
  2. drop 't1'
复制代码
t1被删除了

一个简朴的shell操纵完成。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

络腮胡菲菲

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表